大会名称
2010年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2010
発行日
2010/8/20
セッション番号
5E
セッション名
医用画像・バイオ情報学
講演日
2010/09/08
講演場所(会議室等)
E会場(総合学習プラザ1F 第9講義室)
講演番号
G-021
タイトル
モチーフ抽出を利用したエピジェネティクス関連領域の予測
著者名
東原 正智
キーワード
エピジェネティクス, mRMR, モチーフ抽出, Confidence Weighted Learning, 判別分析, 属性選択
抄録
エピジェネティクスとは、DAN-RNA-タンパク質という遺伝子の発現以外に化学的な作用で遺伝子の発現を制御する機構である。本稿では、ゲノムワイドに実験された酵母菌の実験データ(遺伝子配列)に対して機械学習を用いて判別分析を行った。その際、特徴ベクトルとして従来頻度を用いて行っていたが、配列データに対してモチーフ抽出を行い位置に着目した特徴ベクトルを作成し計算機実験を行った。評価指標としてGini indexと属性間の相互情報量を計算する指標であるmRMR(Minimum Redundancy and Maximum Relevance)を用いて属性選択を行い、SVMとオンライン学習器であるConfidence Weighted learningという2つの学習器を用いて頻度データと位置データでの比較を行った。
本文pdf
PDF download (247.4KB)