講演名 2006-06-15
Multiple-Instance学習によるタンパク質相互作用の属性予測(機械学習によるバイオデータマインニング)
山川 宏, 仲尾 由雄, 丸橋 弘治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々は,未知のタンパク質ペアに対して特定の相互作用属性の有無を予測する機械学習技術を開発し,この技術を利用して,タンパク質毎の属性(Gene Ontology)からリン酸化属性の有無を判別した.複数のサブユニットを含むタンパク質間の相互作用が,組合せとして含まれるサブユニットペアの何れかに還元できると仮定することで,判別課題をMultiple-Instance学習(MIL)として定式化した.そして,よく知られているDiverse Density法を改良し,特徴空間内で負例バッグに比べて正例バッグの寄与が大きな部分領域を概念として獲得する多数決型のMIL手法を提案した.KEGGデー夕べースから相互作用属性を学習データとして計算機実験を行なうと,86.1%の正解率が得られた.さらに偽陽性の発生原因を解析し,これがMIL特有の陽性判定へのバイアスに起因することを示した.
抄録(英) We propose a method for predicting types of protein-protein interactions using a multiple-instance learning (MIL) model. By assuming cause of each interaction between proteins containing two or more subunit is results from local subunit pairs, we formulates this problem as MIL. In this problem, influences from instances in negative bag to target concepts are too strong by using well-known Maron's method. We propose a new MIL method based on decision by majority and apply to the KEGG interaction data. In an experiment using the KEGG pathways and the Gene Ontology, the method successfully predicted an interaction type (phosphorylation) at the accuracy rate of 86.1%. We find that cause of false positive is caused by positive bias peculiar to MIL method by analyzing prediction results.
キーワード(和) タンパク質相互作用 / Multiple-Instance学習 / Diverse Density / リン酸化 / サブユニット
キーワード(英) protein-protein interaction / multiple-instance learning / diverse density / phosphorylation / subunit
資料番号 NC2006-15
発行日

研究会情報
研究会 NC
開催期間 2006/6/8(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) Multiple-Instance学習によるタンパク質相互作用の属性予測(機械学習によるバイオデータマインニング)
サブタイトル(和)
タイトル(英) Predicting type of protein-protein interaction as a multiple-instance learning problem
サブタイトル(和)
キーワード(1)(和/英) タンパク質相互作用 / protein-protein interaction
キーワード(2)(和/英) Multiple-Instance学習 / multiple-instance learning
キーワード(3)(和/英) Diverse Density / diverse density
キーワード(4)(和/英) リン酸化 / phosphorylation
キーワード(5)(和/英) サブユニット / subunit
第 1 著者 氏名(和/英) 山川 宏 / Hiroshi YAMAKAWA
第 1 著者 所属(和/英) (株)富士通研究所ITコア研究所
FUJITSU LABORATORIES LTD.
第 2 著者 氏名(和/英) 仲尾 由雄 / Yoshio NAKAO
第 2 著者 所属(和/英) (株)富士通研究所ITコア研究所
FUJITSU LABORATORIES LTD.
第 3 著者 氏名(和/英) 丸橋 弘治 / Koji MARUHASHI
第 3 著者 所属(和/英) (株)富士通研究所ITコア研究所
FUJITSU LABORATORIES LTD.
発表年月日 2006-06-15
資料番号 NC2006-15
巻番号(vol) vol.106
号番号(no) 101
ページ範囲 pp.-
ページ数 6
発行日