講演名 2015-06-23
訪問・評点データ統合解析のための非負値行列分解手法の検討
幸島 匡宏(NTT), 松林 達史(NTT), 澤田 宏(NTT),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年様々な分野でデータ解析を用いた取り組みが増加しており, 企業がスマートフォンのアプリやウェブサイトで収集したユーザの閲覧履歴やチェックイン履歴, 評点などのフィードバック履歴を統合的に解析する手法が必要とされている. これまで複数の異なるデータを同時に分析する手法として, 行列表現された複数のデータを非負値制約のもと同時に因子分解する手法等が提案されているものの, この既存手法においては, 訪問数を表す行列と評点を表す行列の組のように解析対象となる各行列がそれぞれ異なる性質を持つ状況を想定してはいなかった. そこで本研究は行列毎に要素の従う確率分布の属する分布族が異なり, それぞれ正規分布とポアソン分布に従う行列の組を解析する非負値行列分解手法を提案する. 人工データを用いた検証実験を通して, 提案手法が平均二乗誤差の精度改善を達成できること, ユーザの評価と回数に関する知見を発見しうるクラスタリング出力が可能であることを報告する.
抄録(英) As the number of projects on data collection and analysis increases in many business fields, it is required that the method which can deal with various type of information such as browsing, check-in and rating collected through company's web-page, smart-phone app and so on. In this paper, we extend collective matrix factorization method in order to analyze multiple matrices whose element of each matrix follows Normal distribution and Poisson distribution, respectively. Using artificial dataset, experiment shows that proposed method improves mean squared error performance and provides the clustering result which reflects the relation between the user's viewing and evaluation activity.
キーワード(和) 非負値行列分解 / 集合行列分解 / ユークリッド距離 / 一般化カルバックライブラーダイバージェンス / 補助関数法
キーワード(英) Non-negative Matrix Factorization / Collective Matrix Factorization / Euclid Distance / Generalized Kullback Leibler Divergence / Auxiliary Function Method
資料番号 IBISML2015-4
発行日 2015-06-16 (IBISML)

研究会情報
研究会 NC / IPSJ-BIO / IBISML / IPSJ-MPS
開催期間 2015/6/23(から3日開催)
開催地(和) 沖縄科学技術大学院大学
開催地(英) Okinawa Institute of Science and Technology
テーマ(和) 機械学習によるバイオデータマインニング、一般
テーマ(英) Machine Learning Approach to Biodata Mining, and General
委員長氏名(和) 斎藤 利通(法政大) / 関嶋 政和(東工大) / 鷲尾 隆(阪大) / 庄野 逸(電通大)
委員長氏名(英) Toshimichi Saito(Hosei Univ.) / Masakazu Sekijima(東工大) / Takashi Washio(Osaka Univ.) / Hayaru Shouno(電通大)
副委員長氏名(和) 佐藤 茂雄(東北大) / / 福水 健次(統計数理研) / 杉山 将(東工大)
副委員長氏名(英) Shigeo Sato(Tohoku Univ.) / / Kenji Fukumizu(ISM) / Masashi Sugiyama(Tokyo Inst. of Tech.)
幹事氏名(和) 堀尾 恵一(九工大) / 田中 宏喜(京都産大) / 大羽 成征(京大) / 瀬々 潤(お茶の水女子大) / 吉本 潤一郎(OIST) / 松井 知子(統計数理研) / 大羽 成征(京大) / 小野 智司(鹿児島大) / 但馬 康宏(岡山県立大) / 林田 守広(京大) / 岩田 具治(NTT) / 吉田 哲也(北大) / 松田 健(静岡理工科大)
幹事氏名(英) Keiichi Horio(Kyushu Inst. of Tech.) / Hiroki Tanaka(Kyoto Sangyo Univ.) / Shigeyuki Oba(京大) / Jun Sese(お茶の水女子大) / Junichiro Yoshimoto(OIST) / Tomoko Matsui(ISM) / Shigeyuki Ohba(Kyoto Univ.) / Satoshi Ono(鹿児島大) / Yasuhiro Tajima(岡山県立大) / Morihiro Hayashida(京大) / Tomoharu Iwata(NTT) / Tetsuya Yoshida(北大) / Takeshi Matsuda(静岡理工科大)
幹事補佐氏名(和) 神原 裕行(東工大) / 秋間 学尚(東北大) / / 津田 宏治(東大) / 鹿島 久嗣(京大)
幹事補佐氏名(英) Hiroyuki Kanbara(Tokyo Inst. of Tech.) / Hisanao Akima(Tohoku Univ.) / / Koji Tsuda(Univ. of Tokyo) / Hisashi Kashima(Kyoto Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Neurocomputing / Special Interest Group on Bioinformatics and Genomics / Technical Committee on Infomation-Based Induction Sciences and Machine Learning / Special Interest Group on Mathematical Modeling and Problem Solving
本文の言語 JPN
タイトル(和) 訪問・評点データ統合解析のための非負値行列分解手法の検討
サブタイトル(和)
タイトル(英) A Study on Non-negative Matrix Factorization for Integrated Analysis of Visiting and Rating Information
サブタイトル(和)
キーワード(1)(和/英) 非負値行列分解 / Non-negative Matrix Factorization
キーワード(2)(和/英) 集合行列分解 / Collective Matrix Factorization
キーワード(3)(和/英) ユークリッド距離 / Euclid Distance
キーワード(4)(和/英) 一般化カルバックライブラーダイバージェンス / Generalized Kullback Leibler Divergence
キーワード(5)(和/英) 補助関数法 / Auxiliary Function Method
第 1 著者 氏名(和/英) 幸島 匡宏 / Masahiro Kohjima
第 1 著者 所属(和/英) 日本電信電話株式会社(略称:NTT)
Nippon Telegraph and Telephone Corporation(略称:NTT)
第 2 著者 氏名(和/英) 松林 達史 / Tatsushi Matsubayashi
第 2 著者 所属(和/英) 日本電信電話株式会社(略称:NTT)
Nippon Telegraph and Telephone Corporation(略称:NTT)
第 3 著者 氏名(和/英) 澤田 宏 / Hiroshi Sawada
第 3 著者 所属(和/英) 日本電信電話株式会社(略称:NTT)
Nippon Telegraph and Telephone Corporation(略称:NTT)
発表年月日 2015-06-23
資料番号 IBISML2015-4
巻番号(vol) vol.115
号番号(no) IBISML-112
ページ範囲 pp.21-26(IBISML),
ページ数 6
発行日 2015-06-16 (IBISML)