講演抄録/キーワード |
講演名 |
2010-01-19 14:20
行列因子化の混合モデルへの拡張と映画レーティング予測への応用 ○中村政義・竹之内高志・池田和司(奈良先端大) NC2009-86 |
抄録 |
(和) |
多くの推薦システムでは,ユーザーが商品に対してつけたレーティング(評価値) のデータを基に商品を推薦する.そのデータは多くの場合,行列で表現され,大部分が欠測した非常にスパースな行列となっている.この行列の欠測部分を予測することは,ユーザがまだ評価してない商品のレーティングを予測することに対応し,推薦システムにとって重要な意味を持つ.この欠測予測手法の1 つとして行列因子化法が知られている.行列因子化のコスト関数は,平均が因子化されたガウス分布の対数尤度関数と一致するため,行列因子化法は行列要素がガウス分布であると仮定している.しかし,実際のデータではユーザーの性質がグループをなしている場合があり,単一モデルの仮定が適切ではない場合がある.我々はこのようなデータに対応するため,行列の要素が混合ガウス分布に従っているとするモデル化を提案する.本報告では,欠測予測問題に対して人工データを用い,どのようなデータに対して提案手法が有効であるかを議論した後,実データに対して適用した結果を報告する. |
(英) |
Recommendation systems suggest items to an user, based on existing history of evaluation for itemsby the users. In many cases, history information of users is represented as a matrix form, in which most part aremissing. Matrix factorization is a well-known method for predicting missing values of the sparse matrix. The costfunction of the conventional matrix factorization corresponds to the log-likelihood with a single Gaussian model,whose mean is assumed to be factorizes. However, in real-world datasets, a group of users forms a cluster and eachcluster has different characteristic. For the situation the model of single Gaussian is not appropriate. To tackle thesituation, in this report, we extend matrix factorization with a mixture model, and investigate our method using asynthetic dataset and a real-world dataset. |
キーワード |
(和) |
行列因子化 / 混合モデル / レーティング予測 / 確率モデル / / / / |
(英) |
Matrix factorization / Mixture model / Missing value prediction / Probabilistic model / / / / |
文献情報 |
信学技報, vol. 109, no. 363, NC2009-86, pp. 89-93, 2010年1月. |
資料番号 |
NC2009-86 |
発行日 |
2010-01-11 (NC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NC2009-86 |