講演抄録/キーワード |
講演名 |
2018-09-06 17:20
スパース構造学習に基づく語の潜在的共起グラフ抽出 ~ 転職サイト会員アンケートを題材としてトピックモデルと分散表現の比較 ~ ○窪野哲光・日吉のぞみ・明石大樹(パーソルキャリア) NLC2018-19 |
抄録 |
(和) |
人材サービス会社パーソルキャリアが運営する転職サイトDODAの会員アンケートから顧客インサイトを抽出するために,トピック相関・共変量情報を組み込むことができる「構造トピックモデル」の適用検討を進めている。先に「ベイジアンネット構造学習」による特徴選択と可視化,「自己組織化マップ」による文書クラスタリングを報告した。今回,顧客インサイトを抽出する新たな方法として,語の共起グラフからスパース構造推定に基く潜在的共起グラフ抽出を,トピックモデル(構造トピックモデル,LDA),分散表現(word2vec,Glove)の4種類の語ベクトルを作成して,スパース構造推定の正則化パラメータとグラフクラスタリングにより評価を行った。さらに,グラフクラスタを基底として文書ベクトルを定義し,文書クラスタリングへの応用可能性検討も行った。トピックモデルの方が分散表現よりも良い傾向が見られた。構造トピックモデルが最も良い結果であった。 |
(英) |
We are considering application of "structural topic model" in order to extract customer insight from member questionnaire on job change site DODA. As a new method of extracting customer insight, we investigated extracting latent co-occurrence graph based on sparse structure estimation method from word co-occurrence graph. We made a word vector from four types of topic model (structural topic model, LDA) and distributed representation (word 2 vec, Glove) and evaluated using sparsity estimation regularization parameters and graph cluster. Furthermore, we interpreted the graph cluster as a topic, defined document vectors, and also applied feasibility study to document clustering. |
キーワード |
(和) |
顧客インサイト / 構造トピックモデル / 共起グラフ / スパース構造学習 / グラフィカルラッソ / 特徴選択 / グラフクラスタリング / 文書クラスタリング |
(英) |
Customer Insight / Structural Topic Model / co-occurrence graph / sparse structure learning / Graphical Lasso / feature selection / graph clustering / document clustering |
文献情報 |
信学技報, vol. 118, no. 210, NLC2018-19, pp. 51-56, 2018年9月. |
資料番号 |
NLC2018-19 |
発行日 |
2018-08-30 (NLC) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2018-19 |