講演名 2008-12-10
単語出現順序を考慮したトピックモデルによる言語モデル適応(ポスターセッション,第10回音声言語シンポジウム)
佐古 淳, 滝口 哲也, 有木 康雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 人間にとって不可解な認識誤りの低減や,単語の認識だけでなく,意味・内容の理解を行うためにはsemanticsを考慮することが重要であると考えられる.現在,LSAやPLSAのようにsemanticsを考慮するモデルはBag-of-wordsに基づく手法であり,文書中の単語出現頂序を考慮していない.より高度な分析のためには,文書中の単語出現順序を考慮する必要があると考えられる.本研究では,Kernel PCA及びDynamic Time Alignmentカーネルを用いることにより,単語順序を考慮したLatent Semantic空間を構築する手法を提案する.予備実験では,右回り/左回りにプロットした時系列データがLatent Semantic空間においてきれいに分離されることを確認した.また,言語コーパスを用いた評価実験では,パープレキシティの低下を確認することが出来た.
抄録(英) It is important to consider semantics for reductions of recognition errors unlike humans or understanding meanings and contents. To accommodate these problems, Latent Semantic Analysis (LSA) or Probabilistic LSA have been proposed. However these methods are based on Bag-of-words techniques. For more sophisticated analysis, it needs to consider a sequence of words in a document. In this paper, we propose the method based on Kernel PCA and Dynamic Time Alignment Kernel in order to consider a sequence of words. Preliminary experimental results shows the proposed method can separete clearly a sequence of right turn/left turn prots data. Moreover, experimental results of language corpus shows the reduction of perplexity.
キーワード(和) Latent Semantic Analysis / Kernel PCA / トピックモデル
キーワード(英) Latent Semantic Analysis / Kernel PCA / Topic Model
資料番号 NLC2008-66,SP2008-121
発行日

研究会情報
研究会 NLC
開催期間 2008/12/2(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 単語出現順序を考慮したトピックモデルによる言語モデル適応(ポスターセッション,第10回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Language Model Adaptation by Topic Model Based on Sequence of Words
サブタイトル(和)
キーワード(1)(和/英) Latent Semantic Analysis / Latent Semantic Analysis
キーワード(2)(和/英) Kernel PCA / Kernel PCA
キーワード(3)(和/英) トピックモデル / Topic Model
第 1 著者 氏名(和/英) 佐古 淳 / Atsushi SAKO
第 1 著者 所属(和/英) 神戸大学大学院自然科学研究科:神戸大学大学院工学研究科
Guraduate School of Science and Technology, Kobe University:Guraduate School of Engineering, Kobe University
第 2 著者 氏名(和/英) 滝口 哲也 / Tetsuya TAKIGUCHI
第 2 著者 所属(和/英) 神戸大
/
第 3 著者 氏名(和/英) 有木 康雄 / Yasuo ARIKI
第 3 著者 所属(和/英) 神戸大
発表年月日 2008-12-10
資料番号 NLC2008-66,SP2008-121
巻番号(vol) vol.108
号番号(no) 337
ページ範囲 pp.-
ページ数 6
発行日