講演抄録/キーワード |
講演名 |
2009-03-13 17:00
αダイバージェンスに基づく単語連想と文書分類への適用 ○別所克人・内山俊郎・内山 匡(NTT) PRMU2008-255 |
抄録 |
(和) |
単語と、単語に付随する意味属性とが、コーパス中で共起する頻度を算出することにより得られる共起ベクトルは、単語間の意味的類似性を反映する性質をもつ。本稿では、共起ベクトル間の距離尺度として、カルバック・ライブラー距離を拡張した距離尺度であるαダイバージェンスを適用することにより、様々なレベルの上位・下位・兄弟概念の単語が連想されることを報告する。また、共起ベクトル間のαダイバージェンスの文書分類への適用について述べる。 |
(英) |
The co-occurrence vectors that are the co-occurrence frequencies between words and semantic attributes in a corpus reflect the semantic similarities between words. This paper shows that words of superordinate or subordinate or sibling concept at various levels are associated by applying $\alpha$-divergence that is the distance measure to which Kullback-Leibler Metric is expanded as the distance measure between co-occurrence vectors. Moreover, it describes the application of $\alpha$-divergence between co-occurrence vectors to the document classification. |
キーワード |
(和) |
共起ベクトル / αダイバージェンス / 単語連想 / 文書分類 / / / / |
(英) |
Co-occurrence Vector / $\alpha$-Divergence / Word Association / Document Classification / / / / |
文献情報 |
信学技報, vol. 108, no. 484, PRMU2008-255, pp. 105-110, 2009年3月. |
資料番号 |
PRMU2008-255 |
発行日 |
2009-03-06 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2008-255 |