講演抄録/キーワード |
講演名 |
2015-09-10 11:25
日本語解析システム「雪だるま」 ~ 単語解析部の設計思想 ~ ○山本和英・宮西由貴・高橋寛治・猪俣慶樹・須戸悠太・三上侑城(長岡技科大) NLC2015-19 |
抄録 |
(和) |
現在我々が構築している日本語解析システム「雪だるま」のうち、単語解析部について述べる。既存の形態素解析器は十分な精度と速度を持ってはいるが、出力結果は形態素列であって単語列ではない。これに対し、我々は表記ゆれの解消や慣用句等の形態素結合処理を備えた日本語単語解析器を構築している。本稿では、既存形態素解析の問題点について述べたあと、我々の考える解決方針の概略を述べる。 |
(英) |
This paper presents our work on building a Japanese word analyzer, called as SNOWMAN, that is not so-called a "morphological analyzer." Although there are some morphological analyzers still available, they all produce morphemes, not words as output. That is, they are insufficient to recognize word consisting of multiple morphemes, such as idioms. Moreover, it is quite important in Japanese processing to reduce orthographical variants, that is considered partially in the current analyzers. Our analyzer strives to solve both problems. In this paper, we focus on word analysis module of the system and discuss the motivation and the differences between ours and current morphological analyzers. |
キーワード |
(和) |
形態素解析 / 品詞 / 表記ゆれ / 複合語 / 慣用句 / 単語解析 / 語義曖昧性解消 / 雪だるま |
(英) |
morphological analysis / part-of-speech / orthographical variants / multi-word expression / idiom / word analysis / word sense disambiguation / SNOWMAN |
文献情報 |
信学技報, vol. 115, no. 222, NLC2015-19, pp. 13-18, 2015年9月. |
資料番号 |
NLC2015-19 |
発行日 |
2015-09-03 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2015-19 |