講演名 2015-09-10
日本語解析システム「雪だるま」
山本 和英(長岡技科大), 宮西 由貴(長岡技科大), 高橋 寛治(長岡技科大), 猪俣 慶樹(長岡技科大), 須戸 悠太(長岡技科大), 三上 侑城(長岡技科大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 現在我々が構築している日本語解析システム「雪だるま」のうち、単語解析部について述べる。既存の形態素解析器は十分な精度と速度を持ってはいるが、出力結果は形態素列であって単語列ではない。これに対し、我々は表記ゆれの解消や慣用句等の形態素結合処理を備えた日本語単語解析器を構築している。本稿では、既存形態素解析の問題点について述べたあと、我々の考える解決方針の概略を述べる。
抄録(英) This paper presents our work on building a Japanese word analyzer, called as SNOWMAN, that is not so-called a "morphological analyzer." Although there are some morphological analyzers still available, they all produce morphemes, not words as output. That is, they are insufficient to recognize word consisting of multiple morphemes, such as idioms. Moreover, it is quite important in Japanese processing to reduce orthographical variants, that is considered partially in the current analyzers. Our analyzer strives to solve both problems. In this paper, we focus on word analysis module of the system and discuss the motivation and the differences between ours and current morphological analyzers.
キーワード(和) 形態素解析 / 品詞 / 表記ゆれ / 複合語 / 慣用句 / 単語解析 / 語義曖昧性解消 / 雪だるま
キーワード(英) morphological analysis / part-of-speech / orthographical variants / multi-word expression / idiom / word analysis / word sense disambiguation / SNOWMAN
資料番号 NLC2015-19
発行日 2015-09-03 (NLC)

研究会情報
研究会 NLC
開催期間 2015/9/10(から2日開催)
開催地(和) コンベンションルーム AP渋谷道玄坂
開催地(英) Convention Room AP Shibuya-Dogenzaka (Tokyo)
テーマ(和) 第7回 テキストマイニング・シンポジウム
テーマ(英) The Seventh Text Mining Symposium
委員長氏名(和) 竹内 孔一(岡山大)
委員長氏名(英) Koichi Takeuchi(Okayama Univ.)
副委員長氏名(和) 金山 博(日本IBM) / 市瀬 眞(NTTドコモ)
副委員長氏名(英) Hiroshi Kanayama(IBM) / Makoto Ichise(NTT DoCoMo)
幹事氏名(和) 榊 剛史(東大/ホットリンク) / 渡辺 靖彦(龍谷大)
幹事氏名(英) Takeshi Sakaki(Univ. of Tokyo/Hottolink) / Yasuhiko Watanabe(Ryukoku Univ.)
幹事補佐氏名(和) 嶋田 和孝(九工大) / 東中 竜一郎(NTT)
幹事補佐氏名(英) Kazutaka Shimada(Kyushu Inst. of Tech.) / Ryuichiro Higashinaka(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication
本文の言語 JPN
タイトル(和) 日本語解析システム「雪だるま」
サブタイトル(和) 単語解析部の設計思想
タイトル(英) SNOWMAN: A Japanese language analyzer
サブタイトル(和) Introduction to the Word Analyzer Module
キーワード(1)(和/英) 形態素解析 / morphological analysis
キーワード(2)(和/英) 品詞 / part-of-speech
キーワード(3)(和/英) 表記ゆれ / orthographical variants
キーワード(4)(和/英) 複合語 / multi-word expression
キーワード(5)(和/英) 慣用句 / idiom
キーワード(6)(和/英) 単語解析 / word analysis
キーワード(7)(和/英) 語義曖昧性解消 / word sense disambiguation
キーワード(8)(和/英) 雪だるま / SNOWMAN
第 1 著者 氏名(和/英) 山本 和英 / Kazuhide Yamamoto
第 1 著者 所属(和/英) 長岡技術科学大学(略称:長岡技科大)
Nagaoka University of Technology(略称:NUT)
第 2 著者 氏名(和/英) 宮西 由貴 / Yuki Miyanishi
第 2 著者 所属(和/英) 長岡技術科学大学(略称:長岡技科大)
Nagaoka University of Technology(略称:NUT)
第 3 著者 氏名(和/英) 高橋 寛治 / Kanji Takahashi
第 3 著者 所属(和/英) 長岡技術科学大学(略称:長岡技科大)
Nagaoka University of Technology(略称:NUT)
第 4 著者 氏名(和/英) 猪俣 慶樹 / Yoshiki Inomata
第 4 著者 所属(和/英) 長岡技術科学大学(略称:長岡技科大)
Nagaoka University of Technology(略称:NUT)
第 5 著者 氏名(和/英) 須戸 悠太 / Yuta Sudo
第 5 著者 所属(和/英) 長岡技術科学大学(略称:長岡技科大)
Nagaoka University of Technology(略称:NUT)
第 6 著者 氏名(和/英) 三上 侑城 / Yuki Mikami
第 6 著者 所属(和/英) 長岡技術科学大学(略称:長岡技科大)
Nagaoka University of Technology(略称:NUT)
発表年月日 2015-09-10
資料番号 NLC2015-19
巻番号(vol) vol.115
号番号(no) NLC-222
ページ範囲 pp.13-18(NLC),
ページ数 6
発行日 2015-09-03 (NLC)