講演名 2015-09-10
語彙統制のための同義語集合の資源化
山本 和英(長岡技科大), 高橋 寛治(長岡技科大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 自然言語の多様な表現が引き起こす問題の軽減方法として、語彙統制を提案する。語彙統制とは、何らかの手段や方法で類似した意味を持つ語の集約を図り、その結果として語彙数を減らすことである。本稿では、語彙統制の第一歩として行っている同義語の収集および資源化について述べる。本研究では同義語集合を上位下位関係の語と類義語の2つの分類に分けて既存の資源から作成した。作業の結果上位下位関係の語集合は343組、類義語は21,784組を収集した。資源化した同義語集合は、我々で開発を進めている日本語解析システム「雪だるま」の語彙統制部に組み込む。
抄録(英) We have constructed a semantically compatible resource and attached it to a dictionary used in our language analyzer SNOWMAN. We present a definition of semantically compatible words and construction of semantically compatible words. We also describe semantic control part on SNOWMAN.
キーワード(和) 同義語 / 語彙
キーワード(英) semantic classification / synonym
資料番号 NLC2015-18
発行日 2015-09-03 (NLC)

研究会情報
研究会 NLC
開催期間 2015/9/10(から2日開催)
開催地(和) コンベンションルーム AP渋谷道玄坂
開催地(英) Convention Room AP Shibuya-Dogenzaka (Tokyo)
テーマ(和) 第7回 テキストマイニング・シンポジウム
テーマ(英) The Seventh Text Mining Symposium
委員長氏名(和) 竹内 孔一(岡山大)
委員長氏名(英) Koichi Takeuchi(Okayama Univ.)
副委員長氏名(和) 金山 博(日本IBM) / 市瀬 眞(NTTドコモ)
副委員長氏名(英) Hiroshi Kanayama(IBM) / Makoto Ichise(NTT DoCoMo)
幹事氏名(和) 榊 剛史(東大/ホットリンク) / 渡辺 靖彦(龍谷大)
幹事氏名(英) Takeshi Sakaki(Univ. of Tokyo/Hottolink) / Yasuhiko Watanabe(Ryukoku Univ.)
幹事補佐氏名(和) 嶋田 和孝(九工大) / 東中 竜一郎(NTT)
幹事補佐氏名(英) Kazutaka Shimada(Kyushu Inst. of Tech.) / Ryuichiro Higashinaka(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication
本文の言語 JPN
タイトル(和) 語彙統制のための同義語集合の資源化
サブタイトル(和)
タイトル(英) Construction of Semantically Compatible Words Collection
サブタイトル(和)
キーワード(1)(和/英) 同義語 / semantic classification
キーワード(2)(和/英) 語彙 / synonym
第 1 著者 氏名(和/英) 山本 和英 / Kazuhide Yamamoto
第 1 著者 所属(和/英) 長岡技術科学大学(略称:長岡技科大)
Nagaoka University of Technology(略称:NUT)
第 2 著者 氏名(和/英) 高橋 寛治 / Kanji Takahashi
第 2 著者 所属(和/英) 長岡技術科学大学(略称:長岡技科大)
Nagaoka University of Technology(略称:NUT)
発表年月日 2015-09-10
資料番号 NLC2015-18
巻番号(vol) vol.115
号番号(no) NLC-222
ページ範囲 pp.7-12(NLC),
ページ数 6
発行日 2015-09-03 (NLC)