講演名 2022-03-07
単語の分散表現と経験則に基づく厳密な同義関係の判定
鈴木 葵登(和歌山大), 風間 一洋(和歌山大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 特定のドメインの知識を体系化したシソーラスやオントロジは,自然言語を扱うシステムの性能向上に有用である.しかし,知識を完全に記述することは実際には不可能であり,また利用目的によっては当初の知識の整理方針との齟齬が存在することがあり,それはシステムの性能の低下を招く原因となる.本稿では,元のオントロジより厳密な同義関係が必要となる応用分野のために,同義語辞書,単語の分散表現,経験則に基づく判定規則を用いて,オントロジを再処理する手法を提案する.実際に,料理オントロジに提案手法を適用して,適合率,再現率,F値を用いて評価した.その結果,適合率では非常に高い値であるが,再現率では少し値が低いことがわかった.さらにどの判定規則が厳密な同義関係の判定に寄与しているのかを評価した結果,適合率では,全体部分関係に関する規則,再現率では,読みに関する規則が特に寄与していることがわかった.また,誤判定の原因分析では,単語の分散表現の規則が適合率の低下,全体部分関係に関する規則が再現率の低下の原因となっていることがわかった.
抄録(英) Thesauruses or ontologies that systematized specific domain knowledge is useful for improving the performance of systems handling natural languages.However, it is impossible to describe knowledge completely in practice and depending on the purpose of use, there may be inconsistency with the original knowledge organization policy, which can cause poor system performance. In this paper, for application areas that require rigorous synonyms than the original ontologies,we propose a method for reprocessing ontologies using a synonym dictionary, distributed representation of words and heuristics. Acctualy, we applied the proposed method to a cooking ontology and evaluated it using the precision, recall, and F-measure. The results showed that the precision was very high, but the recall was a little low. In addition, we evaluated which judgment rules contributed to the rigorous determination of synonyms and found that the rules for whole-part relations contributed especially to the precision, and the rules for reading contributed especially to the recall. In the analysis of the causes of misjudgments, it was found that the rules for distributed representation of words caused a decrease in the precision and the rules for whole-part relations caused a decrease in the recall.
キーワード(和) オントロジ / 同義語 / 単語の分散表現 / 経験則
キーワード(英) ontology / synonyms / distributed representation of words / heuristics
資料番号 NLC2021-38
発行日 2022-02-28 (NLC)

研究会情報
研究会 NLC
開催期間 2022/3/7(から1日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 観光情報処理と一般
テーマ(英) Information Processing of Tourism, etc.
委員長氏名(和) 嶋田 和孝(九工大)
委員長氏名(英) Kazutaka Shimada(Kyushu Inst. of Tech.)
副委員長氏名(和) 吉田 光男(豊橋技科大) / 小早川 健(NHK)
副委員長氏名(英) Mitsuo Yoshida(Toyohashi Univ. of Tech.) / Takeshi Kobayakawa(NHK)
幹事氏名(和) 坂地 泰紀(東大) / 石野 亜耶(広島経済大)
幹事氏名(英) Hiroki Sakaji(Univ. of Tokyo) / Aya Ishino(Hiroshima Univ. of Economics)
幹事補佐氏名(和) 高橋 寛治(Sansan) / 光田 航(NTT)
幹事補佐氏名(英) Kanjin Takahashi(Sansan) / Ko Mitsuda(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication
本文の言語 JPN
タイトル(和) 単語の分散表現と経験則に基づく厳密な同義関係の判定
サブタイトル(和)
タイトル(英) Strict Determination of Synonyms using Distributed Representation of Words and Heuristics
サブタイトル(和)
キーワード(1)(和/英) オントロジ / ontology
キーワード(2)(和/英) 同義語 / synonyms
キーワード(3)(和/英) 単語の分散表現 / distributed representation of words
キーワード(4)(和/英) 経験則 / heuristics
第 1 著者 氏名(和/英) 鈴木 葵登 / Aoto Suzuki
第 1 著者 所属(和/英) 和歌山大学(略称:和歌山大)
Wakayama University(略称:Wakayama Univ.)
第 2 著者 氏名(和/英) 風間 一洋 / Kazuhiro Kazama
第 2 著者 所属(和/英) 和歌山大学(略称:和歌山大)
Wakayama University(略称:Wakayama Univ.)
発表年月日 2022-03-07
資料番号 NLC2021-38
巻番号(vol) vol.121
号番号(no) NLC-415
ページ範囲 pp.56-61(NLC),
ページ数 6
発行日 2022-02-28 (NLC)