講演名 1998/7/23
誤りやすい同音異義語の収集
新納 浩幸,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では, 誤りやすい同音異義語に内在するヒューリスティクスを提案し, 既知の辞典を用いて, そのヒューリスティクスの妥当性を示す.また, そのヒューリスティクスを利用して、既存の辞書から誤りやすい同音異義語を自動収集する.ここでは, 通常の同音異義語と片方が実在しない単語となるような同音異義語を収集する.後者の収集の評価として, 1ケ月分の新聞記事からそのような同音異義語の誤り検出を行い, 収集した効果を確認した.読みを考慮した収集を行うことを今後の課題とする。
抄録(英) In this paper we present a heurisitics on homophone apt to be mis-spelled carelessly, and show the appropriateness of this heuristics by homophone dictionaries. Further, by using this heuristics, we automatically extract homophone apt to be mis-spelled carelessly from the dictionary. We collect two types of homophone. One is the general homophone, and another is the homophone which is a set with two elements. First element is a real word, and second element is the mis-spelled word for the first one. To evaluate the collection of the latter homophone, we detect mis-spelled homophone in the newspaper one month articles. As the result, we could confirm the effectiveness for the collection of homophone. In furture, we well study the collection of homophone with the consideration of the pronunciation of Kanji characters.
キーワード(和)
キーワード(英)
資料番号 NLC98-7
発行日

研究会情報
研究会 NLC
開催期間 1998/7/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 誤りやすい同音異義語の収集
サブタイトル(和)
タイトル(英) Collection of homophone apt to be mis-spelled carelessly
サブタイトル(和)
キーワード(1)(和/英)
第 1 著者 氏名(和/英) 新納 浩幸 / Hiroyuki Shinnou
第 1 著者 所属(和/英) 茨城大学工学部システム工学科
Ibaraki University. Dept. of Systems Engineering
発表年月日 1998/7/23
資料番号 NLC98-7
巻番号(vol) vol.98
号番号(no) 209
ページ範囲 pp.-
ページ数 8
発行日