講演名 1997/7/25
人名辞書から名前読み付与規則を抽出する試み
増田 恵子, 梅村 恭司,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 人名のアルファベット表記とカナ表記からなる辞書が存在する. アルファベット表記とカナ表記の対応規則は, 日本人が外国人名を検索する時に有用である. 我々は人名辞書からアルファベット表記とカナ表記の対応規則を抽出することを試みた. 本稿では, 対応規則を抽出するアルゴリズムを提案し, データとして人名辞書をアルゴリズムに適用し, 抽出した規則が辞書のアルファベット表記をどのくらい補えるかの確認を行なった. 我々の提案するアルゴリズムは, アルファベット表記に対応するカナ表記を与えずに規則を抽出することができる.
抄録(英) We have a dictionary that converts alphabet of person names into their corresponding Kana. The correspondence rules between alphabet and Kana are valuable when Japanese people search foreign names. We have tried to extract these rules from the dictionary. In this paper, we propose the algorithm that can extract the rules. Then we have applied the algorithm to the actual data. Finally, we have verified the correctness of the rules against original dictionary. It is remarkable that this algorithm is able to extract rules without any given information of Kana-alphabet correspondence.
キーワード(和) 形態素 / 読み / コーパス / 統計的言語処理
キーワード(英) morphology / corpus / statistical processing
資料番号 NLC97-22
発行日

研究会情報
研究会 NLC
開催期間 1997/7/25(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 人名辞書から名前読み付与規則を抽出する試み
サブタイトル(和)
タイトル(英) Extracting Kana-alphabet rules from a non-Japanese name reading table
サブタイトル(和)
キーワード(1)(和/英) 形態素 / morphology
キーワード(2)(和/英) 読み / corpus
キーワード(3)(和/英) コーパス / statistical processing
キーワード(4)(和/英) 統計的言語処理
第 1 著者 氏名(和/英) 増田 恵子 / Keiko Masuda
第 1 著者 所属(和/英) 豊橋技術科学大学情報工学系悔村研究室
Umemura Laboratory, Department of Information and Computer Sciences
第 2 著者 氏名(和/英) 梅村 恭司 / Kyoji Umemura
第 2 著者 所属(和/英) 豊橋技術科学大学情報工学系悔村研究室
Umemura Laboratory, Department of Information and Computer Sciences
発表年月日 1997/7/25
資料番号 NLC97-22
巻番号(vol) vol.97
号番号(no) 200
ページ範囲 pp.-
ページ数 6
発行日