|
本書はNTT が10年以上にわたって作成してきた計算機用意味辞書である.従来のシソーラスのように語の意味を解説するのではなく,意味に応じた用法を記述するという点で英語の名辞書であるCOLINS
COBUILDの,より大規模な日本語版と形容することが可能であろう.
本辞書は,辞書構築そのものが目的ではなく,日英機械翻訳という工学的目的のために構築されたものである.したがって,実動する翻訳システムに用いられて有用性が確認されている点が特徴である.語彙は実に広範囲に網羅されており,20万語という多数の固有名詞を含む総語数30万語に対し,
3000意味属性を付加し,14000の文型パターンが記載されている.さらにこれを分類,たとえば名詞は2000種類以上に分類されているが,これは英訳時に名詞と共用する用言の訳語を決定できることを実験的に確かめた上での分類が行われている.
一方で,目的を日英機械翻訳と定めて作成された辞書だけに,つぎのような問題点も挙げられる.第一に,たとえばCOLINS
COBUILD辞書等が読者が利用しやすいように随所に工夫を凝らしているのに対し,本書は必ずしもそうとはいえない点である.実際,「掛ける」の用法として
「N1がN2をN3に/へ掛けるN1 apply N2 to N3[N1(3 主体 962 機械) N2(2314 物理現象)N3(533
具対物)]」
などと記載されているよりは,COLINS COBUILDのようにコーパスに頻出する典型的な言い回しを記載する方が,
辞書として扱いやすいと思われるのである.第二に,本辞書は英語への翻訳を目的としているために,辞書の内容が英語との比較においての分類に偏っているのではなかろうかという点である.本辞書を言語学的な観点から英語とは全く異なる言語への機械翻訳を考えた時に,同じ分類法は有効なのであろうか.
とはいえ,工学的な実装を背景として構築された辞書であるため,今後数年間に渡り,日本語自然言語研究において重要な基礎資料の一つとなることは間違いないであろう.今後人間が使いやすいようなインターフェースを付加した,CD-ROM
版,同時に,他の自然言語研究に使用可能となるような編集を付加したCD-ROM版の出版が期待される.
|