名著・名論文紹介

長尾 真(編著)
自然言語処理(岩波講座震蝶・科学第15巻)岩波書店(1996)

橋田浩一、田中久美子、高橋直人(電子技術総合研究所知能情報部)

 本書は、自然言語処理に関する工学書のうち、最も内容が豊富で新しいものの一つである。言語の形式的モデルから、形態素解析、構文解析、意味解析などの基礎、さらに対話研究、生成、コーパスなど、近年の研究に至るまで網羅的に解説されている。
 本書は自然言語をコンピュータで処理する立場から執筆されている。したがって、自然言語を扱うソフトウエアの中にひそむ基本的メカニズムや一般的な性質を明らかにするとの意図が見られる。実際、豊富に具体例が挙げられ、読者がメカニズムを直感的に理解できるように工夫を凝らしているだけでなく、関連するソフトウェアを挙げ、実際に計算機で試してみる可能性を示唆する。これは、形態素解析器など、自然言語分野の実動面で特に大きな貢献を成してきた長尾研ならではの姿勢であろう。
 一方で本書の問題点をあえて挙げるならば、長尾研究室での研究の集大成であるため、必ずしも本質的ではないことまでことこまかに記述されており、内容が厚すぎるの感を免れない点がある。特に後半は研究内容の導入的な索引としては便利であるが、一冊の本としてまとめる必要上、簡単な導入に留まっているのは仕方のないことであろう。
 しかし、以上のような点をふまえたとしても、現在の工学的立場からの自然言語研究を一望するには、重要な参考文献である。学生のみならず、研究者としても学ぶところが多い力書となっている。

NTTコミュニケーション科学研究所(監修)
日本語語彙大系(全5巻)、岩波書店(1997)

橋田浩一、田中久美子、高橋直人(電子技術総合研究所知能情報部)

 本書はNTT が10年以上にわたって作成してきた計算機用意味辞書である。従来のシソーラスのように語の意味を解説するのではなく、意味に応じた用法を記述するという点で英語の名辞書であるCOLINS COBUILDの、より大規模な日本語版と形容することが可能であろう。
 本辞書は、辞書構築そのものが目的ではなく、日英機械翻訳という工学的目的のために構築されたものである。したがって、実動する翻訳システムに用いられて有用性が確認されている点が特徴である。語彙は実に広範囲に網羅されており、20万語という多数の固有名詞を含む総語数30万語に対し、3000意味属性を付加し、14000の文型パターンが記載されている。さらにこれを分類、たとえば名詞は2000種類以上に分類されているが、これは英訳時に名詞と共用する用言の訳語を決定できることを実験的に確かめた上での分類が行われている。
 一方で、目的を日英機械翻訳と定めて作成された辞書だけに、つぎのような問題点も挙げられる。第一に、たとえばCOLINS COBUILD辞書等が読者が利用しやすいように随所に工夫を凝らしているのに対し、本書は必ずしもそうとはいえない点である。実際、「掛ける」の用法として
「N1がN2をN3に/へ掛けるN1 apply N2 to N3[N1(3 主体 962 機械) N2(2314 物理現象)N3(533 具対物)]」
などと記載されているよりは、COLINS COBUILDのようにコーパスに頻出する典型的な言い回しを記載する方が、辞書として扱いやすいと思われるのである。第二に、本辞書は英語への翻訳を目的としているために、辞書の内容が英語との比較においての分類に偏っているのではなかろうかという点である。本辞書を言語学的な観点から英語とは全く異なる言語への機械翻訳を考えた時に、同じ分類法は有効なのであろうか。
 とはいえ、工学的な実装を背景として構築された辞書であるため、今後数年間に渡り、日本語自然言語研究において重要な基礎資料の一つとなることは間違いないであろう。今後人間が使いやすいようなインターフェースを付加した、CD-ROM 版、同時に、他の自然言語研究に使用可能となるような編集を付加したCD-ROM版の出版が期待される。