業績賞 推薦の辞
インターネット上の多言語サービス基盤 「言語グリッド」の研究開発
石田 亨 ・ 村上陽平 ・ 林 冬惠
石田 亨 村上陽平 林 冬惠      
 近年,インターネットを介してコミュニケーションをとる人々の数が増加し,Web上で用いられている言語数は急速に増加している.一方で,インターネット上には多数の言語資源(データ及びソフトウェア)が存在しているにもかかわらず,専門家でなければ異文化コラボレーション活動の現場で利用することは難しい.複雑な契約や知的財産,データ構造やインタフェースの多様性が,言語資源の一般的な利用の妨げとなっている.
 受賞者らは,集合知のアプローチにより,言語資源をサービス化して共有するためのインターネット上の多言語サービス基盤「言語グリッド(The Language Grid)」を開発した.利用者は,言語グリッドにアクセスすることによって,大学や研究機関,企業が提供する言語サービスを利用できる.更に利用者は異文化コラボレーションの現場に合わせてそれらのサービスを自由に組み合わせて,新たな言語サービスを作成し登録することも可能である(図1).


図1 言語グリッドの概要

 受賞者らが開発した言語グリッドは,P2Pサービスグリッド,原子サービス,複合サービス,応用システムの4層から構成されている(図2).P2Pサービスグリッドは,コアノードとサービスノードという2種類のノードでネットワークを形成する技術である.コアノードはサービスの登録情報を管理し,サービスのアクセス制御を行い,サービスを連携させる.一方,サービスノードは,言語サービスを直接呼び出す.原子サービスは,個々の言語資源に対応したWebサービスである.例えば,機械翻訳や形態素解析,辞書,用例対訳が典型的な言語資源である.これらの資源は標準化されたサービスインタフェースに基づいてラッピングされることで利用者は言語資源の区別なく容易に切り換えて利用することができる.複合サービスは,ワークフローによって原子サービスを合成したものである.例えば,二つの翻訳サービスを接続した折返し翻訳や,翻訳サービスと形態素解析サービス,及び専門用語辞書サービスを合成した専門翻訳など目的に合わせた多様な複合サービスが構築されている.こうして公開された原子・複合サービスを共有することで,利用者は低コストで応用システムとして異文化コラボレーションツールを開発でき,言語資源の利用を促進している.


図2 言語グリッドのシステム階層

 受賞者らによる2007年12月の言語グリッドの運営開始以降,2013年3月現在,18か国,147の組織が参加している.中国科学院やDFKIといった研究機関や,シュツットガルト大学,プリンストン大学,そして多くの日本の大学,NPO/NGOや公的機関などが言語グリッドに参加している.NTTや東芝,沖電気,Googleといった企業も参加しており,機械翻訳サービスなどを提供している.また,タイの国立研究所NECTEC(2011年)とインドネシアのインドネシア大学(2012年)とともに言語グリッドの連邦制の運営を開始し,言語グリッドの国際展開を進めることで,180以上の言語サービスが共有されている.
 このような言語グリッドの取組みは欧米でも認識され,「言語資源の配布から言語サービスの提供へ」という言語資源の利用形態の大きな転換をリードするとともに,NPOによる各分野での社会貢献活動の支援(外国人患者支援,ベトナムの農業支援など)に利用されるなど,その貢献は極めて顕著であり,本会業績賞にふさわしいものである.
 
文献
(1) 石田 亨,村上陽平,“サービス指向集合知のための制度設計,”信学論 (D), vol.J93-D, no.6, pp.675-682, June 2010.
(2) 石田 亨,村上陽平,稲葉利江子,林 冬惠,田仲正弘,“言語グリッド:サービス指向の多言語基盤,”信学論 (D), vol.J95-D, no.1, pp.2-10, Jan. 2012.
(3) The Language Grid:Service-Oriented Collective Intelligence for Language Resource Interoperability, T. Ishida ed., Springer, 2011.
 

CLOSE