研究室めぐり

九州大学大学院システム情報科学研究科 情報理学専攻 発見科学講座 有川研究室<

有川 節夫

 平成8年4月に設立されました大学院システム情報科学研究科は、情報理学専攻、知能システム学専攻、情報工学専攻、電気電子システム工学専攻、電子デバイス工学専攻の5専攻から成り立っています。筆者の所属する情報理学専攻には、「基礎情報学講座」と「発見科学講座」という2つの大講座があります。
教授・助教授の定員は合わせて10名で、1学年の学生定員は修士課程25名、博士課程10名です。学生の出身母体は、電気工学科、情報工学科、物理学科、数学科、生物学科等で、非常に多様な学問的背景をもった学生が集まり、互いに刺激を受けて意欲的に研究に勤しんでいます。この情報理学専攻は、情報科学の基礎研究とその教育を担うことになっています。基礎研究といえば、役に立たない理論研究というイメージが定着しているようですが、この専攻では役に立つ理論研究や理論に支えられた実践的研究を基礎研究と考え、また、非常に大規模な調査・実験を伴う研究も基礎研究として位置付けています。情報理学専攻では、通常の小講座単位(教授1人、助教授1人、助手1人)での研究教育活動に加えて、助教授以上の教官がもっているプロジェクトごとに大講座内、あるいは大講座を跨って、また必要に応じて他大学の研究者も参加した形の研究も盛んに行っています。ここでは、筆者がこれまでに関係してきたこうしたプロジェクト研究で現在も展開中のものいくつかを紹介し、最後に研究室活動と直接関係はありませんが、平成10年度に発足した特定領域研究(A)「発見科学」について簡単に紹介させていただきます。
(1)情報検索と文字列パターン照合
 情報検索を人工知能研究の基礎と位置付けて研究しています。これまでに、学術情報の生産者でありかつ利用者である研究者を情報検索システムに積極的に位置づけたシステムMIR-RFの開発を始め、パターン照合アルゴリズムの研究に基づくテキストデータベース管理システムSIGMA (1981年以来九州大学大型計算機センターから公開中)等の開発を行ってきました。最近は、同じ講座の篠原歩助教授と基礎情報学講座の竹田助教授をリーダとしたプロジェクトにより、圧縮テキスト上での文字列照合アルゴリズムの研究を展開しています。
(2)計算学習理論
 帰納推論とPAC学習(確率的近似学習)は、機械学習の基礎を与える重要な理論です。帰納推論に関しては、1972年頃から研究を始め、九州工業大学の篠原武教授や石坂助教授、基礎情報学講座の有村助教授達が学生であったころから精力的に研究しています。この間に、篠原教授による「正データからの帰納推論が意外に強力である。」という衝撃的な成果を始めとして、有村助教授による多重最小汎化の効率的なアルゴリズムの開発、石坂助教授によるモデル推論の効率化等、重要な成果を得ました。また、PAC学習に関しては、篠原歩助教授が教示に関する独創的な研究をしています。また、東京大学の宮野悟教授が研究室に在籍していた時代に、(4)で説明するEFSの枠組みを使ってPAC学習可能性に関する応用の利く理論的成果を得ています。
(3)類推の理論とそのシステム化
 類推は、問題解決や各種推論の初期の段階で日常的によく使われる重要な推論です。この課題に関して、北海道大学の原口教授が基礎情報学研究施設に在籍中から取り組んでいます。原口教授により、類推の根拠を与える類比の理論が展開され、それに基づいた類推の理論化が行われ、類推を通常の演繹推論の自然な一般化として捉えることに成功しています。また、この理論に基づいた類推システムも開発してきました。
(4)文字列上の論理プログラムEFS
 R。M。Smullyanが1961年に考案していたEFS(基本形式体系)が文字列を直接扱う論理プログラムであることに気付き、北海道大学の山本助教授が学生のころ篠原教授と3人で、これを計算学習理論の統一的な枠組みとして定式化しました。それを使って、先に述べました正データからの帰納推論の能力や応用の利くPAC学習可能なクラス等の研究が展開され、多くの成果が得られています。
(5)遺伝子データからの知識発見
 宮野教授と篠原助教授をリーダーにして、ゲノムデータからの知識発見について理論と実際の双方から研究しています。これまでに、EFSや決定木を対象にしたPAC学習理論を展開し、それを実動化する形でBONSAIやHAKKEという知識発見システムを開発して、実際のゲノムデータに適用して分子生物学上の興味ある知識の機械発見に成功しています。
(6)数値データからの微分方程式の発見
 実験や観測によって得られる多くのデータは数値データです。そうした数値データを直接扱える帰納推論の理論を北九州大学の広渡講師と展開し、同時に実際の数値データからそれらを説明する微分方程式を発見する研究を同じ発見科学講座の新島教授等と一緒に行っています。
(7)データマイニング
 機械学習やデータベースの分野で現在非常に注目されているデータマイニングに関しては、大規模テキストデータからの知識発見をテーマにした有村助教授をリーダーにした研究が進行中で、既に新しい問題の設定のもとで効率的なアルゴリズムが得られています。
(8)機械発見の論理・理論
 与えられたデータからの機械学習と機械発見の主な違いは、仮説空間が先に与えられるか、データが先に与えられるかにあるといえます。したがって、機械発見においては、個々の仮説ではなくて仮説空間自体が実験・観測データによって論駁できることが本質的ということになります。大阪府立大学の向内講師は、博士課程の時代に、EFSを使ってそのような仮説空間で十分大きなものが存在することを証明しています。
(9)文部省特定領域研究(A)「発見科学」
 平成10年度から3年間の予定で文部省科学研究費補助金による特定領域研究(A)「巨大学術社会情報からの知識発見に関する基礎研究(略称:発見科学、領域代表者 有川節夫)」がスタートしました。このプロジェクトは、発見という崇高な知的活動を情報科学的に積極的に支援するための基礎を築くことを目標にして、哲学から論理・推論・学習の理論展開、実際のシステム構築に至るまでの体系的研究を行い、発見科学という情報科学の新しい基礎分野を確立しようとするものです。総勢約60名の大学や企業等の研究者がこのプロジェクトに参加しています。詳細については、次のホームページをご覧ください。
http://www.i.kyushu-u.ac.jp/~arikawa/discovery/