トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

第3回 集合知シンポジウム

このページの短縮URLは http://goo.gl/7GOn6 です。

第3回集合知シンポジウム 参加募集

  • 日程
    • 2012年 2月 2日(木) 12:55 - 16:45
    • 2012年 2月 3日(金)  9:15 - 16:40
    • 詳しい日程はこちらをご覧ください
    • (2/1) 1日目に発表キャンセルがあったため、開始時間を25分遅らせました。2日目に変更はありません。

参加者へのお知らせ

  • 参加には事前登録が必要です。詳しくは本ページ下部をご覧ください。
  • 会場に最も近いホテルはホテル日航新潟(朱鷺メッセ直結)です。その他、新潟駅周辺と繁華街の古町周辺(新潟駅から直進して信濃川北西部)に集中しています。(参考:Googleマップ)
  • 宿泊の斡旋は行っていませんが、ホテルオークラ新潟より特別料金での宿泊プランの情報提供がありましたので、参考として掲載します。なお、予約や問い合わせはホテルに直接お願いします。
  • インターネット回線(無線):当日Freespotのパスワードをお伝えします。
  • 昼食:会場周辺のランチマップはこちらです。
  • 懇親会会場は新潟駅周辺(駅から徒歩10分程度)を予定しています。会場からはプログラム1日目終了後に懇親会場まで無料送迎いたします。

開催趣旨

現代のWebサービスには多くの個人が参加できるQ&A、口コミ、SNS、ブログなどのサイトが数多くあり、これらを総称してCGM(Consumer GeneratedMedia)と呼ばれています。これらのサイトに書き込まれる情報は、大量の言語情報(テキスト)であるという性質以外に、集合的に有用な知識を含む、すなわち「集合知」(collective intelligence)であるという捉え方が広がってきています。また、WikipediaやWiktionaryなどのプロジェクトが目指すものは、まさに集合知の構築そのものと言えます。自然言語処理の技術はこのような集合知の構築の支援が可能であり、またWikipediaをはじめとして集合知と見なされるWebページから知識獲得を行う研究が注目されています。

また、このような集合知の考え方はWeb以外にも広がっています。企業や組織ではアンケートや医療情報など個人の考えや複雑な事情を言語化された言語情報が蓄積されており、こうした情報の断片からいかに有益な情報を獲得し集合知とするか、またはどのように活用できるのかが大きな課題となっています。

電子情報通信学会言語理解とコミュニケーション研究会では、これまでに集合知シンポジウムの第1回を広島市で、第2回を金沢市でそれぞれ開催し、多くの参加者と共に活発な議論を行うことができました。今回は第3回シンポジウムとして開催します。自然言語処理に関わる研究者・技術者が集合知とどのように関わってきたか、また今後どのように関わっていくべきかについて、昨年度に引き続いて同じ関心を持つ方々が議論・意見交換する場として企画しました。昨年度同様、多くの方々の参加をお待ちしています。

プログラム1日目:2月2日(木)

2. 情景写真へのテキスト書き込みを伴うインタビューによる行動知抽出法
  ○森 泰介・大澤幸生(東大)

  • 人が経験を重ねることによって身に付けた仕事のコツや、医者などの専門家が有する暗黙知を言語化することは、個人のパフォーマンスの最大化や技能伝承のために不可欠である。本研究では、人が1枚の情景の写真の中に写り込んだ対象へアノテーションを行う際に、関連する多様な経験を想起しうることに着目し、想起した経験の言語化とそれらの論理的なつながりへの気づきを促す適切な質問によって、暗黙知を行動シナリオとして抽出する手法を開発している。

3. 日本語版Wikipediaにおける執筆者の意図に着目した日中間の文化差検出手法の検討
  ○吉野 孝(和歌山大)・宮部真衣(東大)

  • 多言語間コミュニケーションにおいて,同一の単語を用いて会話をしている場合でも,相手の文化につい て十分に理解していないために,誤解が生じる可能性がある.現在,文化差の有無の判断は,人が行う必要がある が,その判断には相手の文化に関する十分な知識が必要なため,容易ではない.本稿では,文化差の検出手法として,日本語および中国語版のWikipediaを用いた日中間の文化差検出手法の検討を行った.

4. [招待講演]マイクロブログマイニングの現在
  ○奥村 学(東工大)

  • Wikipedia,Yahoo!知恵袋などのcQAサイト,口コミ(レビュー)サイト,ブログ,Twitterに代表されるマイクロブログ,AMT(Amazon Mechanical Turk)など,今やSocial Mediaあるいは「集合知」と称されるメディアは,WWW上に多種多様に存在する.本稿では,その中でも特に,近年爆発的な流行を遂げているマイクロブログを分析する技術を,ブログ分析技術と対照しながら,解説する.

(※ここで、研究賞2011年被表彰者の表彰式を行います)

5. チュートリアル&ディスカッション: 集合知言語処理の研究動向

  • 研究会幹事から集合知言語処理に関する研究動向の紹介を行った後、本テーマに関して幹事団や参加者との間で自由に議論を行います。

プログラム2日目午前:2月3日(金)

6. 物語生成システムのための名詞/動詞概念辞書の構築と応用
  ○大石顕祐・小方 孝(岩手県立大)

  • 筆者らの物語生成システムでは,物語の基本単位は,主に動詞概念と名詞概念から構成される事象概念である.そして,名詞及び動詞概念は,それぞれの概念辞書を背景に持つ.本発表では,現在開発中の名詞概念体系及び動詞概念体系(特に制約)の現状について紹介する.物語はそれ自体人類が蓄積してきた集合知の典型であり,ここで紹介する概念辞書を含む統合物語生成システムを通じて,筆者らは,断片情報の有機的構成などの集合知に関わる課題にも挑戦しようとしている.

7. ソーシャルメディア「Twitter」を利用した音声データ収集の試み
  ○嶋田浩希・西崎博光・関口芳廣(山梨大)

  • 本稿では,ソーシャルメディア「Twitter」を利用した音声データ収集について紹介する.近年の音声処理の研究において,大規模音声コーパスを用いた統計的学習に基づく手法が成果を挙げている.しかし,音声コーパスを作成するには大変な労力が必要である.そこで,ソーシャルメディアを用いて音声データを収集するために,音声インタフェースを備えたTwitterクライアントを構築した.本稿では,クライアントを利用した音声収集の枠組みや音声データの利用方法について述べる.

8. フォロー類似度によるTwitter高次数ユーザの関係分析
  ○小出明弘・斉藤和巳(静岡県立大)・鳥海不二夫(名大)・風間一洋(NTT)

  • Twitterにおいて、フォローネットワークでの高次数ユーザは、高い影響力を持つと考えて、フォロー類似度による高次数ユーザの関係を分析する。実験により、高入次数ユーザ間は、入・出リンクするノード集合の一致度の違いに基づき明確に分離できるが、高出次数ユーザ間には、そのような構造がないことがわかった。

9. [招待講演]ソーシャルゲームを実現するためのプラットフォーム 〜 10億人が夢中になるゲームを作り続けるための手法 〜
  ○松倉友樹・田中秀樹・藤本真樹(グリー)

  • グリー社は2007年にソーシャルゲームの提供を開始した.それ以降も数々のソーシャルゲームを公開し,2012年6月時点で2600万人以上のユーザに提供している.2012年4〜6月に全世界へ公開し,10億人が利用できるように現在システムを構築中である.GREEが発展した理由は,的確な分析による企画とその企画を高速に実現するためのシステムアーキテクチャを構築したことである.それにより,企画・分析・実装を迅速に行え,ユーザが楽しめる機能をいち早く提供できる.本稿では分析手法と,スケーラブルで高速にゲームを開発できるアーキテクチャであるGREE Technology Stackを紹介する.

プログラム2日目午後:2月3日(金)

10. 評価表現と文脈一貫性を利用した教師データ自動獲得によるクレーム文検知
  ○梅澤佑介・乾 孝司・山本幹雄(筑波大)

  • 近年のWebの普及により、Web上には商品やサービスについてのレビューが大量に存在する。このようなレビューからクレームを検知することができれば、ユーザにとっては不利益を未然に防ぐための情報として、企業にとってはマーケティングのための情報として、情報を活用することが期待できる。本研究では評価表現と文脈一貫性を利用して、Web上に存在する大量のレビューをもとに文レベルの教師データを自動獲得する方法を提案し、機械学習によって得られた分類器を用いてクレーム文の検知を行った。

11. Q&Aサイトで繰り返し一緒に回答を投稿するユーザ間での投稿順序の偏りの調査
  ○梅本顕嗣・石川尚季・西村 涼・渡辺靖彦・岡田至弘(龍谷大)

  • Q&Aサイトで繰り返し一緒に回答を投稿するユーザ間では、投稿の順序に著しい偏りがあるケースがある。そこで本研究では、Q&Aサイトで繰り返し一緒に回答を投稿するユーザたちを対象に、投稿順序に著しい偏りがあるユーザを検出し、その原因について検討した。

12. Webデータを用いた多言語用例対訳候補の抽出手法の検討
  ○福島 拓・吉野 孝(和歌山大)

  • 多言語間コミュニケーション支援のために多言語用例対訳の作成,収集が行われている.用例対訳の収集には翻訳者が不可欠であるが,翻訳者の負担が大きいため用例対訳の収集に支障が生じていた.そこで我々は,翻訳者の負担を下げるために,用例の対訳候補を既存の用例対訳,機械翻訳,Webデータなどを用いて抽出する手法を提案する.抽出された対訳候補は翻訳者による確認,軽微な修正を元に用例対訳として使用することを目指す.

13. 概念体系における移動と制約に基づく単一事象及びシナリオ生成
  ○張 一可・小野淳平・小方 孝(岩手県立大)

  • 広告,特にテレビコマーシャルは物語の宝庫であり,現代の神話ないし民話の様相を呈している.先行研究では,5000本以上のテレビ広告の分析により,人/物/動作などの「異化」によって多くの広告が作られていることが明らかにされた.本研究では,その知見を生成システムに利用し,名詞概念及び動詞概念の概念辞書の体系における移動や意味的制約の操作によって,上記の異化的処理を単一事象及びシナリオ系列を実現する機構を考察する.システムの使用法としては,多様な出力から気に入ったものをユーザが選んで加工するボトムアップな発想支援的な処理と,目標指向的な生成によるトップダウン的な処理の両者を想定している.

14. プロップ理論に基づくストーリーグラマーによるトップダウン/ボトムアップストーリー生成
  ○今渕祥平・小方 孝(岩手県立大)

  • ロシアの民俗学者プロップは民衆の集合的心性の一象徴としての民話の収集により、その共通構造を洗い出したことで有名である。本研究は、この研究成果を人工知能による物語生成システムと結合する。本発表では、開発中のプロップに基づく物語生成システムのうち、特にその中心となる一般的なストーリーグラマーの紹介を行う。この文法は階層的な生成文法形式を持ち、上位階層から下位階層へのトップダウン処理、下位階層から上位階層へのボトムアップ処理及び両者のハイブリッド処理が可能である。このシステムでは、文法の下位階層において多様な具体的知識を登録することが可能である。なお、このシステムは筆者らが開発中の統合物語生成システムの一機構として有機的に結合されることを意図して研究が進められている。

15. 状態‐事象変換に基づくストーリー生成機構
  ○小野寺 康・小方 孝(岩手県立大)

  • 物語は,それ自体人類が古くから蓄積してきた集合知の典型である.筆者らは現在統合物語生成システムを開発中であり,これを通じて,断片情報の有機的構成や単一情報の多様な解釈などの課題にも挑戦している.本発表で扱うのは物語生成の中で,生起した出来事すなわちストーリーを生成する機構の一部であり,概念辞書を背景に,ふたつの状態をひとつの事象と関連付けるルール群を開発した.自然言語処理の領域では,動詞概念の意味的分類やプランニングに基づく物語生成システムなどの話題と関連する.

参加方法

  • 本シンポジウムは本学会の会員・非会員に関わらずどなたでも無料で聴講することができます。
  • 参加は事前登録制となっています。参加をご希望の方は下記様式で必要事項をご記入ください。

参加申し込みフォーム

  • 一般参加の方の予稿集は有料です。詳しくは技術研究報告をご覧ください。

お問い合わせ

本シンポジウムは下記担当者が企画、運営しています。

  • 山本 和英 (長岡技術科学大学)
  • 金山 博 (日本IBM)
  • 竹内 孔一 (岡山大学)

本シンポジウムに係るすべての問い合わせ(上記ホテルに関するものを除く)は下記のメールアドレスにご連絡ください。

主催

電子情報通信学会(IEICE) 言語理解とコミュニケーション研究会NLC

専門委員長: 那須川 哲哉  副委員長: 山本 和英, 増市 博
幹事: 竹内 孔一, 柳原 正  幹事補佐: 西崎 博光, 金山 博

リンク

最終更新時間:2012年04月10日 11時34分02秒