メインメニュー




















第6回研究会
●第6回Webインテリジェンスとインタラクション研究会
日時 平成18年7月3日(月) 09:30〜17:25
   平成18年7月4日(火) 09:15〜16:00
会場 札幌コンベンションセンター 206会議室
  (札幌市白石区東札幌6条1丁目)
   http://www.sora-scc.jp/

→プログラム →チュートリアル →質疑応答議事録 →学生参加報告(PDF)

2007年7月3日(月),4日(火)に,札幌コンベンションセンターにて,「第6回Webインテリジェンスとインタラクション研究会が開催されました.今回から講演時間30分のロング発表に加えて,講演時間12分のショート発表も設けました.13件のロング発表と,同じく13件のショート発表があり,過去最多の発表件数となりました.全体の参加者も71名でした.一般講演では,オープンなWebを対象に,実際に動くシステムまで実装した発表が多く,大変盛り上がりました.また,チュートリアルでは,「自然言語処理技術と評価型ワークショップの動向」を取り上げました.NTCIRなどの評価型ワークショップに深くたずさわってこられた先生方から,自然言語処理の基礎的な知識から,評価型ワークショップにおけるテストコレクションについて,そして最新の結果まで報告いただきました.懇親会は,豪華絢爛「カニのフルコース」で,お腹いっぱい北海道のカニをいただきました.




気合の入ったポスター


熱心に聞き入る参加者の皆様


今回はじめて行われたショート発表

温かみのある質疑応答


豪華絢爛・能舞台のあるお座敷


カニの足で遊ぶ参加者の皆様
発表者の方には,写真掲載の許可をいただきました.ありがとうございました.
 
───────
プログラム案内
───────
■7月3日(月)
09:30-09:45 開会の挨拶

09:45-11:45 セッション1(ロング発表):テキストマイニング
座長:関 洋平(豊橋技術科学大学)
副座長:櫻井 茂明(東芝)
1.大域ウェブアクセスログとウェブコミュニティを用いたトピックに
  関連する検索語群の発見法
  大塚 真吾,喜連川 優(東京大学)
2.共起状況の包含関係に基づく関連語の抽出と検索支援への応用
  山本 英子 井佐原 均(NICT)
3.グループ学習モニタリングを目的とするインテリジェント
  ヒューマンセンシングに基づく時系列データマイニング手法
  青野 雅樹,関口 雄祐,鈴木 尚也,安田 好文,関 洋平
  (豊橋技術科学大学)
4.メタデータを利用したコンテキストによるコンテンツ抽出実験
  嶋津 恵子,齋藤 功,吉永 早織,古川 康一(慶應義塾大学)

13:00-15:30 セッション2(ロング発表):情報検索とインタフェース
座長 山田 和明 (東京大学)
副座長 羽野仁彦(リクルート)
5.An Object-Based Navigation Interface for VRML/X3D Contents
  三宅 芳博,木原 建行,荒屋 真二(福岡工業大学)
6.連鎖検索と近傍検索に基づくWebコンテンツへの効率的なアクセス方法
  石谷 康人,鈴木 優,布目 光生(東芝)
7.Gards-変化し続ける興味に対応する情報探索
  大坪 五郎(デンソーアイティーラボラトリ)
8.発信者と閲覧者の情報を用いたブログのナビゲーションインタフェース
  川口 克則,定方 徹,奥田 英範(NTT)
9.Webにおけるバランス感覚のある情報推薦方式の提案
  河合 由起子(京都産業大学),熊本 忠彦(NICT),田中 克己
  (京都大学)

15:45-17:25 セッション3(ショート発表)
座長:土方 嘉徳 (大阪大学)
副座長:大塚 真吾 (東京大学),加藤 文彦 (慶應義塾大学)
10.テキストマイニングを用いた意思決定支援システム
  王 広為,荒木 健治(北海道大学)
11.コンテキストに応じたWEB閲覧情報提示システムの開発
  森田 哲之(NTT サイバーソリューション研究所),
  Tian Luo Hao (University of waterloo),
  加藤 泰久(NTT サイバーソリューション研究所)
12.画像とテキスト情報を用いた雰囲気レコメンデーション
  太田 将行(セントラルコンピューターサービス),
  中川 聖(セントラルコンピューターサービス),
  羽野 仁彦(リクルート),橋場 一郎(リクルート)
13.トラックバックを用いた研究レポートのソーシャル化
  宮崎 真,廣安 知之,三木 光範(同志社大学)
14.位置情報を用いたブログサービス"ろぐの細道"の提案
  星野 厚,岡 瑞希,加藤 和彦(筑波大学)
15.寄り道おすすめサービスのための時刻別ユーザ行動の考察
  吉田 由紀,定方 徹,奥田 英範(NTT)
16.地域店舗のネットメディアへの出稿状況と消費者の検索動向に
  関する報告
  羽野 仁彦(リクルート)
17.匿名P2Pネットワークを利用したWeb閲覧履歴共有方式の提案
  井口 誠(フランステレコム, 早稲田大学),後藤 滋樹(早稲田大学)


■7月4日(火)
9:15-11:15 チュートリアル
 「自然言語処理技術と評価型ワークショップの動向」
  司会:難波 英嗣(広島市立大学)
T1.テストコレクションを用いたテキスト自動要約研究の現状
  難波 英嗣(広島市立大学),
  平尾 努(NTTコミュニケーション科学基礎研究所),
  奥村 学(東京工業大学)
T2.質問応答技術
  福本 淳一(立命館大学)
T3.テストコレクションを用いたWeb情報検索システムの分析
  吉岡 真治(北海道大学/国立情報学研究所)

11:30-12:30 セッション4(ショート発表)
座長:高間 康史 (首都大学東京)
副座長:井口 誠 (フランステレコム株式会社),坂本 比呂志 (九州工業大学)
18.コンテキストデータ問い合わせ言語CQLの提案
  官上 大輔(NICT)
19.感想情報を用いた注目情報付加・利用方式の改良
  大浦 啓一郎,森田 哲之,日高 哲雄,田中 明通,加藤 泰久(NTT)
20.質問応答における知識源選択規則の自動獲得と適用
  亀山 恵祐(北海道大学),荒木 健治(北海道大学),
  木村 泰知(小樽商科大学)
21.動向情報に対する変化要因の抽出手法
  山本 健一,谷岡 広樹,殿井 加代子(ジャストシステム)
22.つながりを支える緩やかなコミュニケーションメディアの実現に
  向けて
  赤塚 大典
 (フリーランスプログラマ)

13:45-15:45 セッション5(ロング発表):ニュース配信とトピック分析
座長:大坪 五郎(デンソーアイティーラボラトリ)
副座長:河合由紀子(京都産業大学)
23.掲示板サイトに内在する注意スレッドの分析法
  櫻井 茂明、折原 良平(東芝)
24.携帯向けオンラインニュース配信のための視聴履歴に基づく
  嗜好クラスタ管理手法の検討
  大槻 一博(NHK放送技術研究所),服部元(KDDI研究所),
  帆足 啓一郎(KDDI研究所),星野 春男(NHK放送技術研究所),
  菅谷 史昭(KDDI研究所)
25.ニュース番組自動生成システムwEEによる記事印象の伝達度評価
  熊本 忠彦(NICT),灘本 明代(NICT),田中 克己(京都大学)
26.ウェブ検索APIとトピック主導型クローリングに基づく
  ロボット型住所関連情報検索システム
  藤本 典幸,森本 泰貴,長屋 務,萩原 兼一(大阪大学)

15:45-16:00 閉会挨拶
 
───────────────────
チュートリアル「自然言語処理技術と評価型ワークショップの動向」概要
───────────────────
司会:松下 光範(NTTコミュニケーション科学基礎研究所)
現在の自然言語処理技術の発展は,明確なゴールを設定し,日々提案される
様々な技術を,共通の条件の下にフェアな評価を行えるようにした,評価型
ワークショップのおかげであると言っても良いかもしれません.評価型
ワークショップの課題は,現在の自然言語処理技術の最先端を表している
ものとも言えます.しかし,直接に自然言語処理の基礎的な方法論を研究
対象としていない研究者にとっては,いったいそこでどのようなタスクが
設定されているのか,現在の技術ではどこまで達成可能なのかということを
知らないでいます.本チュートリアルでは,NTCIRなどの評価型ワークショップ
に深くたずさわってこられた先生方から,自然言語処理の基礎的な知識から,
評価型ワークショップにおけるテストコレクションについて,そして最新の
結果まで報告いただきます.

「テストコレクションを用いたテキスト自動要約研究の現状」
難波 英嗣(広島市立大学)

近年,自然言語処理に関連する様々な研究分野で,テストコレクションと呼ば れる大規模な実験用データセットが構築されており,これらを用いた研究が活 発に行われるようになってきている.このような研究分野のひとつにテキスト 自動要約がある.本講演では,まず,テキスト自動要約に関する国内外のテス トコレクション構築プロジェクトについて述べる.次に,テストコレクション を用いた研究の現状を報告する.最後に,利用可能な要約システムや評価ツー ルを紹介する.

「質問応答技術」
福本 淳一 (立命館大学)

大量の組織化されていない情報から自然言語で記述された任意の質問を与える ことで答える得る技術として質問応答技術がある.一般にこのような質問に対 する回答を得るためには,質問文がどのような内容を尋ねているのかの質問タ イプを決定し,質問文から得られたキーワードにより検索された文書から質問 タイプに応じた要素を回答として抽出するといった手法が多く用いられている. 本講演では,質問応答技術に関する各要素技術について解説するとともに,質 問応答技術に関する評価ワークショップで設定されたタスクや関連研究につい ても紹介する.

「テストコレクションを用いたWeb情報検索システムの分析」
吉岡 真治 (北海道大学/国立情報学研究所)

異なる情報検索システムを客観的な指標に基づいた分析を行うために、検索対 象となる文書・検索課題・関連文書リストの3つにより構成されるテストコレク ションを用いた研究が行われている。このようなテストコレクションの多くは、 TRECやNTCIRに代表される評価型ワークショップの結果に基づき作成されている。 これらのワークショップでは、情報検索システムに関連する研究課題の変遷に 対応する形でタスクを定義し、様々な研究者のニーズに答えるテストコレクショ ンを作成している。本講演では、これらのワークショップで取り扱われている Webを対象としたタスクと関連研究を紹介することにより、Web情報検索システ ムの研究の方向性を紹介する。

 
───────
質疑応答議事録
───────
■7月3日(月)
09:45-11:45 セッション1(ロング発表):テキストマイニング
座長:関 洋平(豊橋技術科学大学)
副座長:櫻井 茂明(東芝)

大域ウェブアクセスログとウェブコミュニティを用いたトピックに関連する検索語群の発見法
 ○大塚 真吾・喜連川 優(東京大学)
概要
サイバー空間上では多くの人々が自分の欲しい情報を探すために検索サイトを利用する. 検索技術の進歩により検索精度は向上し,自分が調べたい事柄を検索語として入力する だけで様々な情報を得ることが可能となった. 多くの人が入力した検索語を解析することで,世の中のニーズや動向,流行などを把握 することが可能である. そこで,本稿ではテレビ視聴率調査と同様,統計的に偏りなく抽出された日本人(パネル) を対象にURL履歴の収集を行う大域ウェブアクセスログ(パネルログ)とウェブコミュニ ティの技術を用いてトピックに関連する検索語群の発見法の提案を行い「あるトピックに おけるユーザの興味」を把握するツールの実装を行う.
Keywords: 関連語発見,検索語クラスタリング,ウェブアクセスログマイニング,ウェブコミュニティ.

質疑応答議事録
聴講者からラベルと検索語の違いに関する質問がなされ、発表者からコミュニティを発見 してその空間の中から広めに検索語を取ってくるといった回答がなされた。また、他の 聴講者からキーワードを入力としてコミュニティを出力として返しているのかとの質問 がなされ、発表者から同一の検索語を入力した人がどういったものに興味を持っている かを提示し、情報検索におけるユーザ支援を行いたいとの回答がなされた。また、他の 聴講者から年齢などのユーザプロファイルを活用しているのかといった質問がなされ、 発表者から個人情報の保護の関係、プロファイルで分けることによるデータ数の減少の 問題から利用は難しいとの回答がなされた。また、時系列的なコミュニティの変遷を 考慮しているのかとの質問がなされ、発表者から別グループで実施しており、変遷を トレースできれば検索語の拡張に利用できるとの回答がなされた。また、他の聴講者から コミュニティに辿り着くまでの3クリックの情報を利用していることの妥当性に関する 質問がなされ、発表者から連続検索している際に困っているところを検出できればよいが、 直近ではクリック数を変えた評価実験を行いたいとの回答がなされた。
共起状況の包含関係に基づく関連語の抽出と検索支援への応用
 ○山本 英子・井佐 原均(独立行政法人 情報通信研究機構)
概要
検索支援技術の研究の一環として,興味深く情報豊かなWebページにユーザを誘導するのに 有効な検索語の集合をWeb文書から自動抽出することを試みた.大量文書から語彙の階層構 造を自動抽出する手法を拡張し,意味的関連性を持つ用語の集合(関連語セット)を自動獲得 する手法を開発した.この手法を用いて,医療分野のWeb文書集合から,医学用語を対象と した関連語セットを抽出した.その有用性を検証するために,得られた関連語セットを用いて, 実際にGoogleで検索を行った.その結果,この手法がユーザを有益なWebページに誘導しうる 関連語の集合を抽出できることがわかった.
Keywords: Web検索,検索支援,関連語抽出,医学用語.

質疑応答議事録
聴講者から抽出されたものが内容として役に立つものであるのかといった質問がなされ、 発表者から内容の評価は現在実施中であるが、一部有効なものは発見できているとの 回答がなされた。また、絞り込まれたキーワードの出現頻度の差の影響はあるのかと の質問がなされ、その影響はあるものの、関連語は他のウェブページと別のことろから 収集しており、ユーザの思いつかない語を収集しているため、現状の方法で良いと 考えているとの回答がなされた。また、他の聴講者から因果関係を特定するキーワード はあったかとの質問がなされ、発表者から因果関係を示すヒット例の紹介がなされた。 また、一文の解析になっているのではないかとの質問がなされ、文を跨って連結する ことも可能との回答がなされた。また、他の聴講者から絞り込みに利用するカテゴリー をどのようにして与えるのかとの質問がなされ、シソーラスではカテゴリー別に階層を 作成しており、識別番号をみるとこによりカテゴリーが分かるようになっているとの 回答がなされた。
グループ学習モニタリングを目的とするインテリジェントヒューマンセンシングに基づく時系列データマイニング手法
 ○青野 雅樹・関口 雄祐・鈴木 尚也・安田 好文・関 洋平(豊橋技術科学大学)
概要
Web2.0世代では、SNS環境下で、集団のモニタリングが重要な要素技術のひとつであると考えられる。 我々は、スマートクラスルームHIBALISと称するセンサーネットワークとマイニングを統合した システム構想のもと、複数の学生に対してウェアラブルなセンサのプロトタイプを装着してもらい、 仮想授業を行い、生体信号時系列データを収集した。 本報告では、こうして得られた時系列データからのマイニング手法を論じ、「知的作業」 (集中度)「リラックス状態」「眠気」などの主観的な尺度を時系列データから抽出する 手法とその実験結果を報告する。
Keywords: 時系列データマイニング、センサ、マルチモーダル生体信号.

質疑応答議事録
聴講者から生体情報による人間計測の研究は従来からあるが新たに分かったことは あるのかといった質問がなされ、発表者から睡眠に関しては分かっていることは 比較的多いが、教室で眠気を催したところをマイニングしたいとの回答があった。 また、計測する磁極の数による違いに関する質問がなされ、発表者から今回は13点の 磁極を利用しているが、個人差もあるので、今後は個人差や計測機器によらない方法を 検討していきたいとの回答がなされた。また、他の聴講者からユーザの行動時における 気分を計測できるような機器は存在しないのかとの質問がなされ、発表者からその ようなことの計測を目指して研究を行っているとの回答がなされた。
メタデータを利用したコンテキストによるコンテンツ抽出実験
 ○嶋津 恵子・齋藤 功・吉永 早織・古川 康一(慶應義塾大学)
概要
IT 技術の進化と実用化に伴い、知識や情報の伝達媒体がデジタル化されネットワーク 共有が可能になった。専門領域別のアーカイブの充実はますます進みつつあるが、 これらは専門家もしくは専門家と同等の知識を持っている利用者による活用を前提と している。一方現在企業におけるEnterprise Contents Management(ECM)システムの 活用の問題の一つは、部門や専門領域を超えての情報や知識の共有と活用である。 同様に学術領域では、学際的な研究の創発や進展が期待されている。我々はこう いった背景を受け、専門分野を横断したコンテンツの共有を実現するフレームワークを 考案し、学術版(ECM)システム上に実装し評価をおこなった。
Keywords: コンテンツ流通、コンテキスト、5W1H+H.

質疑応答議事録
聴講者から今回の発表におけるコンテキストの意味に関する質問がなされ、コンテンツと コンテンツがつながって意味をなしたものをコンテキストと呼んでいるとの回答がなされた。 また、他の聴講者から違う分野の人たちが他の分野のことを調べる際には、その手前の 支援が必要ではないのかとの質問が、発表の際に紹介された「開発独裁」という例を 引き合いにしてなされた。発表者からは、「開発独裁」という語を調べるきっかけと なったエピソードに関する紹介が行われた。また、他の聴講者からメタデータを付与 することの難しさに関する質問がなされ、コンテンツの中身を詳しく記載している ページをURLとして指定し、その中から自動抽出したものをメタデータとして利用する 方法を現在実験中であるとの回答がなされた。また、他の聴講者から検索システムを 使う際のユーザの状況に関する質問がなされ、発表者から現状そこまでは考えていない が、文学部の美学のコンテンツに高校生が辿り着く実験を予定しており、それらの結果 を踏まえて検討していきたいとの回答がなされた。
13:00-15:30 セッション2(ロング発表):情報検索とインタフェース
座長 山田 和明 (東京大学)
副座長 羽野仁彦(リクルート)

An Object based Navigation Interface for VRML/X3D Contents
 ○Yoshihiro Miyake, Makoto Takeishi, Shinji Araya(Fukuoka Inst.of Tech.)
概要
本論文はダウンロードしたVRML/X3Dコンテンツ内にあるオブジェクトの階層メニューを 自動生成し,メニュー選択時にその適切な視点を計算するナビゲーションインターフェース を提案する.これはオブジェクトがアニメーションにより動いているときには視点も同じ ように動くため,オブジェクトを追跡しているように見える.またオブジェクト名から ターゲットを検索・表示する機能も持っている.オブジェクト名を記述するための新しい VRMLノードと実験システムによる実験的評価についても述べる.
Keywords: 仮想環境,ナビゲーションインターフェース,メニュー生成,コンテンツ検索,VRML

質疑応答議事録
VRMLにオブジェクトを追加する手間はどのくらいかという質問がなされ、 修正する手間は、簡単で手動で機械的にできるとの回答がされた。今回の 手法のXML版も実施予定があるかという質問に対し、予定しているという 回答がされた。他の聴講者から、マップベースとオブジェクトベースの 使い方の違いは何か?という質問がされた。それに対しては、マップは 全体把握を行えるのに対し、オブジェクトベースだと、目的の情報に たどりつきやすいという回答がされた。オブジェクトの命名に負荷がかかる のではないかという質問に対しては、今後、コンテンツ製作者サイドを 支援する仕組みを作り、負荷を軽減したいとの回答がされた。
連鎖検索と近傍検索に基づくWEBコンテンツへの効率的なアクセス方法
 ○石谷康人・鈴木優・布目光生(東芝)
概要
本論文では、目的とするWebコンテンツ に効率良くアクセスできる新しい情報アクセス方法を提案する。本方法は、 Webブラウザ上で閲覧している文書を起点として関連文書を次々にたどる 連鎖検索、検索・閲覧・スクラップの履歴に基づいてターゲット情報にアク セスする近傍検索、連鎖検索と近傍検索をシームレスに連携するペンインタ フェースで構成されている。連鎖検索は、閲覧文書上でユーザがアンダー ラインを引いた語句と周辺の語句の意味に基づいてユーザの検索意図を推定 すると共に、ユーザインタラクションで確定した検索意図に基づいて検索 クエリを拡張することにより絞り込み検索を実施する。近傍検索は、情報 アクセスの際に、検索、閲覧、スクラップの履歴情報を保持すると共に、 時系列に可視化した履歴ビューから任意の過去の情報アクセスとその近傍の 情報アクセスに立ち戻ることによりターゲット情報にアクセスする。ペン 操作による連鎖検索と近傍検索の連携では、直感的で簡便な操作性、検索の リトライ、スクラップ元の参照、再スクラップなどの作業をシームレスに 実施できるようになっている。
Keywords: Webアクセス、情報検索、連鎖検索、近傍検索、インタラクティブ検索、ペンインタフェース

質疑応答議事録
意味クラス解析の精度についての質問がされ、ビジネス向けなどの検索対象を 限定した場合は、適合率が70%〜75%との回答がされた。また、新しい 言葉の意味クラス解析はどうするのかという質問に対しては、未知語の近傍 を調べることで対応したいとの回答があった。他の聴講者からは、携帯電話 向けのインターフェイスの予定について質問され、発表者から、ぜひチャレ ンジをしたいとの回答があった。ペン操作においてドラッグなどは難しいの ではないかという質問に対しては、マウスよりも使い勝手が悪くなるケースが あり、ペンにおける問題点は現在、洗い出している途中であるとの回答がされ た。今回の研究は、インターフェイスが有効なのか、作った知識が有効なのか という質問があったが、発表者からは、完全にどちらが有効かと分割するのは 難しいとの回答があった。
Gards−変化し続ける興味に対応する情報探索
 ○大坪五郎(デンソーアイティーラボラトリ)
概要
情報推薦システムに関する研究は多くなされているが、その多くはユーザの 興味の変化が頻繁に、しかも相互に矛盾するような方向に起こることを考慮 していない。ユーザの興味は目にはいったものに大きく影響されるという 想定の元、ユーザ興味に関しての深い推論を行うよりもできる限り多くの 情報を提示することを目標としたシステムGardsを開発した。初期段階の評価 結果からは、ユーザの興味が頻繁に変更されるという前提が裏付けられ、かつ システムはそのような場合にも効果的に情報を推薦できることが確認できた。
keywords: GUI情報推薦

質疑応答議事録
ピックする対象として写真 値段 名前に限定しているので他情報はないかと いう質問に対して「カロリー」はあると考えていて、もっと深い情報が必要と 考えているとの回答があった。また、実用化についての質問に対しては、データ の更新が追いつけば可能であるという回答があった。他の聴講者から9個に写真 を絞り込んだ理由についての質問があった。これに対しては、ヒューリスティッ クで評価した結果9個ぐらいになったとの回答があった。類似した料理写真を 持ってくる際の良く効く特徴量はなにか?という質問がされたが、特に効く特徴量 はわからないが、成分はもっと減らした方が良いかもしれないとの回答があった。 あいまいな検索からダイレクト間乳ピレーションで絞り込んでいくプロセスは ユーザーにどのような影響を与えるのか?という質問に対しては、今後、考えて 行きたいとの回答があった。
発信者と閲覧者の情報を用いたブログのナビゲーションインターフェイス
 ○川口克則・定方徹・奥田秀範(NTTサイバーソリューション研究所)
概要
膨大なブログ情報の中から,興味を持つブログ,ブロガを発見したいユーザにとっては, 検索等,既存の手法ではその目的を達成することは困難である. そこで本稿では,ユーザがブログを探索し,興味を持つブログ,ブロガを発見するための, 発信者と閲覧者の情報を用いたナビゲーションインタフェースを提案する. 提案インタフェースのプロトタイプシステムに対して2種類の実験を行うことで, インタフェースの有効性の確認と,今後の課題の抽出がなされた.
keywords: ブログ,視覚化,ナビゲーション,興味喚起

質疑応答議事録
実際の利用イメージはあるかという質問に対して現在は、まだ利用イメージが ないが、新しいブログを探す上では、役に立つかもしれないとの回答があった。 アクセス順位はあまり変わらないのでは?という質問に対しては、上位50位が 入れ替わるのは1日2件程度であり、上位に関してはあまり変わらない。指摘 どおりであるとの回答があった。トラックバックやコメントなどのブログらしさ がないのでは?という質問が他の聴講者からされた。これに対しては、ブログの 中で、トラックバックなどを利用しているケースが少ないとの回答があった。
WEBにおけるバランス感覚のある情報推薦方式の提案
 ○河合由起子(京都産業大学),熊本忠彦(NICT),田中克己(京都大学)
概要
本論文では,興味語ごとに,ユーザが閲覧する度に変化する閲覧特性 (閲覧した記事群の重心印象ベクトル)の推移を観測するとともに,その閲覧 特性と未読記事の印象ベクトルとを比較することで,バランスの良い情報閲覧 を可能にする記事推薦方式(Fair News Reader:FNR)を提案する.
keywords: 個人適応,公平性,情報推薦,ユーザモデル,印象マイニング

質疑応答議事録
なぜ印象ベクトルを利用したのか?異なるカテゴリーのニュースでも良いので はないか?という質問に対しては、共起を利用しただけでは、思うように分類 することができない。との回答があった。他の聴講者から、なぜプルディックの 心理学を利用したのか?という質問に対して、複雑な感情を単純化しているので ベクトルを用いる計算に使いやすいとの回答があった。印象ベクトルを利用して 相反するニュースを見せたときのユーザー反応はどうかという質問に対しては、 ユーザーの反応はアンケートを取っていないので不明であるとの回答がされた。
15:45-17:25 セッション3(ショート発表)
座長:土方 嘉徳 (大阪大学)
副座長:大塚 真吾 (東京大学),加藤 文彦 (慶應義塾大学)

テキストマイニングを用いた意思決定支援システム
 ○王 広為,荒木 健治(北海道大学)
概要
Recently, the acquisition and analysis of text have attracted much attention. How to obtain and analyze the large and varied text sources with reputation information, for instance questionnaires, Internet bulletin boards and call center consumer opinions, is an important question. The related works show that most research only classifies the opinions into bipolar orientation. In contrast to these, this study proposes a decision support system using Text Mining technology to extract and analyze the opinion information automatically from blog.
Keywords: Text Mining, Opinion Mining, Text Classification, Decision Support System

質疑応答議事録
対象のユーザが具体化されていないという質問に対しては,対象は一般のある商品を欲しい と思っている人という回答があった.また,ユーザと対話するには値段重視,売れ筋商品, ユーザの状況など,対話するためのひな形が必要であるし,単純に良いか悪いかだけではなく, 何が評判が良いかなどを対話で考慮して,商品を薦める必要があるのではないかという質問に 対して,現在は価格が高いなど,対話自体が単純だが,複雑なものにも対応できるようにしたい という回答があった.また,買う商品が限定されると属性と属性値のような単純なものが決定 できるため,対話のインタラクションがなくなり良いかもしれないというコメントがあった.
コンテキストに応じたWeb閲覧情報提示システムの開発
 ○森田哲之 (NTT サイバーソリューション研究所), Tian Hao Luo (University of waterloo), 加藤 泰久 (NTT サイバーソリューション研究所)
概要
ブラウジング中のWebページからコンテキストを抽出し、 コンテキストに関連する過去に閲覧したWebページを自動 的に検索/提示するシステムを開発したので、その概要を 紹介する。検索結果はトピック毎に表示され、マウスのみ でコンテキストを修正できる特徴を持つ。同時に、簡単な パフォーマンス評価も行い、問題点を抽出した。
Keywords: デスクトップ検索、プロファイリング、コンテキスト、クラスタリング.

質疑応答議事録
聴講者より,コンテキストを取得するのにTF/IDFの上位10個を用いるとしているが,広告などが ある場合はうまくいかないのではないかという質問があり,コンテクストの取得精度は良くなく, 一回で出すのは難しいため,マウスなどで絞り込むなどの修正ができるようになっているという 回答があった.また,リアルタイムでTF/IDFを調べて出すのは時間かかるのではないかという 質問に対しては,検索するたびに単語を追加していくため,インデックスの追加一回分多いだけで, 追加した後は同じ時間でできるという回答があった.また,他の聴講者からは,使用履歴から, 長く見ている,同じ時間に見ている,頻繁に見ているなどのクラスタリングなどをしているのか という質問に対しては,個々の技術のステップアップは今後行っていきたいという回答があった.
画像とテキストを用いた雰囲気レコメンデーション
 ○太田将行 (セントラルコンピューターサービス), 中川聖 (セントラルコンピューターサービス), 羽野仁彦 (リクルート), 橋場一郎 (リクルート)
概要
雰囲気を考慮した店舗の推薦システムを支援する類似店舗検索の性能を 被験者アンケートによって評価し,店舗推薦システムへの有効性を調査した. その結果,雰囲気を考慮した店舗推薦システムへの有効性を確認した.
Keywords: レコメンデーション,画像分析,文章解析,類似,雰囲気。

質疑応答議事録
雰囲気で推薦するには情報が少ないのではないかという質問に対しては,文章の部分から 重要文を抽出し,似ているお店かどうか判断することで行っているという回答があった. また,他の聴講者より,画像と紹介文両方用いることの有用性について質問があったが, 画像だけで行うと,絵柄が似ていても実際にはジャンルの異なる店がでてしまうことが あるという回答があった.それに対し,テキストのほうがより効果があるのかという質問 があったが,アンケート結果によると,テキストのほうが効いているかもしれないという 回答があった.その他,近傍検索は画像や音楽など決定的な判断基準がない分野が多いが, この場合座敷があるかどうかなど決定的なものが多いため,使うとどうかという質問に対 しては,様々な尺度・観点の属性を増やしていく方向で考えているという回答があった.
トラックバックを用いた研究レポートのソーシャル化
 ○宮崎真, 廣安知之, 三木三範 (同志社大学)
概要
雰囲気を考慮した店舗の推薦システムを支援する類似店舗検索の性能を 被験者アンケートによって評価し,店舗推薦システムへの有効性を調査した. その結果,雰囲気を考慮した店舗推薦システムへの有効性を確認した.
Keywords: レコメンデーション,画像分析,文章解析,類似,雰囲気。

質疑応答議事録
聴講者より,外部からつなぐ方法としてトラックバックが最適なのか,例えば企業の人が ブログから直接トラックバックをするというのは余り考えられないのではないかという質問 に対しては,一部のユーザしか使っていないツールという認識はあるが,企業の人でレポート をチェックしている人がいるため,検索などが有効にできれば,トラックバックの活用として 見られるのではないかという意識はあるとうい回答があった.また,個人ごとにページを もっていることを想定しているのだろうが,企業の人は情報開示を行わないし,その人のページ を探しても見つからないことも多いため,企業の人が欲しい情報を調査してから作った方が 良いというコメントがあった.
位置情報を用いたブログサービス"ろぐの細道"の提案
 ○星野 厚,岡 瑞希,加藤 和彦(筑波大学)
概要
本稿ではブログのような時事性の高い情報と地図情報,位置情報を組みあせた システム「ろぐの細道」を提案する. このサービスはいつでもどこでも手軽に自身の位置情報を発信でき、 地図上で位置情報の推移を時系列順に再生できるインターフェースを有し、 位置情報の相互関係性を提示するインターフェースを有するシステムである。
Keywords: ブログ、位置情報、GIS、GPS、サービス

質疑応答議事録
聴講者からYahoo!がFlickrと携帯端末を使った「ZoneTag」というシステムを知って いるかという質問がなされ、発表者から知らないという回答がなされた。また、別の 聴講者からは弊社がやっているシステムはインターフェースが悪く、その原因は検索 システムにありました。今回提案されたシステムでも便利な検索システムが有効であ ると思うのでがんばって欲しいというコメントがあった。
寄り道おすすめサービスのための時刻別ユーザ行動の考察
 ○吉田 由紀,定方 徹,奥田 英範(NTT)
概要
著者らは出発地点と目的地点,およびその間の経路が設定された際に,それら周辺に ある寄り道可能な情報を表示するサービスを検討している.本報告では,移動途中で 余裕時間が生じた際に,ユーザがどのような行動をとるのか,時刻別,余裕時間別に 調査したので,その結果について報告する.
Keywords: 寄り道,時刻別,余裕時間,ナビゲーション,レコメンデーション

質疑応答議事録
聴講者から待ち合わせまでに60分以上の時間があるときに、待ち合わせの時刻がお昼 過ぎと夕方のどちらの場合でも喫茶店よりもレストランが多いのは何故かという質問 に対して、発表者は外出頻度が高い人ほどレストランで時間を潰す傾向がある。多分、 食事をとるのではなく喫茶店と同じような時間の潰し方をしている可能性が高いとの 回答がなされた。また、別の聴講者からは60分も前に待ち合わせ場所近辺に到着する ことはあまりないのではという質問があり、それに対して発表者は、待ち時間の平均 時間は仕事で15分、プライベートで10分という結果が出ている。待ち時間が長い場合 の調査を行ったのは出張など前もって調べておく必要な場合の利用を考えているから だという回答がなされた。
地域店舗のネットメディアへの出稿状況と消費者の検索動向に関する報告
 ○羽野 仁彦(リクルート)
概要
本稿では, 一般消費者向けの地域店舗のWeb への情報発信の実態と, 消費者の地域に 関する検索の実態の調査結果を報告する。 本調査によって,地域店舗のWebへの情報発信量は, マクロ的に見ると地域格差はないが, 都市単位のミクロ的に見ると, 都市の性質により格差があることがわかった.
Keywords: 地域情報,検索,広告,調査,メディア

質疑応答議事録
聴講者から都市タイプによる情報発信状況の違いのところで、Webでの情報発信が 多いのは観光地であると述べているが、実際には湯布院や草津など温泉地の地名 が多いので観光地というようりはむしろ温泉地とった方がいいのではという意見 がでた。これに対して発表者は温泉地だとは気付かなかったと回答をした。また、 別の聴講者からはPCのページと携帯向けのページで傾向が異なるのではという質問 がなされ、これに対して、携帯向けのページは横浜アリーナなど待ち合わせ場所に なりえるところが多いと回答した。他に聴講者から電話番号だけで検索をした場合 とお店の名前だけで検索したときの違いについての質問があり、これに対して発表 者は検索結果の総ページ数は電話番号の場合は4,000万URL、店名の場合は1-2億ペー ジもあり、しかも、店名の中に一般に良く使われる言葉がある場合は精度が非常に 低くなるという回答がなされた。
匿名P2Pネットワークを利用したWeb閲覧履歴共有方式の提案
 ○井口 誠(フランステレコム, 早稲田大学),後藤 滋樹(早稲田大学)
概要
ネット上のWebページ数は,年々爆発的に増加している.同時に,Webを利用 するユーザの層も多種多様化している.結果,キーワード検索をベースと した従来型のWeb情報抽出アプローチでは,求めるWebページを発見すること ができないユーザが増加している. 本稿では,このような状況を鑑みた新たなWebページ推薦手法の実現方法を 検討する.提案手法では,ユーザのWeb閲覧の意図を把握可能なユーザプロ ファイルの構築と,これを用いた適切なWebページ推薦戦略の選択の実現を 目指す.また,Web閲覧履歴をユーザ間で安全かつ効率的に共有するための 手法として,匿名P2Pネットワークの利用を採用する.
Keywords: 情報推薦,ユーザプロファイル,協調フィルタリング,内容に基づくフィルタリング,ピアツーピア

質疑応答議事録
聴講者から閲覧履歴は匿名でも個人を特定する集中局的なものがないとシス テムとして辛いのではという意見があり、これに対し発表者は検索を効率的 にすることで、集中局がなくても実現可能だと回答した。また、他の聴講者 からは匿名だと自分の宣伝などに利用されるのではという質問があり、これ に対して、検討事項だと認識している。集中局の場合は取り締まりやすいが、 今回のようば分散環境においては今後の課題になるという回答がなされた。 最後に、聴講者から不正なプロファイルを作る人が多くホットな研究課題な のでがんばって欲しいというコメントがあった。
■7月4日(火)
11:30-12:30 セッション4(ショート発表)
座長:高間 康史 (首都大学東京)
副座長:井口 誠 (フランステレコム株式会社),坂本 比呂志 (九州工業大学)

コンテキストデータ問い合わせ言語CQLの提案
 ○官上 大輔(NICT)
概要
アブストラクト:コンテキストアウェアシステム構築のためには,センサなど からデータを収集し,コンテキストデータ構築するコンテキストデータ獲得のた めのモジュールが設けられることが多い.本研究では,そのデータ獲得モジュー ルから,各コンテキストアウェアシステムがコンテキストデータを取得するため のクエリ言語CQL(Context Query Language)を提案する.
keywords: コンテキスト,コンテキストデータ,クエリ言語

質疑応答議事録
聴講者よりアプリケーション側とプラットフォーム側での役割分担に関する 質問があった.まず,プラットフォーム側の役割としてデータのみを返すこ とに専念させ,あまり高度な機能を持たせない方がよいのではないかとの指 摘があり,これに対してプラットフォーム側がある程度抽象的なレベルでコ ンテンツ提供の妥当性を判定できることは有益であるとの回答が発表者より なされた.さらに,聴講者より各端末はユーザのいる環境を把握しているこ とから,アプリケーション側で妥当性判定を行うべきなのではないかとの質 問があり,これに対して発表者よりユビキタス環境においてすべての判断を 端末側に委ねる整理には違和感があるとの回答があった.
感想情報を用いた注目情報付加・利用方式の改良
 ○大浦 啓一郎,森田 哲之,日高 哲雄,田中 明通,加藤 泰久(NTT)
概要
近年のブロードバンドインターネットの普及により個人が消費する情報量は膨大 となっており,過去に閲覧経験のある情報に対しても再利用の効率化を行うため のデスクトップ検索システムが普及し始めている. 著者らは,閲覧したことのあるウェブページの再利用を効率化するための注目 情報付加・利用方式を提案し実験により有効性を確認した. しかし本方式では注目情報が増加するに従って検索結果の一覧性が悪くなり, 次第に再利用効率が低下する,注目情報付加時にその注目情報を付加した箇所 にどのような感想を持っていたのかを残すことができず,自分の過去の行動 (注目情報付加)の意図が思い出せない等の課題が残されていた. 本研究では注目情報と同時に感想情報を付加することにより,前述の課題解決 を目的とした注目情報付加・利用方式の改良を実施した.また改良手法の有効 性を確認するための評価を行ったので報告する.
keywords: 注目情報 ウェブ閲覧履歴 デスクトップ検索システム 感想情報

質疑応答議事録
聴講者から付与した感想情報が検索結果に及ぼす影響について質問があり, 発表者から検索時に感想情報によってフィルタリングを行っているとの回答 があった.別の聴講者からは参照しているデータはWebページ全体なのかと いう質問があり,これに対して検索対象はあくまで過去にユーザが閲覧した ことのあるWebページ全体であるとの回答がなされた.また別の聴講者より, Webページにアノテーションを付与し,これを利用して検索を行う手法は いくつか関連研究が存在するため,これら先行研究との差別化が重要だと 思うとのコメントが寄せられた.
質問応答における知識源選択規則の自動獲得と適用
 ○亀山 恵祐(北海道大学),荒木 健治(北海道大学),   木村 泰知(小樽商科大学)
概要
本研究では,質問応答システムの応答検索部において,検索する知識源を 使い分けることで,正応答が増加するかどうかの有効性について調査する. 従来の手法では,質問応答における知識源として新聞記事かWWWのどちらか 一方を用いることにより応答を生成していた.我々は,知識源として新聞 記事とWWWの双方を用い,更に新聞記事に関しては年代別に細分化し, 選択することにより精度の向上を試みる.調査を行ったところ,新聞記事 やWWWのどちらか一方のみを用いた場合に比べ,双方を使い分けることに よる正応答の増加が確認された.また新聞記事の使い分けによって,最適 なクエリではない場合でも,正しい応答が得られることも確認された.
keywords: 質問応答システム,知識源,応答検索,使い分け

質疑応答議事録
聴講者より知識源はすべて使った方が正確な結果が得られるのではないかと いう質問がなされたが,発表者によると知識源を限定した方がよい結果を 得られることがあるとの回答であった.また知識源の選択を誤った場合の トレードオフに関する知見について聴講者より質問があり,これについては 情報の古さを加味した情報源の制限をすればよいとの見解が示された. さらに知識源選択の規則の生成方法について質問がなされたが,これに 関してはまだ学習までには至っておらず今後研究したいとの回答であった. 新聞記事の結果について時系列に関連する結果を取り出しているのかと いう確認がなされたが,特にそうとは言えないとの回答がなされた. この他,知識源毎にカスタマイズされたクエリを生成してはどうかとの 提案がなされた.
動向情報に対する変化要因の抽出手法
 ○山本 健一,谷岡 広樹,殿井 加代子(ジャストシステム)
概要
近年,電子化された情報の増加に伴い,ユーザの関心や興味に合致する情報に直接的かつ 簡便にアクセスするための技術が求められている.このような要求に応える技術のひとつ として,我々は,動向情報の変化とその変化要因とを視覚的に表示するシステムを研究し ている.本稿では特に,動向情報に対する変化要因の抽出手法に関して提案する.まず, ある文書に含まれる各単語に対して,動向情報の変動への寄与度を,確率的に計算する. さらに,その文書に含まれる単語の寄与度の和を計算し,各文書の動向情報への寄与度を 算出する.提案手法は,単語及び文書の動向情報の変動への寄与度から,動向情報の上昇 に寄与するのか下降に寄与するのかといった情報まで推測できることを特徴とする.
keywords: 動向情報,変化要因,情報抽出,条件付き確率

質疑応答議事録
聴講者より新聞記事は中立的な記事が多いと考えられるが,これが原因で 中間的なスコアの記事が多くなる等の影響があるのではないかとの質問が なされた.これに対して,発表者よりスコア計算の過程で中間的な単語は 除かれるような仕組みとなっているとの回答がなされた.また,重要な 単語(ファクター)をどのように決めているのかについて質問があり, 基本的には TF-IDF によって決定しているとの回答がなされた.また単語の 決定方法としては,例えば cause(t)の絶対値の利用なども検討中である との回答であった.
つながりを支える緩やかなコミュニケーションメディアの実現に向けて
 赤塚 大典(フリーランスプログラマ)
概要
他者とのつながりはコミュニケーションによって成り立っている.対面環境の みならず,離れた場所であってもメールやチャット,ブログなどを通じてお互 いの健在やつながりを確かめ合うことができる.しかし,気づけばいつしか疎 遠になってしまっている知人や友人がいる.既存のコミュニケーションメディ アは積極的なコミュニケーションには適しているものの,緩やかにつながりを 維持するという観点からすれば十分ではないように思われる.我々が目指すの は,つながりの維持を目的とした "緩やかな" コミュニケーションメディアの 実現である.本稿では,「積極的ではない "緩やかな" コミュニケーションで も十分につながりを維持できるのではないか」という問題意識に立脚し,この ようなコミュニケーションを可能にするメディアについて論じる.
keywords: 社会脳仮説、弱い紐帯、アンビエント性、コミュニケーションメディア

質疑応答議事録
聴講者よりアイコンが誰のものかをどう認識するのかという質問がなさ れた.これに対して,発表者よりmixiに登録しているユーザについては このIDが表示されるため認識可能だが,そうでないユーザについては 顔のわからない相手となるとの回答がなされた.また,そもそもコミュ ニケーションが面倒な人にとって,このような顔のわかる仕組みは受け 入れ難いのではないかとの質問があったが,発表者はこのような仕組み が必要だと思うユーザは多数いると考えており,その意味で匿名性は 極力排除したいとの考えているとのことであった.また,弱い紐帯を 広げることは考慮しないのかとの問いに対しては,考慮しないとの回答 であった.これを受け,このシステムにおいてはコミュニケーションは 行われていないのではないかとの質問がなされ,発表者よりシステムが 提供するのはきっかけであり,その先のコミュニケーションは各自が 行えばよいと考えているとの見解が示された.
13:45-15:45 セッション5(ロング発表):ニュース配信とトピック分析
座長:大坪 五郎(デンソーアイティーラボラトリ)
副座長:河合由紀子(京都産業大学)

掲示板サイトに内在する注意スレッドの分析法
 ○櫻井 茂明、折原 良平(東芝)
概要
携帯板サイトに内在するスレッドの分析法として、重要なスレッドの 順位付け法および特徴的な表現の抽出法を提案する。これまで、社名や 不満の有無などの「イベント」を抽出する手法を提案しており、80%を 超える再現率を達成してきた。今回の発表では、特徴付けられた注意す べきスレッドの「順位付け」と、スレッドに対応する「現象の抽出」 (ex. blue screen, shutdown)を検討する。対象会社判定基準を導入 することで、対象会社を話題にしているスレッドを抽出する。また、 不満の有無をもとに差分解析し、不要な現象を削除することで、スレッ ドに対応した現象を抽出する。実験より、提案手法により従来法よりス レッドに妥当な順位付けができ、特徴的な表現を抽出できた。
Keywords:テキストマイニング、SVM、評判情報

質疑応答議事録
 主な質疑は、記事からのテキスト情報抽出に関するものであった。 「新しい単語(特殊な単語)の抽出についてはどうするのか」という 質問では、現在は辞書ベースでは手動で登録しているが、学習モデルで 対応できる範囲もあるということであった。さらに、新語は、頻繁にで てくれば現象抽出で抽出できると思われる(この場合、ユーザが新語の 意味が分からなくても記事そのものを読めば分かるのではないか)、 ということであった。また、別の聴講者の「記事で伏字があった場合 は?」という質問には、伏字の前後の単語との関係により多少把握可能 であると予測されるということであった(今後、構文解析を入れる必要 がある)。ただし、テキスト抽出を完全にできるものではなく、ひっか からないものもある、ということであった。他に、「SVMの線形カー ネルを使っている理由」についての質問があり、「パラメータのチュウ ニングがあまり面倒でないため」ということであった。
携帯向けオンラインニュース配信のための視聴履歴に基づく嗜好クラスタ管理手法の検討
 ○大槻 一博(NHK放送技術研究所),服部元(KDDI研究所), 帆足 啓一郎(KDDI研究所),星野 春男(NHK放送技術研究所), 菅谷 史昭(KDDI研究所)
概要
携帯向けオンラインニュース配信を対象としてユーザの興味や関心 (メジャーだけでなくマイナーなものも含む)に適応した情報サービスを 提案する。嗜好の抽出は、全体の嗜好をまとめて使うのではなく、クラス タリングすることでマイナーな嗜好をも抽出可能とする。また、忘却の 概念(時間)による重み付けも導入する。クラスタリング法は、記事の タイトルから形態素解析により抽出したキーワードをもとに記事を分類し 、分類された記事の重複の割合をみて統合するものとする。評価実験に より、メジャー、マイナーなキーワード(嗜好クラスタ)が抽出でき、 マイナーとなる記事に高い順位をつけることができた。また、忘却概念が 有効的なユーザとそうでないユーザの発見ができた。
Keywords:視聴履歴、嗜好クラスタ管理手法

質疑応答議事録
聴講者より「どういったように個人にカスタマイズするべきかという 調査」の有無についての質問があったが、特にその点については調査し ていないということであった。また、「興味もあまりないのにたまたま 一度クリックしてしまった場合の履歴情報の取り扱い」については、 忘却の概念より時間がたつとなくなるということであった。また、閲覧 率を入れると落とせるのではないだろうかということであった。別の聴 講者からは、「接尾辞(選手、条約、会社)などは普通は重要でもある ので、考慮する場合も取り入れると良いのではないか」と「ストップ ワードも考慮した方が良い」というコメントがあった。さらに、「マイ ナー」については、「たまたま違うジャンルの記事を見た場合でも、 そのジャンルの記事もひろいたい」ためこの概念を導入したということ であった。なお、各ユーザの興味は、「抽出したキーワードからクラス タリングして決定したキーワードの集合」として個人ごとに作成・管理 しているということであった。
ニュース番組自動生成システムwEEによる記事印象の伝達度評価  ○熊本 忠彦(NICT),灘本 明代(NICT),田中 克己(京都大学)
概要
Webのニュース記事を、その記事の印象を基に演出を加えてニュース 番組を自動生成するシステムwEEを評価する。wEEではコンテンツから 印象を抽出し、その印象に応じてBGMと読み上げ音声の声色を変化 できる。大規模実験(600名:男女各300人)を行い、BGMと声色の 違いにより被験者にどう伝達しているかを評価する。聞かせる記事は、 普通の話題、明るい話題、暗い話題のものとする。視聴者は、4つの印象 について10点で評価する。実験より、普通の話題の場合は従来法だと怖 く伝わり、明るい話題の場合は提案法だと明るく伝わり、暗い場合は提 案法だと少し明るく、怖さや緊迫感を和らげながら伝えられることが分 かり、演出をかえることで印象の伝わり方を変えられることが確認できた。
Keywords:コンテンツ変換、印象マイニング、ニュース番組演出

質疑応答議事録
主な質問は、評価実験の妥当性についてであった。最初の聴講者からは「BGMと音声を分けて評価しているか」という質問で、「被験者は分けて評価していないが、分析の過程で分けることは可能である」という回答であった。また、別の聴講者からの「そもそも音声やBGM自体に被験者が怒りといった評価をつけたりすることも考えられないのか?それを避けるために何について評価をするのかというインストラクションをつけた方がいいのではないか?」という質問に対し、「被験者には音声やBGMが持つ印象も含めてトータルに記事の印象を評価してもらった」という回答であった。さらに、「同じ話題に演出を変えるだけでは不十分ではないのか?」「話題を3つにわけて、各々に設定を変えていると評価が複雑化しないのか?」という質問もあった。発表者からは「今回の実験では明るい話題を探すのが大変であった」、「記事の内容が実際に明るいかどうかも被験者実験で定量的に確認すべきであった」、「記事の効果的な並べ方についても今後取り組みたい」というコメントがあった。他に、開発についての質疑があり、BGMをつけた理由については「TVMLにBGMを再生できる機構があったので利用した。実際のニュース番組のように、記事と記事の合間にだけBGMを流すといった方式を検討している」ということや、音声合成の明るさや暗さの設定については、「感情音声合成エンジンにあるいくつかの音声を選択利用している」ということであった。この選択については、「明るい音声と普通の音声に違いを出すのが困難ではないか」という質問が続けてあり、発表者からは「違いが出るよう声色を選択するだけでなく、ピッチや話速も調整した。個別に聴くと違いはわかりにくいが、比べてみると何となく違うことがわかるし、実験結果にも差が現れている」ということであった。なお、この大規模実験はインターネット調査実験会社を用い、Web上に刺激データ(BGMと音声を録音したもの)を置いて、被験者がアクセスして評価するというものであり、予算は20万円程度であったらしい。
ウェブ検索APIとトピック主導型クローリングに基づくロボット型住所関連情報検索システム
 ○藤本 典幸,森本 泰貴,長屋 務,萩原 兼一(大阪大学)
概要
ロボット型施設検索システムを提案する。DBにない情報も取り扱うことで、 網羅性を高めることを目指す。施設の種別などのキーワードと地名の一部を 入力とし、指定された地域内にあり、かつキーワードに適合する住所とその 関連情報を自動抽出し地図にマッピングして提示する。クローリングは、 Googleの検索結果を種ページとして収集し、種ページのリンク先のページも 時間内(ユーザが指定)で収集する。住所表記の認識は文字列マッチングと し、関連情報はHTMLの構造から構文木を作成して住所情報付近の情報(極大 部分木の集合)として抽出する。実験結果より、発見した住所に関しては、 収集時間を延ばすと適合数は増加するが適合率が減少し、関連情報に関して は、適合率、再現率はおおむね高くなったことが確認できた。
Keywords:地図検索、情報抽出、トピック主導型クローリング

質疑応答議事録
 質疑の主は、システムのアルゴリズムに関するものであった。質疑応答にて、「キーワードを含まない部分はリンクを辿らない」ということ、「HTMLの不完全な構文に関する解析についてはlibxmlに含まれるHTMLparserモジュールを利用している」ということ、「再現率の計算における母集団は収集してきた文章である」ということが確認された。また、「googleの結果を種としてそこからさらにリンクをたどるのではなく、googleの結果のみを利用した方がいいのではないか」という質問については、googleの検索結果のページはそのサイトのトップページであることが多く、多くの場合はサイトのトップページだけでなく、トップページから辿ったページにも欲しい情報があると思われるため、種として取り扱ったということであった。コメントは「アンカーテキストを考慮した方がよい場合もある」「住所は完全照合ではなく機械学習など他の効率的な方法もある」「HTMLの構文解析は単純だが、それなりの精度が出ているので評価できる」というものであった。なお、サーブレットで公開希望する聴講者もあった。なお発表したシステムは次のURLにてフリーソフトとして公開中とのことで、システムのデモも行われた。
http://www-hagi.ist.osaka-u.ac.jp/~fujimoto/WebSearch/Address/index.html

「これまでの活動」に戻る
 
本ページに関する問い合わせ
wi2−webmaster@mail,ieice.org