メインメニュー






















第17回研究会
●第17回Webインテリジェンスとインタラクション研究会
日時 平成22年3月15日(月) 9:45〜18:45(受付開始時間 9:15)
   平成22年3月16日(火) 9:30〜18:50(受付開始時間 9:15)
会場 大阪大学中之島センター
(〒530-0005 大阪府大阪市北区中之島4-3-53)
http://www.onc.osaka-u.ac.jp/others/map/index.php

→プログラム →特別講演 →質疑応答議事録 →学生参加報告(PDF)
→運営委員会

2010年3月15日(月)〜16日(火)に,大阪大学中之島センターにて「第17回Webインテリジェンスとインタラクション研究会が開催されました.講演件数は,31件(ロング発表は16件,ショート発表15件,特別セッション含む)で,参加者数は120人でした.一般講演では,関係解析,Webナビゲーション,Webシステム,テキスト解析,時系列解析などに関する発表がありました.



「Twitter研究のいま」をテーマとした特別セッションを設け,公募で発表を募りました.Twitterに関する研究の発表が,ロング発表・ショート発表合わせて11件ありました.さすがに今話題のアプリケーションであり,活発に議論がなされました.また,前回に引き続き,#sigwi2のハッシュタグにより,Twitter上で会場内外の参加者により,議論が行われました.この取り組みも2回目となり,参加者の皆様も慣れてきたようで,非常に貴重なコメントがいただけました. 招待講演は,「Webサービスとプライバシー」というテーマで,「ネットワークが創発する知能」と題して,複雑ネットワーク(特にSNSサイトの分析や人間の脳内のネットワーク構造の応用)に関するご講演を3件いただきました.懇親会は,大阪大学中之島センターの交流サロンで行ない,VIPな気分を味わいました.多くの方に参加いただき,楽しいひとときになりました.


一般発表の様子です


活発な議論が行われました


一般発表の様子です

質疑応答も盛り上がりました


Twitterでも盛り上がりました

懇親会はVIPルームにて


大阪の夜を心行くまで楽しみました

懇親会でも議論が尽きませんでした

発表者の方には,写真掲載の許可をいただきました.ありがとうございました.
 
───────
プログラム
───────
3/15(月)
委員長挨拶 9:45-9:50

セッション1 9:50-11:20 関係解析 ロング(3件)
座長 高木 友博(明治大学),副座長 湯本 高行(兵庫県立大学)
1. 隣接文書のクエリ尤度の大小関係を考慮した文書特徴付け手法の実装
田村 航弥,波多野 賢治,宿久 洋(同志社大学)
2. 複数の重み付けによる木編集距離の拡張
池田 健人,波多野 賢治(同志社大学)
3. 異種情報源を利用したサイト間関係強度計算法の比較検証
日野 滋樹(日本電信電話)

セッション2 11:30-12:30 Twitter ショート1(3件)
座長 濱崎 雅弘(産業総合技術研究所),副座長 庄司 裕子(中央大学)
4. Twitterにおける人工無脳とのインタラクション
宵 勇樹
5. 書き手の属性を考慮したTwitterにおける注目トピック検出手法の提案
中西 良介,白井 英俊(中京大学)
6. USTREAM 中継されたカンファレンスに関連した Twitter 発言の分析
白水 菜々重,松下 光範(関西大学)

特別講演 13:30-15:30
7. ネットワークが創発する知能
司会 土方 嘉徳(大阪大学)
栗原 聡(大阪大学/JST CREST),
和泉 潔(産業技術総合研究所/JST さきがけ),鳥海 不二夫(名古屋大学),
我妻 広明(九州工業大学/理化学研究所)

セッション3 15:45-17:05 Twitter ショート2(4件)
座長 松下 光範(関西大学),副座長 難波 英嗣(広島市立大学)
8. Twitterハッシュタグに基づくTweet群からの変化抽出
田中 克明,堀 浩一(東京大学)
9. リンクを含むつぶやきを中心としたTwitterの分析
吉田 光男,乾 孝司,山本 幹雄(筑波大学)
10. Twitterにおける情報伝播経路の抽出法
風間 一洋,今田 美幸,柏木 啓一郎(日本電信電話)
11. Twitterがもたらす報道機関への影響
青崎 保好,杉原 太郎(北陸先端科学技術大学院大学)

セッション4 17:15-18:45 Webナビゲーション ロング(3件)
座長 高間 康史(首都大学東京),副座長 江草 由佳(国立教育政策研究所)
12. 電子掲示板の勢いを評価したスレッド選択支援
清水 次朗,砂山 渡(広島市立大学)
13. タスク中心型コンテンツ横断ナビによる実世界行動の誘発
深澤 佑介(NTTドコモ),太田 順(東京大学)
14. コンテンツとソーシャルブックマークの分析によるWebでの探索・散策行動の支援
木村 清尭,湯本 高行,新居 学,高橋 豐(兵庫県立大学)

懇親会 19:00−21:00

3/16(火)
セッション5 9:30-10:50 Webシステム ショート(4件)
座長 小林 一郎(お茶の水女子大学),副座長 宮森 恒(京都産業大学)
15. オノマトペロリ: オノマトペを利用した料理推薦システム
カンウィパー ラートサムルアイパン(お茶の水女子大学),
中村 聡史(京都大学),渡辺 知恵美(お茶の水女子大学)
16. 女性向けフリーマガジンと連動するWebサイトのユーザ行動解析
大塚 真吾(物質・材料研究機構),高橋 修太郎(千葉工業大学),
宮崎 収兄(千葉工業大学)
17. 北海道を対象とした地方議員と住民間の協働支援システムの開発
木村 泰知(小樽商科大学),渋木 英潔(横浜国立大学),
高丸 圭一(宇都宮共和大学/ディクティオ),小林 哲郎(国立情報学研究所)
森 辰則(横浜国立大学)
18. 歩行者向け道案内文生成システム
土野池 真之,福本 淳一(立命館大学)

セッション6 11:00-12:20 テキスト解析 ショート(4件)
座長 熊本 忠彦(千葉工業大学),副座長 笹嶋 宗彦(大阪大学)
19. 情報可視化におけるグラフ緻密化のためのQuery Reformulation
堀部 高史,福本 淳一(立命館大学)
20. Webからの評判情報の取得と可視化
森 正樹,福本 淳一(立命館大学)
21. 関連語を考慮した重み付tfを用いたBM25による検索精度向上
藤田 尚樹,高橋 大和,小長井 俊介,片岡 良治(日本電信電話)
22. アンケートのフリーテキスト分析における名詞の表記ゆれ提示手法の提案
田村 直之(大日本印刷)

セッション7 13:20-15:20 Twitter ロング(4件)
座長 土方 嘉徳(大阪大学),副座長 井口 誠(シンクロア)
23. 影響伝播モデルIDMの線形代数表現とTwitter分析への応用
松村 真宏(大阪大学)
24. Breaking News Detection in Twitter
Swit Phuvipadawat,Tsuyoshi Murata(東京工業大学)
25. 既存コミュニケーション基盤を前提としたグローバルセンサデータ
マイグレーション
羽田 久一(慶應義塾大学),
宇夫 陽次朗(IIJイノベーションインスティチュート)
26. 街に着目したTwitterメッセージの自動収集と分析システムの提案と試作
松村 飛志,安村 通晃(慶應義塾大学)

セッション8 15:35-17:05 Webシステム ロング(3件)
座長 品川 徳秀(東京農工大学),副座長 齋藤 ひとみ(愛知教育大学)
27. RFIDタグを用いたオンライン英単語学習支援環境の構築
鮫島 聡志,砂山 渡(広島市立大学)
28. 商品の価値とユーザの嗜好を考慮した商品推薦システムの提案
伊藤 ゆかり,波多野 賢治,松本 尚宏(同志社大学)
29. キーバリュー型データストア 〜クラウドを支えるデータベース技術〜
下村 綾香(神戸電子専門学校),長行 康男(神戸情報大学)

セッション9 17:20-18:50 時系列解析 ロング(3件)
座長 是津 耕司(情報通信研究機構),副座長 大塚 真吾(物質・材料研究機構)
30. テキストのキーワード間の関係と変化を捉えるための地図型アニメーション
インタフェース
錦戸 拓也,砂山 渡(広島市立大学)
31. Web閲覧を伴うインフォーマル対面会話における話題推移を利用した会話
支援システムの提案と評価
藤森 響,田野 俊一(電気通信大学),
三澤 純子(電気通信大学/エム・ティ・プランニング),
市野 順子,橋山 智訓,江崎 朋人(電気通信大学)
32. Time-Arrayed SOMによる時系列テキストコレクションの可視化
石川 雅弘(つくば国際大学)

 
──────────────────────────────────
特別講演:「ネットワークが創発する知能」
──────────────────────────────────
司会:土方嘉徳(大阪大学)
概要:
Webはネットワーク構造と,ネットワーク中のノードにあるコンテンツから構成されたオブジェクトと言える.WI2研究会においても,ネットワーク構造を分析することで新しい方法論を生み出したり,もう一方のコンテンツを分析することで新しい方法論を生み出したりしている.Webのネットワークは自立分散の形式で形成されたものであるが,いわゆる複雑ネットワークの一つと言える.本特別講演では,複雑ネットワークを中心として,社会ネットワーク分析から神経ネットワークの応用まで,最新のネットワーク関連技術の動向について紹介いただく.

タイトル:ネットワークが創発する知能
講演者:栗原 聡 氏(大阪大学 産業科学研究所/JST CREST)
概要:
近年,自然界のネットワークから人工的なネットワークに至る,様々なネットワ ークが複雑ネットワーク構造を有することが明らかとなってきたこと等を背景と して,複雑ネットワークに関する研究が盛んである.加えて,集合知や群知能の ような,多数の低機能自律主体の協調行動から創発する知能に関する研究も盛ん である.興味深いことに,これらの研究は計算機科学,化学,生物,経済,社会 学など異分野において横断的に行われており,異分野研究者の交流の場としての 研究会も発足されている.本セッションでは,国内における複雑ネットワーク研 究の現在までの研究トピックの流れと,現在議論されているいくつかの研究テー マについて紹介する.



タイトル:大量SNSサイトの構造と成長分析
講演者: 和泉潔(産業技術総合研究所 デジタルヒューマン研究センター),
鳥海不二夫(名古屋大学 大学院情報科学研究科)
概要:
近年,SNSやBlogといった新しいWebコミュニケーションツールの利用が増加して いる.このような状況下で,Webコミュニティの活性化を維持することの重要性 が認識されている.我々はソネットエンタテインメント株式会社より50,000サイ トのSNSデータの提供を受け,2008年11月までに存在したアクティブな一部のSNS を対象として分析を行なった.大量SNSの分類を行なうことで,小規模SNSの一般 的性質及び,適切な運営手法を明らかにすることが本研究の目的である.本発表 では,まずネットワーク構造からSNSを4タイプに分類した結果を示し,その特徴 を述べる.次に,ユーザ数の増加の観点から各SNS の盛り上がりをとらえ,ユー ザ数が大幅に増加しているSNSを決定木によって分析し,それらのSNSを比較しな がら高成長SNSの特徴抽出を行った結果について述べる.





タイトル:神経ネットワークである脳の内外から知能創出を考える
ー実 時間・実世界脳型ロボットの取り組みー
講演者:我妻 広明(九州工業大学 大学院生命体工学研究科)
概要:
脳全体がもつ知能,あるいは自由意志や意識の基盤としての脳が,しばしば顕著 な自発性を持つ神経細胞の巨大な回路網から構成されている事実は,「自発的ネ ットワーク形成による機能創出」の潜在的な可能性を示唆している.見過 ごし てはならないのは,これが無機質な回路ではなく,集団機能として出現する脳の 全体性,つまり我々が「知能」「意識」と呼ぶものを,脳の外側から観測できる ことである.果たしてこの全体性が創出される分散処理と何か.この 問題は脳 科学においても未だ不明であり,脳の知能の創発性を解く鍵と考える.本研究で は,脳科学知見に基づく数理モデルとそのネットワークを時間性 に注目して実 環境・実時間動作ロボットとして再構成し,仮説検証を進めている.



 
───────
質疑応答議事録
───────
■平成22年03月15日(月)
9:50-11:20 セッション1: 関係解析 ロング
座 長: 高木 友博(明治大学)
副座長: 湯本 高行(兵庫県立大学)

隣接文書のクエリ尤度の大小関係を考慮した文書特徴付け手法の実装
○田村 航弥,波多野 賢治,宿久 洋(同志社大学)
概要
今日のWeb上に存在するデータの増加に伴い,ユーザは自身にとって有益な情 報を入手することが困難となってきている.このような問題をうけ,情報検索を 行う際に如何にユーザの情報要求に沿った情報を提示するかという課題が挙げら れる.従来,文書を検索する際にはその文書が保持しているテキスト情報,もし くはリンク構造情報のみを利用することが多かったが,その双方を用いた検索手 法こそが更なる検索精度の向上が見込まれることはこれまでの研究によってすで に報告されている.その一方で,リンクによって隣接している全ての文書を考慮 することによって,クエリと関連度の低い文書を多く含むことになるという問題 点も明らかになった.本稿では,この問題点を解決するために,隣接文書のクエ リキーワードとの適合度によって考慮する隣接文書数を変動させる手法を提案す る.
Keywords: クエリ尤度モデル,リンク構造,文書特徴付け手法

質疑応答議事録
希望せず.
2複数の重み付けによる木編集距離の拡張
○池田 健人,波多野 賢治(同志社大学)
概要
本稿では,木構造の類似度算出法である木編集距離に基づく複数の特徴量によ る拡張を行う.従来の木編集距離では,木の大きさの差による影響が大きく,保 持しているノードの種類やノードのつながり方などの二つの木の構造が似ていて も木の大きさの差が大きければ大きな距離が与えられ,似ていないものと判断さ れてしまう.そこで,木の大きさだけではなく,ノードの種類や共通する部分木 の大きさ,木の深さを用いた値により重み付けを行い,木の内部情報を加味した 類似度算出法を提案する.そして,具体例を用いてその有用性や今後の課題を検 討する.
Keywords: 木編集距離,木構造類似度,XML,クラスタリング

質疑応答議事録
会場より,XML文書検索がターゲットの場合,ノードの一致/不一致はどのように判定しているのかという質問 があり,それに対して,タグ名の一致/不一致を考えているとの回答があった.それを受けて,その方法は中の変 数を無視してしまい,抽象的であると考えるが,タグに囲まれた文章はどうしているのかとの質問があり,それ に対してはXMLに限定しているわけではないので,詳しくは考えていないが,同じデータを示しているかどうかの 大まかな分類がわかればよいとの回答があった.また,提案手法は内容が同じであることは保証していないが, スキーマの検索を目的としているのかという質問があった.それに対して,スキーマの検索に近いものを考えて おり,内容は見ずにスキーマやDTDなどの構造を見るレベルのXMLの分類はできるとの回答があった.また,提案 手法は抽象化された書式を検索するものであるが,それはエンドユーザが直接使う感じではないが,産業界から のニーズはあるのかとの質問については,産業界からのニーズは把握していないが,文書に限らず,XMLで表現さ れたマルチメディアデータなどさまざまな応用があるとの回答があった.これに対して,もう少し具体的に考え た方がよいとのコメントがあった.座長からのクラスタリングの評価は事例ベースしかないのかとの質問に対し ては,いくつか考えたものの1つが現在用いている評価手法であり,今後,検討していく必要はあるとの回答が あった.
異種情報源を利用したサイト間関係強度計算法の比較検証
○日野 滋樹(日本電信電話)
概要
公開アクセスランキングから収集した数値を元に重み付けしたグラフを用いて, 指定サイトの関連サイトを関係強度順にランキングすれば良い検索手段になると 考えてきたが,結果妥当性を客観評価する方法が無かった.独立な情報源を用い 類似計算結果を得て比較すれば,客観評価が可能と考え,別手段として,掲示板 のバックリンク数を元に関係強度を計算する方法を考案し,実験した.実験サイ ト群にて両方式に共通な可到達サイトは関係強度の順位がほぼ一致する結果が得 られたが,第二の方法で可到達範囲が狭く,比較可能な領域が少ないという新た な問題点も見つかった.その改善にはフォワードリンクの併用が望ましいが,掲 示板側にも対策が必要になる.
Keywords: サイト間関係強度,検索,ランキング,掲示板,重み付きグラフ

質疑応答議事録
座長からの「細かい部分についての検討をしている中でよい結果が出ないという状況に見えるが,元々の目的 に立ち戻り,大きなビューとしてみて有効そうな方法はないか」との質問に対し,「それは常に一定ではなく, 情報収集対象は年々移り変わっていくので,常に新しい方法を取り入れていく必要がある」との回答があった.
11:30-12:30 セッション2: Twitter ショート1
座 長: 濱崎 雅弘(産業総合技術研究所)
副座長: 庄司 裕子(中央大学)

Twitterにおける人工無能とのインタラクション
○宵 勇樹
概要
これまで多くの人工知能学者がコンピュータに対し人間に近い知能を持たせよ うと努力してきた.しかし筆者がtwitter上で簡単なプログラムからなる人工知 能(人工無脳)を走らせたところ,簡単に人間と錯覚される現象が発生した.これ はtwitterでは既存のメディアとは違う会話のやりとりの流れが発生しているか らだと考えられる. ここではまずtwitterの会話モデルについて触れ,そこから起こりうる問題に ついて述べる.さらにtwitterユーザを対象に取ったアンケートからtwitterでの 人工知能の可能性を探る.
Keywords: Twitter,人工無脳,人工知能,インタラクション,会話

質疑応答議事録
聴講者からの「見抜かれないbotを作ったということだが,見抜かれた経験をもとにbotを作ったのか」という質 問に対し,発表者から「最初から人と錯覚されるものを作ろうと思ったので,最初から作り込んで見抜かれない ものを作ることができた.人の作っているものを参考にしたのではなく,自分が欲しいものを作ったら自然に今 の形に落ち着いた」という回答があった.また,「盛り上がらない人たちのために人工無能を仕込むというのは 面白いと思うが,活躍できる場作り,インタラクションデザインについて何かアイデアはあるか」という質問に 対しては,「作り手は機械や機能を強調しがちだが,機械を全面に出すより,キャラクタ設計が重要だと思う. わざとミスを犯すようなキャラクタを作るなど,工夫が必要だ」という発表者の考えが示された.「人工無能の 問題点として,文脈の変化に対するデザインの不足があると思うが」という指摘に対しては,発表者も今ちょう ど考えているところだということであった.「Twitterは一つ一つの発言が離散しているのが特徴だが,人工無 能の応答も離散した発言になっている.話の流れを考慮するのは重要で,これから工夫すべき点である」という 回答であった.最後に,「注目語の収集について良くわからなかったので補足して欲しい」という聴講者の質問 に対して,発表者から「形態素解析をおこなって,その中から形容詞だけを取り出す.10分間ごとに上位のもの を選択している」という補足説明があった.
書き手の属性を考慮したTwitterにおける注目トピック検出手法の提案
○中西 良介,白井 英俊(中京大学)
概要
Twitterにおいて、新たな流行となるかもしれないトピック を検出する手法を提案する。この手法は、人々はその関心分野において流行する トピックについて他の人よりも早く記事を投稿する、という仮説に基づくもので ある。つまり、共通の関心を持つ人たちの間でバースとするトピックは将来一般 の人たちの間でも流行する可能性があるというものである。 我々はTwitterへの投稿に基づいて投稿者の関心領域を分析するWebサービスを 公開した。そして、この提案の妥当性を検証するための調査を行った。
Keywords: Twitter,テキストマイニング,Webサービス

質疑応答議事録
聴講者からの「発表の前半はTwitterユーザの属性推定に関するもので,後半はバースト性に関するものだった が,両者の関連についてはどう考えるか」という質問に対し,発表者から「最初の部分だけでは研究として成り 立ちにくいので,バースト性についても考えている.少女漫画など特定の領域の盛り上がりについて考えること で,趣味の合う人たちのコミュニティ作りに貢献できる可能性があると考えている」との回答があった.「入力 した名前からハッシュタグを使って『・・・ター』とするのが流行っているようだが,それによる汚染・影響は あるか」との質問に対しては,発表者も影響はあると思っているが,フィルターは今のところ考えていないとの 回答であった.「専門家だけで盛り上がって,マジョリティにたどり着けないというような現象は見られたか」 という質問に対しては,発表者から「そのような現象は確かにあると思うが,今回の実験では,そういうキーワ ードにたどり着けなかった.今後調べていきたい」との回答がなされた.聴講者からのコメントとして,「バー ストが起きた時に,各ユーザがちょっとずつ違ったことを言っていたりする.ユーザの属性推定に関する研究の 方を活かして,バースト時のユーザによる違いや特性を知ることができるのではないか」という発言があった. また,「Twitterだけでなくブログでも同じことができそうだが,比較は考えてみないのか」という質問が挙がっ た.この質問に対して発表者は,「ブログでも同じことができると思う.ただし,ブログは日付などが正確に取 れなかったり,スパムも多い.その点が解決できれば,ブログでもやれると思う」との考えを示した.最後に, 「発言した人を特定してキーワードを調べていくと,専門家の特性を知ることができるのではないか」という聴 講者のコメントに対し,発表者は「Twitterでは有名人や専門家が大きな位置を占めているので,そういうことは 意義があると思う」と述べた.
USTREAM中継されたカンファレンスに関連したTwitter発言の分析
○白水 菜々重,松下 光範(関西大学)
概要
TwitterやUSTREAMなど,情報をリアルタイムにアクセス可能にするWebサービ スの登場により,カンファレンス等のイベントに,遠隔地から参加できるように なっている.我々はこれらのサービスのログの再利用を容易にするための情報編 纂技術の実現を目指している.このようなイベントにおいては,現地の参加者と WEBを介した遠隔地の参加者のいずれもが情報発信の主体になりえる.本研究で は,情報編纂のための基礎データ取得を目的とし,参加形態の違いによる発言の 種類や特徴の差異に関する分析を行ったので報告する.
Keywords: USTREAM,Twitter,ログ分析,マイクロブログ,情報編纂

質疑応答議事録
聴講者からの「遠隔地からの書き込みについて,一部の人だけがたくさん書き込みをしているといった,偏りが あるのではないか」という質問に対し,発表者から「今回は,どの参加者がどのくらい発言しているかの分析は しなかったが,人によっては50回以上つぶやく人もいれば,1回つぶやいたきりの人もいたようだ」という回答が あった.また,「皆が画面を見ていて,講演者を見てくれないのは辛い.遠隔地の人とのコミュニケーションで は目線が移動しないので,会場の人とのコミュニケーションとは違うのではないか」というコメントがフロアか ら挙がった.次に,聴講者から「会場内外の差に関連して,カンファレンスの中身によって会場外の人のコメン トのしやすさに差異があるのではないか」という質問があり,発表者から「その通りで,基調講演など専門的な 話に関しては発言がしにくいという傾向はある.気軽に発言できる内容になると外の人が入ってきやすい」との 回答が示された.最後に,「ニュース中継されるような事件が起きた場合,現地の人と,テレビなどで見た人と の違いがあると思う.今回の比較と共通する部分があるのではないかと思うが」とのコメントに対して,発表者 は「会場外にいる人は,自分の好きな時だけ見ることができる.会場内にいる人はずっと張り付いていないとい けない.カンファレンスが重大事件と共通するか否かはわからないが,『思わずコメントをつけたくなるような ニュース』というのがあれば,外にいる人も中にいる人と同じように張り付いて見たくなるものかもしれない」 と述べた.
15:45-17:05 セッション3: Twitter ショート2
座 長: 松下 光範(関西大学)
副座長: 難波 英嗣(広島市立大学)

Twitterハッシュタグに基づくTweet群からの変化抽出
○田中 克明,堀 浩一(東京大学)
概要
あるハッシュタグを含む複数のツイートから,含まれる内容の時間経過に伴う 変化の構造を抽出し,指定されたキーワードに基づいて,関連する議論の経過を 提示するシステムの構築を行った.本システムは,変化構造の抽出のために,特 定のハッシュタグを含むツイート集合を時間経過に沿って古い内容の重みを減少 させつつクラスタリングし,時間の流れに沿って同じ内容を含むクラスタ間にリ ンクを設定し変化を表すグラフ構造を作り,キーワードに関連するクラスタと付 随するリンクを提示する.本システムは,多くの議論が入り交じったツイート群 から,本システム利用者の視点に近いと思われる複数の議論を時系列に沿って抽 出することを目的とした.
Keywords: Twitter,話題抽出,時系列文書,情報共有

質疑応答議事録
聴講者からの「ハッシュタグのイベントにおける使われ方は半日〜一日と非常に短いが,そういった短期間のも のをどうやって俯瞰するのか.」という質問に対し,発表者から「本研究では,長期間にわたって議論されてい るものに主眼を置いている.」との回答があった.また,同じ聴講者からの「長期間のものについて,トピック を出力するだけではなく,肯定/否定などの感情的な情報,また,どこで急に爆発が起きて変化したのかといった 情報が必要ではないか.」との質問に対し,発表者から「評判については特に考えていない.爆発については, クラスタ数そのものはおそらくそれほど変わらないが,その中に占めるラベルの数が増える.そのラベルを元に さらに絞り込んで俯瞰することはできる.」との回答があった.別の視聴者からの「Twitter文書は大抵短いが, クラスタリングの精度はどの程度か?」という質問に対し,発表者から「ざっと見た感じではクラスタリングは できていそうだが,140文字の中に複数の話題を含んでいる場合など,うまくクラスタリングできていない場合も ある.」との回答があった.別の聴講者からの「一度時間間隔で切ってクラスタリングした後,クラスタ間の類 似度に基づいて,クラスタを統合する階層的なクラスタリングは可能か.」との質問に対し,発表者から「その 手法は検討したが,途中で話題ががらっと変わるような場合など,ドラスティックな変化が出づらくなる.」と の回答があった.
リンクを含むつぶやきを中心としたTwitterの分析
○吉田 光男,乾 孝司,山本 幹雄(筑波大学)
概要
Web2.0はWeb上における情報の双方向性を強化し,新たなWebサービスを生み出 した.そのWebサービスの一種としてTwitterをはじめとするマイクロブロギング ・サービスが挙げられる.マイクロブロギング・サービスはオンライン・ソーシ ャル・ネットワーキング・サービスの一種であり,個人の情報プラットフォーム として機能する.本論文では,代表的なマイクロブロギング・サービスである Twitterのリンクを含むつぶやきに着目し,その特徴を調査した.その結果,ユ ニークユーザ数の多いニュースサイトがTwitterではあまり注目されていないこ と,URLの投稿にはRetweetの影響が大きくないことなどが明らかになった.
Keywords: マイクロブログ,コンテンツ解析,Webとインターネット,Webサイエンス

質疑応答議事録
聴講者からの「人工無能は今回の分析の条件から外れているが,ボットは目的が明確なのか」という質問に対し, 発表者から「明確な理由は分からないが,ページランクを上げるなどの意図があるのではないか.ボットにより 投稿されるテキストが長いのは,検索結果に引っかかりやすくするという意図があるのではないか.」という回 答があった.また,別の聴講者からの「ボットの目的に応じて,発話長やリンクの付与率など特徴が変わってく るのではないか.」との質問に対し,発表者から「今回は,URLが付与されているものを対象に限定しているが, 一般のボットを対象にした場合には,より詳細な分析ができるであろう.」との回答があった.さらに,別の聴 講者からの「同一サイトのURLのみを投稿する,あるいは複数サイトのURLを投稿するなど,ボットが投稿するURL に特徴はあるのか.」という質問に対し,「ひとつのURLを大量に投稿するのはボットだけである.また,非常に 短期間にURL付きのものを大量に投稿し,その後,ポストがまったくない,というケースもある.」という回答が あった.
Twitterにおける情報伝播経路の抽出法
○風間 一洋,今田 美幸,柏木 啓一郎(日本電信電話)
概要
本稿では,Twitter上の情報伝播現象を分析するために,情報伝播経路を抽出 する方法を検討する.具体的には,最初にTwitter APIを用いて取得可能な情報 伝播経路を分類する.さらに情報伝播経路を抽出する方法と,課題や問題点につ いて述べる.
Keywords: Twitter,情報伝播,ネットワーク分析

質疑応答議事録
希望せず.
Twitterがもたらす報道機関への影響
○青崎 保好,杉原 太郎(北陸先端科学技術大学院大学)
概要
新聞社などの報道機関は,リアルタイム性や双方向性,強力な到達力,膨大な 情報伝達量,高度な検索性能の特長を持つインターネットを紙によるニュース提 供媒体の代替手段として考えてきた.しかし,Twitterなどのテクノロジーの登 場により,読者がリアルタイムに情報を発信できるようになり,部分的に報道機 関の代替となる働きをし始めている.現時点で,Twitterで発信されている情報 の確度は低いものの,一次情報提供者としての報道機関の特権的地位を奪いつつ あり,Disruptive Technologyと考えられる.本論文では,リアルタイムで強力 な情報伝達力を持つTwitterが,報道機関と読者の関係やニュースや情報の流通 にどのような影響を及ぼすのかを議論する.
Keywords: Twitter,報道機関,メディア・エコシステム,一次情報

質疑応答議事録
聴講者からの「報道機関の関わり方として,今回はテレビとTwitterとブログに分けて考えているが,テレビ番組 もTwitterをからめた関係というものが考えられるのではないか.」という質問に対し,発表者から「テレビ局が Twitterを使って放送した例は過去にある.USTREAMと文字(紙媒体の新聞)との連携は,USTREAMが出てくる以前は あまり考えられてこなかったが,今後はUSTREAMといったものと連動して,ニュースが広がっていくだろうと考え られる.」との回答があった.また,別の聴講者からの「マスメディア側から見た場合,どのような生き残り方 があると考えているのか.」との質問に対し,発表者から「速報性,独自性など,いわゆる一次情報については Twitterは強い.報道機関は,これまで一次情報のために多大な労力を使ってきたが,そのような点には意味がな くなってきている.ある事象が,どのような社会的意味や影響を持っているのか,といった分析を行うところが メディアに求められるのではないか,と考えている.ただし,それだけの需要があるかどうかも問題で,そのあ たりを,どうやってTwitterや読者と連携して豊かなメディア移行システムを作り出していくのか,という点が これからの課題ではないか,と考えている.」との回答があった.
17:15-18:45 セッション4: Webナビゲーション ロング
座 長: 高間 康史(首都大学東京)
副座長: 江草 由佳(国立教育政策研究所)

電子掲示板の勢いを評価したスレッド選択支援
○清水 次朗,砂山 渡(広島市立大学)
概要
本稿では盛り上がっていてユーザの興味を引くスレッド選択を支援するシステ ムを提案する.インターネット上の情報交換の手段の一つとして,電子掲示板が 利用されている.しかし電子掲示板には大量のスレッドが存在し,ユーザが少な いスレッドや盛り上がっていないスレッドが多数含まれている.そこで,提案シ ステムはスレッドの盛り上がりを数値化した勢い値を定義し,勢い値を降順に並 べたスレッドのランキングを作成することでユーザのスレッド選択の支援を行う. 実験から,提案システムはユーザのスレッド選択の支援に有効と確認した.
Keywords: 電子掲示板,盛り上がり評価,スレッド選択支援

質疑応答議事録
評価実験の方法について複数のシステムでそれぞれ上位20件なのかという質問があった. 回答は各システムから200位までのスレッドを評価し,被験者は20位以降も評価しているとの回答であった.追 加で,評価として何と何を比べているのか不明であるとの質問があり,提案システム,比較システムとともに, ランキングの高い順に降順にスレッドを左に表示する.提案システムであるとランキング中からスレッドを選ぶ と,スレッドを右に表示する.その際に盛り上がった個所を表示する,比較システムではレス数が一番一定時間 内で多くなるところを盛り上がった個所として右に表示するとの答えであった.興味を持ってもらえるイコール 勢いがあると結論づけたのかとの質問があった.ユーザが興味があるところは多くのユーザが書きこんでいると ころがおもしろいと考えているとの答えであった.これに対して質問者は,最初に興味のほうへ結論を持ってい るような印象を受け,本来の意味からだんだんずれているように感じる.リアルタイムで盛り上がっているとい うのと過去の盛り上がっているものを評価して勢いがあるというのは少しイメージが湧きにくい,もっとブラッ シュアップする必要があるとのコメントであった.評価のところで上位20位の正解の数を見ているが,それ以下 を評価していないのはランキングの評価としては不十分であるのではないかと質問があった.短時間で効率よく 盛り上がりがわかるかで評価したいため上位20位としたとの回答であった.また,被験者は基本的に上から順に みていくと思うためとの回答であった.追加で,被験者は20位以下を読んでいないのかとの質問があった.回答 は,被験者によってまちまちだが,基本的には上から読んでいく人は20位以内にだいたい収まる範囲であったと の回答であった.
モバイル動画視聴のためのユーザ行動中心型地図インタフェース
○深澤 佑介(NTTドコモ),太田 順(東京大学)
概要
著者らは,屋外での携帯端末による動画視聴を促進するため,地図ベースの動 画視聴アプリケーションTaskGuideRoidを開発した.TaskGuideRoidは表示されて いる地図のエリア内でユーザができること(ユーザ行動)から動画を選択するこ とができる.ユーザの行動は,Blogから取得した観光地名と動詞の組み合わせに より獲得している.動詞は観光地に情報量を与える動詞のみを対象とする.被験 者評価から,TaskGuideRoidは,比較手法(GoogleMapsの動画視聴インタフェー ス)に比べ,40分間の実験で平均3個程度,視聴動画個数が増加したことが確認 された.特に,ユーザがあまり訪れたことがない地域では11.2個(比較手法は 6.2個)と2倍程度の視聴個数が増加しており,未知の場所に対する興味を高める 効果も確認された.
Keywords: 実世界活動,ブログ,携帯,地図,動画,Webマイニング

質疑応答議事録
引用されている文献にある倉島,手塚の体験ブログマップとの違いはどこかという質問があった.異なるところ は,動画であることとユーザ評価をやっているところであるとの回答であった.実際にやっていくなかで,テキ ストで言語化できないが,動画では表現できるといったものがあれば教えて欲しいとの質問があった.ブログを 読むよりは動画のほうがその体験を一瞬でできるというところが異なるとの回答であった.テキストと映像では 発信できるタイプが異なると思うが,現在はテキスト,映像の両方をくっつけて発信しているのでそれぞれでど う異なるか知りたいとの質問に対しては,その解析は行ってないとのことだった.スライドでは動詞は英語であ ったが動詞の選択は英語なのかとの質問があり,日本語であるとの回答であった.動画の方がテキストよりも優 良なコンテンツが集まりやすい,利用者が見てくれやすいという特徴があると思うが,単純なテキストと比べて どれくらい異なるかとの質問があった.動画のほうがユーザへの訴求力の違いあるのではないかという狙いはあ ったとの答えであった.どこで何をするかが比較的にきれいに取り出せているがテンプレートにあてはめてやっ ているのかという質問があった.テンプレートマッチ,統語パターンでやっており,観光地,名所でやって形態 素解析をやって動詞を引っ張っているとの回答であった.どこどこに行くであれば,行くになるのかという質問 があった.その場合は行くになる.ただし「行く」,「訪問する」などはストップワードとして除外していると の回答があった.「茶会をする」は「する」ではという質問については,「茶会する」は動名詞としてとってお り,「茶会をする」では「する」となるとの回答であった.コメントとして,動作を検索するという研究は多く あるのでもう少しサーベイするとよいとあった.一つの場所で沢山映像が該当する場合はインタフェースとして どのように表示されるのかとの質問があった.多くある場合は5つをランダムに選んで表示しているとの答えで あった.今後携帯電話で使ってもらうためのアイデア等はあるのかという質問があった.Webで調べてみてと携 帯でその場で使うとの調整をどうしていくかに着目しているとの回答であった.
コンテンツとソーシャルブックマークの分析によるWebでの探索・散策行動の支援
○木村 清尭,湯本 高行,新居 学,高橋 豐(兵庫県立大学)
概要
本稿ではユーザの状態に応じたブラウジングの支援を行うために,ユーザのブ ラウジング時の状態を閲覧モードとして定義する.閲覧モードには,閲覧時の状 態から探索と散策という状態を定義する.支援には本文とソーシャルブックマー クを使い分けて,目的に応じたブラウジングの支援を行う.目的が明確な閲覧状 態である探索では,検索クエリを適切なものにするためのキーワードを推薦する. キーワードはWebページのコンテンツ解析によって取得する.また,興味に基づ いて閲覧している状態である散策には,ユーザが興味を示すWebページを推薦す る.これらのWebページはソーシャルブックマークサービスに問い合わせを行う ことで取得する.
Keywords: 情報推薦,閲覧モード,コンテンツ分析,ソーシャルブックマーク

質疑応答議事録
散策は少し広いモードや状態を指しているようである.その広いモードにたいしてリコメンドしても支援になる のか,もう少し散策の定義について指針を示してもらいたいとの質問があった.探索,散策の2つに分けるので よいかというのは疑問にあった.この2つが対等な関係かどうかの精査は行っていないのでなんともいえないと の回答であった.評価についても,今回の評価であると散策の定義の難しさと同様で散策が広いモードだと評価 の仕方も難しい.散策の全てではなく,こういう散策であるとアプローチを明確にしたほうがよいかと思うとの コメントがあった.2つのモードの判定は,システムが行ったのか,ユーザに選んでもらうのかとの質問があっ た.今のところユーザに選んでもらう方式だが,ゆくゆくは自動判定としたいとの回答であった.そうすると探 索と散策の定義をもう少し明確にしていく必要があるとのコメントがあった.携帯電話でその場所の動画を出す 発表があったがあれくらいでないと散策とはいはないのではないか,もっとエキストリームに探索と散策を分け てしまったほうがよいのではないかというコメントがあった.対して,探索か散策か見方によっていろいろあり えるので,定義をもう少ししっかりしたいとの回答であった.最後の評価実験の絞り込みキーワードは特化した キーワードがないように見えた.こういうキーワードであれば,ソーシャルブックマークのほうのタグでついて いるのではないか.最初の説明ではかなりタイプが違うらしいということだが,定量的に比較したりとかはした かという質問に対して,やっていないとの回答であった.コメントとして,ソーシャルブックマークとコンテン ツにそういう違いがあるとわかれば,よい知見となるので,調べて発表して欲しい.もし,ソーシャルブックマ ークのタグにそいういう傾向があるのなら,コンテンツのほうからそのタブ抜き,残りから探すとかやれば効率 よくできるなどがあると思うとのコメントであった.
■平成22年03月16日(火)
9:30-10:50 セッション5: Webシステム ショート
座 長: 小林 一郎(お茶の水女子大学)
副座長: 宮森 恒(京都産業大学)

オノマトペロリ: オノマトペを利用した料理推薦システム
○カンウィパー ラートサムルアイパン(お茶の水女子大学),中村 聡史(京都大学),渡辺 知恵美(お茶の水女子大学)

概要
日本では料理や味覚を擬音語,擬態語を表すオノマトペを用いて「ふわふわケ ーキ」のように表現することが多い.そこで本研究では,オノマトペを利用した 料理レシピ推薦システムの開発をしている.具体的にはWeb上の料理掲載ページ よりレシピを収集し,レシピ内の文章を解析する.それにより,オノマトペと固 有名詞(料理名,食材など),形容詞,一般名詞,動詞の関連性を数値化する. これらの関連を利用してレシピ推薦システムのインターフェースを実装した.
Keywords: オノマトペ,あいまい検索,TF-IDF

質疑応答議事録
会場より,オノマトペ同士の関連を考慮しているか,例えば,「ふわふわ」と「ふんわり」 は同一グループとして扱った方がわかりやすいのでは,という質問があった。これに対し, 現在は考慮していない,同一グループとした方がよいかもしれないが,しない方がバリエーシ ョンが増え,人によってはよい場合もあるとの回答があった。また,クックパッドの場合,リ ンクをトップページでなく個別ページに対して貼ると問題となる可能性があるが許可はとって いるか,との確認があり,今のところとっていないとの回答があった。また,食べたい素材を ベースにナビゲーションするといった方向もあると思うが,といった指摘があり,今後考慮す るとの回答があった。さらに,「ふわふわ」といった観点は「食べる人」の要求としてはわか るが「作る人」の求めているものとは異なるのでは?そういう観点で考えていない人に対して, よい使い方を推薦してくれるとうれしいというコメントがあり,家庭でのさまざまな使い方を 考えているが,今後いろいろな可能性を含めて検討するとの回答があった。
女性向けフリーマガジンと連動するWebサイトのユーザ行動解析
○大塚 真吾(物質・材料研究機構),高橋 修太郎(千葉工業大学),宮崎 収兄(千葉工業大学)

概要
本稿では実世界とWeb空間における行動の関連性を調査するために,都内の女 性OLを対象としたフリーマガジンと連動するサイトのアクセスログの分析を行っ た.分析結果から,ユーザがWebページを閲覧した曜日や時間と実世界における ユーザの行動との間に関連性がある特徴的な行動を発見することができた.
Keywords: アクセスログ解析,Web行動調査,Web空間と実世界

質疑応答議事録
会場より,フリーペーパーの読者はOLだけでなく主婦も対象では?昼前,終業前に存在するアク セスは主婦の可能性もあるのでは?という質問があり,実際は分からないが,朝晩における路上で の配布を受け取るのはほぼOLだと考えられるという回答があった。また,本当に紙媒体のフリーペ ーパーを「見て」サイトに訪れているかどうか,アンケートで実際の動きをとることは可能か?と いった質問があり,可能との回答があった。また,OL以外に適用可能なターゲットはあるかといっ た質問があり,フリーペーパーの場合,ターゲットを絞った情報を掲載するか,網羅的な情報を掲 載するかの2通りの戦略で配布されているが,前者の場合には今回の知見を適用可能と考えていると の回答があった。さらに,今回の結果を踏まえて今後の展開をどう考えているか?といった質問が あり,あるページを見ている人が別のページも見ているといった知見を生かしてレコメンできる部 分,できない部分をフィードバックとしてビジネスモデルに生かすといった展開などが考えられる との回答があった。
北海道を対象とした地方議員と住民間の協働支援システムの開発
○木村 泰知(小樽商科大学),渋木 英潔(横浜国立大学),高丸 圭一(宇都宮共和大学/ディクティオ), 小林 哲郎(国立情報学研究所),森 辰則(横浜国立大学)
概要
我々は,住民の関心にあわせた地方議会議員の情報を提示するシステムの構築 を目指している.地方議会議員の情報は各自治体の会議録を利用している.また, 住民の関心については,システムからユーザに対して興味を尋ねる質問を7回程 度行うことで,各ユーザの問題意識を明確にする.本稿では,本システムの概要 について説明する.
Keywords: 政治情報,情報抽出,質問生成

質疑応答議事録
会場より,いくつかの街の議事録からその街特有の問題が見つけられるかといった質問があり,フ レーズとしては出てくるが,カテゴリにうまく対応付けできるかが課題との回答があった。また,ネ ットの政治談義は地域エゴ等で紛糾することがあり,あまり建設的なイメージがないが,提案システ ムだとうまくいくか?といった質問があり,現在は会議録を使っているので,一般ユーザが書いてい るものよりは建設的ではないかと考えている,最終的には,問題を解決できそうな議員を紹介・要望 を伝えるところまでいきたいとの回答があった。また,各議員の政策を把握するのか,実際に陳情す るのかでやるべきことが異なるのでは?例えば,前者であれば得意な政策一覧が見られればよいし, 後者であれば本当にこの人がやってくれるかといった観点が必要では?といった質問があり,提案法 は,政治に興味が薄い人も対象として,あくまで特定の政策に力を入れている議員を見つけ出すこと が主眼との回答があった。さらに,議員の窓口が知りたいことと,本当にこの人に頼んでやってくれ るかは別なので,段階をわけて今後研究を進めていくとよいのでは,というコメントがあった。さら に,個々の政治家の政策に対する賛成反対意見は扱わないのか?といった質問があり,今回はまだで あり,今後行いたいとの回答があった。
歩行者向け道案内文生成システム
○土野池 真之,福本 淳一(立命館大学)
概要
本論文では,人が行うような方法で歩行者向けの道案内文を生成する手法を提 案する.人が用いる道案内表現を分析した結果,人はランドマークや道の特徴, 交差点の状況などを指示することで道案内を行っていた.我々は,これらの指示 方法を用い,自然な表現の道案内文を生成する.地図のデータとして道,交差点, ランドマークの情報を使用し,道案内文を生成する.実験では,京都市内の一部 の地図を用い,15種類の経路において道案内文が生成できた.
Keywords: 道案内文生成,歩行者,道案内表現,地図データ

質疑応答議事録
会場より,カーナビ用経路データはグラフ構造で保存されているが,歩行者向けデータは誰も作って いないのか?といった質問があり,今回は人手で自前で作ったとの回答があった。また,研究のオリジ ナリティ,学術的価値はどこかといった質問があり,地図が苦手な人を対象に,地図ベースでなく,言 語のみで案内をすることを考えた,といった回答があった。また,これに関連し,座長より,異種のデ ータからテキスト生成するといった意味では一定の価値があると思うといったコメントがあった。また, 今回の文の生成結果を読み上げられても覚えられない,道に迷う人を迷った時点で段階的にナビゲーシ ョンすることは考えないのか?といった質問があり,今回は見せ方までは踏み込めていない,今後検討 するといった回答があった。さらに,素人は地図を書いてしまうが,タクシー運転手などはランドマー クを必ず入れるなど,経路を伝える際のノウハウもあるのでは?観点の捉え方が重要と思うとのコメン トがあり,今後検討するという回答があった。
11:00-12:20 セッション6: テキスト解析 ショート
座 長: 熊本 忠彦(千葉工業大学)
副座長: 笹嶋 宗彦(大阪大学)

情報可視化におけるグラフ緻密化のためのQuery Reformulation
○堀部 高史,福本 淳一(立命館大学)
概要
我々は,グラフ生成のためのWeb文書からの数値関連情報抽出手法の提案を行 ってきた.しかし,抽出情報が十分でない場合,生成したグラフに疎の期間が存 在する.そこで,グラフ緻密化のために追加情報の補完が必要である.本稿では, グラフ緻密化のための再検索のための2つのクエリ生成手法を提案する.実験結 果として,生成されたクエリにより得られた情報をグラフに追加することでグラ フを緻密化することが可能であった.
Keywords: Query Reformulation,グラフ緻密化,情報可視化

質疑応答議事録
はじめに,統計がまとまってページが存在することもあるが,それを利用してはどうかという質問があり,本研 究は自然文で書かれた文書から数値情報を取得するところがポイントである(ので利用しない)との回答があった. 続けて質問者から,(研究の独自性を出すためには)統計情報として得られない情報を扱うのも良いのではないか とコメントがあった.また利用する検索エンジンとしてGoogleにこだわる必要はあるかとの質問があり,手法と しては他の検索エンジンでも構わないとの回答があった.次に,数値情報としてはユーザ投稿型ガソリン価格サ イトがあるので抽出データの精度を見るために結果を比較してみてはどうかとのコメントがあった.(方法は不明 だが)今のところある程度の精度が得られているとの回答があった.次に,価格などが書かれているのは(価格の) 変極点である可能性があり(高く),疎の期間は「この期間は価格が安定していた」という記事が後から出ること がある.これを利用してはどうかとのコメントがあった.次に,ウェブが信頼できるかという問題もあるので, やはり検索結果よりも投稿サイトの方が信頼できるように思えるとのコメントがあり,考えてみたいとの回答が あった.最後に,毎日データをとる,という方法ではだめなのか,との質問があり,知りたいときに効率よくデ ータを見せるのが情報可視化の役割なので,その趣旨には合わないやり方ではないかとの回答があった.
Webからの評判情報の取得と可視化
○森 正樹,福本 淳一(立命館大学)
概要
Web上のレビュー記事から新しい商品,サービス等の評判情報を抽出すること は重要である.評判情報は評判対象の`対象',`属性',`評判表現'で構成されて いる.レビュー記事は口語表現で書かれるため,対象や属性が省略して書かれる 傾向にある.本研究では,抽出した評判情報から省略情報を補完する実験的手法 を提案する.実験では,レビュー記事から4309件の評判情報を取得し,24件の省 略情報の補完に成功した.
Keywords: 評判情報,対象,属性,評判表現,補完

質疑応答議事録
はじめに,属性と特徴の対応付けを絞り込みきれない場合があるとはどういう事例なのか,との質問があった. それに対して,たとえば「良い」などの一般的な特徴がどの属性と対応づくかをどう絞り込むかは今後の課題で あるとの回答があった.次に発表の中でUSBの差込口というのが属性という説明があったが,差込口の形状や入り 具合などが属性ではないか,との質問があった.つまり,属性には,名詞ではなく形容詞に含意されているもの も多いのではないのかという指摘であるが,今回は,評判情報の書かれたウェブサイトで多く使われている(名 詞)を属性とした,との回答であった.それに関連して,属性が何であるかをしっかり決めないと可視化の方針も 定まらないのではないかとの質問があり,それに対して,評判情報のサイトであっても明示化されていない属性 がテキストに埋もれているので,それを明示したいとの研究動機の説明があった.次に,評判サイトでは「〜が 悪い」という評判はたくさんあるが,「〜は良い」という評判は多いのか?という質問があった.それに対して は,たとえば「価格com」限定であるが,レビューのページにはそういう記述も多いとの回答であった.最後に, 抽出パターンでどの程度の評判情報を取れたかとの質問があり,人手で抽出した場合の4割程度であるとの回答 があった.続けて,パターンを増やしていく方向なのかとの質問があり,研究の主軸はそこではなく省略表現の 補完なので,そちらに力をいれたいとの回答であった.
関連語を考慮した重み付tfを用いたBM25による検索精度向上
○藤田 尚樹,高橋 大和,小長井 俊介,片岡 良治(日本電信電話)
概要
サーチエンジンにおいて検索キーワードの頻度(tf)は重要な情報源である.し かし,tfの大きいページが必ず検索者の求めるページとは限らない.検索精度を 向上させる為にはページのtfを計算するだけではなく,ページに書かれている内 容を評価する事も重要である.本論文では検索キーワードの関連語頻度情報を用 いる事で検索精度を向上させる手法について記述する.我々はWikipediaのリン ク情報を解析して得られた関連語情報を利用し,ページ内のtfと関連語の頻度か ら重み付tfを算出した.評価実験では重み付tfに対応させたBM25による検索を実 施し,提案手法が検索精度向上に効果がある事を確認した.
Keywords: 関連語,BM25,検索精度向上,サーチエンジン

質疑応答議事録
はじめに,関連語の取り方にはシソーラスや共起などいろいろあるがウィキペディアを使う利点は何であるか との質問があった.それに対して,見出し語同士の説明関係になっているので研究の目的に適していると考えた 他の手法を併用することも手段の一つと考えているとのことであった.それに対して,ウィキペディアは構造が きれいで抽出が簡単という利点があるが,語の網羅性が限られるという欠点があるので,注意すべきであるとの コメントがあった.検索の精度が改善する/しないの原因の見極めはどうなっているか,との質問があった.それ に対して,一般語は多義性などのためか低下しやすく,固有名詞などは向上するとの回答があった.それに対し て,関係性を抽出して利用することでシソーラスなどの辞書で改善したり,数値評価したりできるのではないか とのコメントがあった.次に,形態素解析器は何であるかとの質問があり,論文にあるとおり自社製のJTAGであ るとの回答であった.次に,形態素解析結果の何を単語として扱っているかという質問があったが,名詞,動詞, 形容詞を利用しているとの回答であった.最後に,関連語で精度が向上するかは検索タスクに依存するので同意 語が有用な場合もあるとの質問があったが,informationalなタスクのキーワード検索を対象としているので,精 度は良くなり,対照的にナビゲーション的なタスクでは精度があがらなかったとのことであった.
アンケートのフリーテキスト分析における名詞の表記ゆれ提示手法の提案
○田村 直之(大日本印刷)
概要
アンケートに記載されたフリーテキストを定量的に分析するテキストマイニン グ業務において,課題となっているアンケート内に出現する同義語や表記のゆれ に対応する為の辞書作成作業の工数を削減するために,分析するアンケートに出 現する名詞の表記ゆれを自動で提示する手法を提案する.名詞の表記ゆれ課題を その特性によって4パターンに分類し,それぞれの解決手法を提案する. その中の2パターンにおいて,実際のアンケート4099件を用いて精度評価を行っ た結果,精度良くアンケートに含まれる名詞の表記ゆれを提示することを検証で きた.
Keywords: テキストマイニング,自然言語処理,表記ゆれ,手書きアンケート,Wikipedia

質疑応答議事録
希望せず.
13:20-15:20 セッション7: Twitter ロング
座 長: 土方 嘉徳(大阪大学)
副座長: 井口 誠(シンクロア)

影響伝播モデルIDMの線形代数表現とTwitter分析への応用
○松村 真宏(大阪大学)
概要
本稿では影響伝播モデルIDMを再帰構造行列と重み行列のシューア積で表す新 しいモデルを提案する.また,影響量の期待値,計算量についても検討し, Twitterのデータを用いた簡単な分析例を示す.IDMではネットワークの構造的 特徴とメッセージの内容を同時に利用することにより,メッセージ,ユーザ,語 の影響量およびユーザプロファイルの推定やその相互関係の可視化など,多様な 切り口からの分析が可能であることを示す.
Keywords: 影響伝播モデル,IDM,影響量,ソーシャルメディア

質疑応答議事録
聴講者からの「RTでまるごと転載した場合は影響量が大きくなりすぎるのではないか?」という質問に対して, 発表者から「Twitterの140文字制限という特性により,多段にRTされると重要な語だけが残る傾向が見られ,結 果としてIDMにとっては良い影響があった」という回答があった.また,「Twitterは俗人性が高いため,有名人 の影響が大きくなるのではないか」という質問に対しては,「そのような傾向があることは確かだが,あまり有 名ではないが影響力のあるユーザを発見できるのがIDMの特徴である」との回答がなされた.また,「Twitterで 使用している顔アイコンにより他人への影響力が変わるのではないか」という質問があり,「確かにその通りで あり,掘り下げると社会心理学的な知見があるかもしれない」との回答がなされた.
Breaking News Detection in Twitter
○Swit Phuvipadawat,Tsuyoshi Murata(東京工業大学)
概要
Twitter has been used in one of the communication mediums for spreading breaking news. We proposed a method to collect and group similar messages together to form a news story. Since short length messages are difficult for similarity comparison, we boost scores on proper nouns to improve the grouping results. Each group is ranked based on popularity and reliability factors. An application based on the proposed method is developed. Each story is provided with the information of the message originator, development of story and activity chart indicating the number of messages within a given time period.
Keywords: Twitter, Real-time Text-mining, Information Retrieval, Topic Detection and Tracking

質疑応答議事録
A question about filtering noises from tweets with "#breakingnews" hashtag was raised by the audience. The author answered that they are filtering the tweets so as to reduce SPAM messages; the filter method adopted includes excluding tweets submitted by users who are following excessive number of users. The related question on the amount of SPAM tweets with "#breakingnews" hasttag was raised by the audience. The author answered that about 20% of the tweets are determined as SPAM. The difference between the previous works on extracting hot topics from blog entries and their work was asked by the audience. According to the author, the main difference is the realtimeness; their work is aiming at extracting breaking news as quickly as possible from the tweets, so the time-constraint requirement is stricter in their work as compared to the previous works.
既存コミュニケーション基盤を前提としたグローバルセンサデータマイグレーション
○羽田 久一(慶應義塾大学),宇夫 陽次朗(IIJイノベーションインスティチュート)
概要
本論文は,センサ情報処理に関する一連のフローのうち,センサによる実空間 の情報の収集系および配送系の設計において既存の大規模情報システムの転用を 提案する.これらのシステムは,既に高いレベルで継続的な同時並列リクエスト の処理を実現しており,専用のシステムを構築する際の開発および普及のコスト を削減できるほか,汎用性という可能性を持つ.本論文では,Twitterを用いてセ ンサから得られたデータを配送する仕組みを試作し,センサ情報の配送系および 得られたデータの利用可能性について考察する.
Keywords: センサネットワーク,Twitter,センサ応用

質疑応答議事録
聴講者からの「どの程度のセンサ利用を想定しているのか」という質問に対して,発表者から「特定の想定はな いが,環境の監視をしたいというのが元々の動機である」との回答があった.「他の情報を付加情報として合わ せて提示するなどについては検討しているのか」という問いに対しては,「現状未着手だが,実世界の情報と組 み合わせるなどを試してみたいと考えている」との回答があった.また「そもそもTwitterである必然性はあるの か」という質問があり,これに対しては「Twitterである必要はないが,半リアルタイム性のある情報を取り扱う にあたり相性がよかったので採用している.また汎用基盤を分離して用いるという目的もあった」との回答がな された.この点について,会場よりさらに「センサ毎に調整が必要な処理があるはずであり,どのみち独自実装 が必要になるのではないか」というコメントがあり,これに対しては「当然作り込む部分はあるが,汎用機能は 共通でありスクリプトなどを共有することができると考えている」との回答があった.その他「電池持ちはどう か?」という質問に対して,「ゲートウェイは常時電源を利用することを想定しており,電池を利用するのはセ ンサのみであるため問題にはならない」との回答があった.
街に着目したTwitterメッセージの自動収集と分析システムの提案と試作
○松村 飛志,安村 通晃(慶應義塾大学)
概要
近年隆盛しているマイクロブログサービスであるTwitterでは,多くのユーザ ーが頻繁にメッセージをやりとりしているため,ブログよりもリアルタイム性の 高いテキストが常に大量に配信されている. 筆者は,こうした膨大なつぶやきを街という特定の視点に着目して分析するこ とによって,Twitter上で今現在どの街がより多く言及されているのかを知るこ とができると考えた.また,それらのテキストを分析することで,何故その街が 言及されているのかを明らかにすることができるのではないかと考えた. 本研究ではTwitterのデータを利用して街のトレンドを明らかにすることを目 的にTwitterメッセージの自動収集・分析システムの実装を行い,その成果につ いて考察した.
Keywords: マイクロブログ,Twitter,GIS,街のトレンド,情報要約

質疑応答議事録
会場より「例えば『中央線』のような範囲が広いもののtweetにおけるバーストの関連性について何か知見があっ たのか」という問いがあり,発表者より「台風や雪に関するtweetが地域に沿って移動していくことが確認できた 」という回答と,「領域やキーワードをどう定義するのかが課題となる」とのコメントがあった.会場よりさら に「バースト検出時に,tweetの内容によってバーストの形が異なるなどの知見はなかったか」との問いがあり, 発表者からは「今回はそのような解析はしていない」との回答があった.この他,会場からは「しばらくバース トの様子を監視しておき,従来のパターンと異なる形を示すものをフィルタリングするなどの方法も検討してみ てはどうか」とのコメントが寄せられた.
15:35-17:05 セッション8: Webシステム ロング
座 長: 品川 徳秀(東京農工大学)
副座長: 齋藤 ひとみ(愛知教育大学)

RFIDタグを用いたオンライン英単語学習支援環境の構築
○鮫島 聡志,砂山 渡(広島市立大学)
概要
近年,英単語を学習するための環境として,Web上の学習ゲームがはやりつつ ある.しかし,机上の暗記学習では記憶に残りにくいことや,頭の中で日本語を 英語に訳す作業が入ってしまうため,実体験に基づく直感的な学習環境が望まれ る.また,実際のものを自動的に区別するための方法として,物流管理などの分 野では,RFIDタグを用いられることが多くなってきた. そこで本研究では,身の回りのものにRFIDタグを取り付けることで物を自動的 に区別できる環境と,Web上での英単語学習環境とを組み合わせることを目指す. 本稿においては,Web上の環境構築の前段階として,RFIDタグを用いたオンライ ン英単語学習環境を提案する.実際の物を扱う中で,物の形状や印象を利用して, 暗記ではない実用的な英単語の習得を支援する.実験により,提案する環境が, 英単語の学習と定着に有効であることを確認した.
Keywords: RFID,学習,英単語,ゲーム

質疑応答議事録
「この学習環境の対象者は誰か.」という質問に対し,「長い目で見て英単語を学習したい人を対象にしてい る.」との回答があった.また,「英単語テストと確認テストをやっているが,そもそもタスクが違うのでは.」 という質問に対し,「英単語テストではあまり結果がよくなかったので確認テストを追加した.」との回答があ った.それに対し,「確認テストで定着したとしても,英単語テストで英語が書けるかどうかは微妙なところだ と思うので並行して評価した方がよい.」との意見があった.また,「なぜゲートを使ったのか.」という質問 に対し,「触れる機会をより長くさせたかったので,ゲートを使った.」という回答があった. また,「名詞以外の動作や形容詞,概念などの英単語の学習に拡張できるか.」という質問に対し,「RFIDを オブジェクトに付けるため,名詞のみになってしまう.」との回答があった.それに対して,「例えば体に貼り 付けるとか動作をとってみるとかはどうか.」という意見があり,「ゲートでは動作まではとれないので拡張は 難しい.」との回答があった.この質問に関連して,「英単語学習で動作などに拡張するということであれば, RFIDではなくモーションセンサーなどを使えば可能なのでは.」との意見があり,それに対して「RFIDを使って 何か行おうという目的があったので,センサーなどを使うということは考えていない.」という回答があった. また,「画像を見て英単語を覚える場合と学習の定着率を比較するべきではないか.」との質問に対し,「比較 はしていないが,画像を用いた場合だと物の大きさや香りなどが分からないので,こちらの方が有利になるので はないか.」との回答があった.それに対して,「単語帳の暗記学習とでは,比べたいポイントを比べられてい ないという気がするので,その点は検討してもらいたい.」との意見があった. また,「歩かせたので体で覚えてしまったのでは.」との質問に対し,「手触りなどとも関連するので,動き で覚えてもらってもいいと考えている.」との回答があった.また,「動かした頻度と記憶定着率の相関はある のか.」との質問に対して,「分析はしていないが,その可能性はある.」との回答があった.さらに「回数と 定着率の相関があるのであれば,覚えにくい単語を回数多めに出して覚える機会を増やすということもできるの では.」という意見に対して,「今回は好きなオブジェクトを出すという形式だったため,出したことのないも のはどうしても出ないという傾向があった.その点は今後検討する.」との回答があった. 最後に,「ゲームで学習するという話と実物体を扱うという話は,分けて評価する必要がある.実物体や体験 による学習など英語教育の文献を探されるといいのではないか.それらを踏まえて,実験や学習デザインなどを 考えたらよいのでは.」というコメントがあった.
商品の価値とユーザの嗜好を考慮した商品推薦システムの提案
○伊藤 ゆかり(同志社大学),波多野 賢治(同志社大学),松本 尚宏(株式会社ワインスペース)
概要
近年,インターネットを用いた商品の購入は消費者に広く浸透してきている. 消費者の好みに合う商品を推薦して購買意欲を促進させるため,消費者の閲覧履 歴や購入履歴を用いて他人との協調フィルタリングを行う研究が多く行われ,実 用化されている.しかしながら,消費者の嗜好を的確に捉え,適切な商品を推薦 することには,多くの改善の余地がある.本稿では,似た評価傾向を持つとされ たユーザ間で協調フィルタリングを行う推薦システムを提案する.評価データに は商品へ付与された複数の評価を利用し,主成分分析を用いて個人の評価傾向を 特徴づける.複数の評価項目を用いてユーザの分類を行うため,似た嗜好をもつ ユーザであると判断する基準を従来手法よりも細かく考慮することができ,より ユーザの好みに合致する商品を推薦できると考えられる.
Keywords: 協調フィルタリング,主成分分析

質疑応答議事録
希望せず.
キーバリュー型データストア〜クラウドを支えるデータベース技術〜
○下村 綾香(神戸電子専門学校),長行 康男(神戸情報大学)
概要
キーバリュー型データストアとは,キーとデータをペアで保持する機構及びシ ステムである.データ操作言語は用いず,キーを指定することでデータ操作を行 う.従来のデータベースよりも単純な構造で,高速に処理を行うことができる特 徴がある.近年注目されているクラウドコンピューティングとも密接に関わって おり,クラウドを推進する企業をはじめ,様々なサービスで使われ始めている. 本稿では,キーバリュー型データストアの概要を示し,どのような長所・短所が あるのかを説明する.また,現在開発されているキーバリュー型データストアの ソフトウェアついても紹介していく.
Keywords: キーバリュー型データストア,クラウドコンピューティング,データベース,分散処理

質疑応答議事録
「今回のサーベイではRDBやSQL対KVSという対決構造でまとめていたが,SQL型とKVSの技術を統合しようという 動きがある.そのような動きをふまえて,今後それぞれの技術はどのように発展していくのだろうか.」との質 問に対し,「RDBとKVSは使い道によって導入する場面を分けていく必要がある.KVSについてはセキュリティ面の 改善が求められる.またRDBに関しては,使い道を再検討する段階に来ているのではないか.」との回答があっ た.この回答に対して,「ACMのCACMの今年の1月号に関連する記事が寄稿されていたので参考にされてはどう か.」とのコメントがあった. また,「KVSではキーに対して値をいくつ保存できるのか,1つに限定されるのか.」との質問に対し,「ソフ トウエアによって異なります」との回答があった.この回答に対し,「アクセス速度の面などにおいて,KVSと SQLをどのように使い分ければよいのか.」との質問があり「キーバリュー型データストアはキーによる検索を得 意としているので,ユーザIDのような一意に識別できるコードによる検索が多い場合にはKVSが適している.ま た,頻繁に更新されないデータや複雑なデータに対しては従来のリレーショナルデータベースが適している.」 との回答があった. また,「一般的にキーバリューストアといった場合には,分散やレプリケーション,オブジェクトの自動シリ アライズなどはすべて含むのか,あるいはいくつかの条件は外してもよいのか」との質問に対し,「キーバリュ ーストアにおいてそれらの要素をどこまでサポートすべきなのかは明確に定義されていない.」との回答があっ た.
17:20-18:50 セッション9: 時系列解析 ロング
座 長: 是津 耕司(情報通信研究機構)
副座長: 大塚 真吾(物質・材料研究機構)

テキストのキーワード間の関係と変化を捉えるための地図型アニメーションインタフェース
○錦戸 拓也,砂山 渡(広島市立大学)
概要
本稿ではテキスト中のキーワード間の関係と変化の把握を支援する,地図型ア ニメーションインタフェースを提案する. コンピュータやWebの発展による電子テキストの増加に伴い,テキストの取捨 選択や内容把握を支援する研究が盛んに行われている. しかし,従来手法の自動要約やキーワード抽出では,テキスト中におけるキー ワードの組合せやその変化を把握することが難しい.そこで,提案インタフェー スはテキスト中のキーワードの関係を表す地図を段落毎に作成した上で,段落間 の関係の変化をその変化の説明文とともにアニメーションで表現する. 実験から,提案インタフェースはキーワード間の関係を把握することの支援に 有効と確認した.
Keywords: テキスト,組合せ変化,キーワード地図,アニメーションインタフェース

質疑応答議事録
座長から,時間関係が並列している場合や時間を遡った文章が書かれている場合はどう対処するのか?という質 問に対し,発表者から,段落の中で大きく変化する場所などを特定することで対処が可能であると考えているが ,今回の実験では中心人物が固定されたがものを対象としたため,時間関係が並列になることは無かった.将来 的には対象となる人物の幅を広げていきたい.との回答があった.さらに座長から,このインターフェースはス トーリーを把握するためのものなのか?ストーリーをなぞってテキストでは無いもので情報を提供するものなの か?これは何に使うと一番良いのか?という質問に対して,発表者から,理想は内容把握するための支援するイ ンターフェースである.従来は要約文を使って内容把握を行っているが,それと同レベルのものを目指している. 現段階ではまだ足りていない部分があるが,改良を加えていって要約に代わるものを作成したい.という回答が あった.聴講者から,このシステムはニュース記事の俯瞰や株式市場の雰囲気に利用するのには適していると思 うが,小説はテキストで見ることを想定したコンテンツのため小説を対象とする理由が分からない.という質問 に対して,発表者から,今回はこのシステムの有用性を検証するために長い文章である小説を対象としたが,今 後はテキスト以外のデータに対しても検証を行っていきたい.という回答があった.聴講者から,Web上に存在す る品質の悪い文章(登場人物が多すぎるなど)を対象に実験を行ったか?という質問に対して,発表者から,実験 は行ったが,登場人物が多いと良い結果が得られなかった.という回答があった.
Web閲覧を伴うインフォーマル対面会話における話題推移を利用した会話支援システムの提案と評価
○藤森 響,田野 俊一(電気通信大学),三澤 純子(電気通信大学/エム・ティ・プランニング),市野 順子, 橋山 智訓,江崎 朋人(電気通信大学)
概要
近年,表示中のWebページについて会話をするWeb閲覧を伴うインフォーマル対 面会話の機会が増えた.また,対面会話はツールが発達した現代においても重要 である.しかし,音声認識に基づく会話のリアルタイム解析は技術的に困難であ り,会話内容を考慮した支援は行われていない.本研究では表示したWebページ 内容が会話に一致し,会話データを大量に収集できるWeb閲覧を伴うインフォー マル対面会話に着目し,特徴を活かした会話支援システムを提案・評価する.継 続的な会話支援を行うための沈黙インジケータや,話題・参加者を考慮した推薦 話題を提示するトピックボタンなどを実装したプロトタイプを用いて評価実験を 行い,その有効性を確認した.
Keywords: インフォーマルコミュニケーション,対面会話,会話支援,会話履歴,Web履歴

質疑応答議事録
希望せず.
Time-Arrayed SOMによる時系列テキストコレクションの可視化
石川 雅弘(つくば国際大学)
概要
ニュースやブログ記事など,ウェブ上には時間とともに生産されるテキスト情 報が蓄積され続けている.それらの全体を俯瞰するためにはクラスタリングが有 効であるが,人間に把握しやすいように可視化することが重要である.本稿では, Time-Arrayed SOMを用いた,時系列テキストデータのクラスター構造とその経時 変化の可視化手法を提案する.例として新聞記事データを対象とした分析を行な い,その結果を示す.
Keywords: 可視化,クラスタリング,クラスター構造の経時変化,時系列テキスト,自己組織化写像

質疑応答議事録
聴講者から,このシステムを歴史の教科書を対象としたら面白そうだと思うのだが?という質問に対して,発表 者から,このシステムではドキュメント集合を単位としているため,教科書の場合はドキュメントの時間毎の分 割が難しいが,分割が可能であれば国ごとの結果などを表示できるかもしれない.という回答があった.座長か ら,この研究の最終目的はブロガーの様子を俯瞰したいということだが,それに向けて,現時点で足りないこと は何か?という質問に対して,発表者から,まず,ブロガーを表現して,ブロガー同士の類似度や距離を定義し たい.という回答があった.また,座長から,このシステムでブロガーを可視化すると,どんなことが見えてく るのか?という質問に対して,発表者から,可視化により何が見えるのかということを第一の目標にしているの で,いまのところ具体的な回答はできないが,将来的にはマーケティングに応用できるのではないかと考えてい る.という回答があった.聴講者から,新聞記事の流れには意味はなく,マーケティング的にはブロガーが何を 考えてどう成長したのかという変化が読み取れれば面白いと思うが,それについてはどう考えているのか?とい う質問に対して,発表者から,ブロガーが書いた記事を解析することで,ブロガーの関心の変遷が抽出できるの で,これを用いてブロガー同士の類似性を見ていきたい.と回答があった.聴講者から,時間が経過するとクラ スタが増減するので,記事が増えるたびに再計算が必要ということなのか?という質問に対して,発表者から, 表示している色付のクラスターについては最後の段階で再計算が必要である.という回答があった.聴講者から, 東大の橋本先生が話題の変化について可視化を行う研究を色々やられているので参考にして下さい.とのコメン トがあった.
 
───────
運営委員会
───────
実行統括担当:松下 光範 (関西大学)
プログラム担当:櫻井 茂明 (東芝 研究開発センター)
受付担当:杉原 太郎 (北陸先端科学技術大学院大学)
ローカル・特別企画担当:土方 嘉徳 (大阪大学)


「これまでの活動」に戻る
 
本ページに関する問い合わせ
wi2−webmaster@mail,ieice.org