メインメニュー






















第22回研究会
●第22回Webインテリジェンスとインタラクション研究会
日時 2012年3月17日(土) 10:00〜18:30(9:30 受付開始)
   2012年3月18日(日) 09:45〜16:45(9:15 受付開始)
会場 中央大学後楽園キャンパス(〒112-8551 東京都文京区春日1-13-27)
   http://www.chuo-u.ac.jp/chuo-u/access/access_korakuen_j.html

→プログラム →特別講演 →学生奨励賞 →質疑応答議事録 →学生参加報告(PDF)
→運営委員会

2012年3月17日(土)〜18日(日)に,中央大学後楽園キャンパスにて「第22回Webインテリジェンスとインタラクション研究会が開催されました.講演件数は,27件(ロング発表は8件,ショート発表19件),参加者数は121人(内学生51人)でした.一般講演では,Twitter, Linked Data, 情報検索,情報推薦,Wiki, ブログ,テキストマイニング,評判情報分析,ソーシャルネットワーク,GUIと機械学習,自然言語インタフェースなどに関する発表がありました.



特別企画として,「レジリエンスとWebインテリジェンスとインタラクション」と題してパネル討論を行いました.パネリストして,狩川 大輔氏(東北大),長坂 俊成氏(防災科学技術研究所),榊 剛史氏(東大),野田 五十樹氏(産総研)をお招きし,それぞれの立場で東日本大震災からの復興やITサービスの使われ方について述べていただきました.懇親会は,後楽園のレストランで行い,親睦を深めました.


一般発表の様子です


一般発表の様子です


一般発表の様子です

質疑応答の様子です


懇親会の様子です

懇親会の様子です


パネル討論の様子です

パネル討論の様子です

発表者の方には,写真掲載の許可をいただきました.ありがとうございました.
 
───────
プログラム
───────
■ 3月17日(土)(9:30 受付開始)
10:00-10:15 開会挨拶  (土方嘉徳 委員長)

10:15-12:15 セッション1: Tweet・Linked Data分析(ロング発表)
 座長: 加藤 文彦(国立情報学研究所)
 副座長: 松下 光範(関西大学)

1. 時空間連続性を考慮した共起辞書構築による旅行ツイートの組織化
長谷川 馨亮,馬 強,吉川 正俊(京都大学)
2. Twitterからの交通情報検出の可能性
佐々木 健太,長野 伸一,上野 晃嗣,長 健太(株式会社東芝 研究開発センター)
3. リソース間の有意な関係を発見するRDFデータ解析手法の提案
大西 可奈子,小林 一郎(お茶の水女子大学)
4. 住民参画Webプラットフォームのための地域の社会問題に関するLOD構築支援システム
平田 紀史,佐野 博之,Robin Swezey,白松 俊,大囿 忠親,新谷 虎松(名古屋工業大学)
12:15-13:30 昼休み(75分)

13:30-14:30 セッション2: テキストマイニング(ショート発表)
 座長: 櫻井 茂明(東芝ソリューション)
 副座長: 風間 一洋(日本電信電話株式会社)

5. 共起関係に基づく制約知識を用いた潜在トピック分類の一考察
立川 華代,小林 一郎(お茶の水女子大学)
6. 複数の時系列データの関連性に基づく言語化のための基礎的考察
小林 瑞季,小林 一郎(お茶の水女子大学)
7. ラフ集合を用いた個人の嗜好に関する感性のモデル化および検証
小玉 一貴,荻野 晃大,中島 伸介(京都産業大学)

14:30-14:40 休憩(10分)

14:40-16:20 セッション3: 情報アクセス(ショート発表)
 座長: 小林 一郎(お茶の水女子大学)
 副座長: 杉原 太郎(北陸先端科学技術大学院大学)

8. 就職活動における内省支援のための予備検討 -- エントリーシートの改善点に対する気づきの観察
木津川 翔太(関西大学), 白水 菜々重(奈良先端科学技術大学院大学), 松下光範(関西大)
9. 効率的な食材消費を支援する献立推薦手法の提案
永吉 智也(京都産業大学),上田 真由美(京都大学),木原ひかり,宮脇 佑介,中島 伸介(京都産業大学)
10. 機関横断型文献情報Wiki〜コミュニティベースのメタデータ対応付けの試み〜
日向野 達郎,増田 英孝,山田 剛一(東京電機大学),清田 陽司,中川 裕志(東京大学)
11. アフィニティ・プロパゲーションを用いた高精度な3次元モデル分割手法
村上 卓,青野 雅樹(豊橋技術科学大学)
12. 投稿パターンの時系列分析による先読みブロガー発見手法
朝永 聖也,中島 伸介(京都産業大学),Adam JATOWT(京都大学),張 建偉(京都産業大学),稲垣 陽一,Reyn NAKAMOTO(きざしカンパニー),田中 克己(京都大学)

16:20-16:30 休憩(10分)

16:30-18:30 セッション4: CGM (Consumer Generated Media) 分析(ショート発表)
 座長: 鈴木 優(名古屋大学)
 副座長: 西山 莉紗(日本アイ・ビー・エム株式会社)

13. Analysis of New Year's Resolutions Extracted from Twitter Post to Capture User's Long Term Goals
Dandan ZHU (The University of Tokyo),Yusuke Fukazawa (The University of Tokyo/NTT DOCOMO, INC.), Karapetsas Eleftherios, Jun Ota (The University of Tokyo)
14. ランキング学習によるQAコンテンツのベストアンサー推定
長野 敬介,青野 雅樹(豊橋技術科学大学)
15. コスメアイテム口コミサイト構築のための種類別の評価観点の抽出手法の提案
濱岡 祐美(京都産業大学),上田 真由美(京都大学),中島 伸介(京都産業大学)
16. 価値観に基づく情報推薦に向けて:ユーザのこだわりに着目したレビュー分析手法の提案
服部 俊一,毛 中杰,高間 康史(首都大学東京)
17. 商品の評価を対象としたレビュー文書の分析への取り組み
落合 恵理香,小林 一郎(お茶の水女子大学)
18. 複数のオンラインソーシャルネットワーク間におけるアカウント到達可能性を利用したプライバシ攻撃モデルの調査と考察
石澤 恵,渡辺 知恵美(お茶の水女子大学)

■ 3月18日(日)(9:15 受付開始)
9:45-11:45 セッション5: 情報アクセス(ロング発表)
 座長: 渡辺 知恵美(お茶の水女子大学)
 副座長: 大西 可奈子(お茶の水女子大学大学院)

19. 適合性フィードバックと統計的仮説検定を利用したニュース推薦手法の提案
藤田 将成(NTTサイバーソリューション研究所)
20. Webハザードマップにおけるコンテキストアウェアな情報提示に関する検討
辻 俊光,北川 悠一,堀 雅洋(関西大学)
21. 潜在トピックの配分を考慮した複数文書要約
重松 遥,小林 一郎(お茶の水女子大学)
22. ファセット検索と統合されたキーワードサジェストのための重み付け手法の評価
木村 久美子,久世 皓司,堀 雅洋(関西大学)

11:45-13:00 昼休み(60分)

13:00-15:00 特別企画「レジリエンスとWebインテリジェンスとインタラクション」
パネリスト:
・狩川 大輔(東北大 技術社会システム専攻 助教)
・榊 剛史(東大 技術経営戦略学専攻 博士課程)
・長坂 俊成(防災科学技術研究所総合防災研究部門主任研究員)
・野田 五十樹(産総研 サービス工学研究センター)
司会者:
杉原 太郎(北陸先端科学技術大学院大学)

15:00-15:10 休憩(10分)

15:10-16:30 セッション6: 情報インタフェースとWebインタラクション(ショート発表)
 座長: 高間 康史(首都大学東京)
 副座長: 齋藤 ひとみ(愛知教育大学)

23. 学習機能をもったアイコン整理システム
大河原 昭, 坂本 大介, 五十嵐 健夫(東京大学/JST ERATO)
24. アプリケーションを操作する自然言語インタフェース開発への取り組み
大谷 麻璃,小林 一郎(お茶の水女子大学)
25. 視線データとログデータに基づくWebサイト閲覧者の目的達成の確率推論モデル
前田 俊介,松下 裕(金沢工業大学)
26. ハウツー情報間の共通性に基づく検索結果の提示手法
湯本 高行(兵庫県立大学)

16:30-16:45 閉会の挨拶(土方嘉徳 委員長)

 
──────────────────────────────────
◇特別企画(パネル討論):「レジリエンスとWebインテリジェンスとインタラクション」
──────────────────────────────────
司会者:
杉原 太郎(北陸先端科学技術大学院大学)

企画概要:
震災からちょうど1年が経過しようとしている現段階で,Web技術に何ができて何 ができなかったのか,またダメージを負った被災地を直接的あるいは間接的に支 える手立てとしてWeb技術に何ができるのかを,レジリエンスをキーワードに考 えてみたいと思います.
「レジリエンス」とは企業や情報システムが持つ,危機や障害からの回復力を意 味する言葉です.本企画では震災およびそこからの回復に関する研究の第一人者 の方にお越しいただき,Web技術による被災地支援の可能性について会場を交え て議論します.

パネリスト:(発表者順)
・狩川 大輔(東北大)
 「「安全」再考 −レジリエンスエンジニアリングの視点から−」
・長坂 俊成(防災科学技術研究所)
 「防災と現在の東北地方の状況」
・榊 剛史(東大)
 「大規模災害時におけるソーシャルメディアの活用とその構造変化について」
・野田 五十樹(産総研)
 「通れたマップと災害のためのデータフォーマット」



狩川 大輔氏(東北大)


長坂 俊成氏(防災科学技術研究所)


榊 剛史氏(東大)


野田 五十樹氏(産総研)

 
───────
学生奨励賞
───────
WI2研究会では,学生による優秀な研究発表に対して学生奨励賞を授与し,学生のさらなる研究活動を奨励することにしております.学生による全ての発表に対して,WI2研究会実行委員の全員と,各セッションの座長・副座長(ご自身の担当のセッションだけでなく,他のセッションも審査していただております)により,研究内容とプレゼンテーションの両方の観点から,評価を行っております.今回は,評価の高かった,以下の発表者が学生奨励賞を受賞されました.

学生奨励賞
石澤 恵さん:「複数のオンラインソーシャルネットワーク間におけるアカウント到達可能性を利用したプライバシ攻撃モデルの調査と考察」(お茶の水女子大学)
(共著者:渡辺 知恵美)

重松 遥さん:「潜在トピックの配分を考慮した複数文書要約」(お茶の水女子大学)
(共著者:小林 一郎)



代役で受け取られた渡辺先生


受賞された重松遥さん

 
───────
質疑応答議事録
───────
■ 平成24年3月17日(土)
セッション1: Tweet・Linked Data分析(ロング発表)
 座長: 加藤 文彦(国立情報学研究所)
 副座長: 松下 光範(関西大学)

1. 時空間連続性を考慮した共起辞書構築による旅行ツイートの組織化
 ○長谷川 馨亮・馬 強・吉川 正俊(京都大学)
概要
我々は,Twitter上のコンテンツの中から,断片化された旅行体験に関するツイートをまとめて整理する手法について研究している.本稿では,候補となるツイートと整理したい体験の関連度を計算する際に用いる共起辞書を旅行体験における行動の時空間連続性に着目して構築する方法について提案した.また,本稿では提案手法の評価実験を行い,共起辞書に時空間連続性が反映されていることと,提案手法によりキーワード検索の結果による組織化よりも高精度の組織化が行えることが確認された.
Keywords: マイクロブログ,Twitter,ユーザ体験,時系列データ,共起辞書

質疑応答議事録
聴講者から,連続する Tweet を対象としてその話題の区切りを検出する先行研 究との違いは何か,という質問があり,発表者から,先行研究では連続した Tweet を投稿時間などを考慮して話題の分節化をおこなっているが,本研究で は,連続Tweetの分節化が目的ではなく,特定の話題に関連するTweetを取り出 すことが目的であるという回答があった.
次に,今回は旅行Tweetに限定しているのでうまく機能しているが,一般的な状 況では必ずしも旅行Tweetのみが獲得できるわけではない,という指摘が聴講者 からあり,それに対して,今後Tweet内容からそれが旅行Tweetか否かを判定す ることも検討したいという回答があった.
また,共起辞書を一日ごとに作成する点が面白いが,その区間の妥当性につい ての検証は行ったのか,という聴講者からの質問に対しては,現在,共起辞書 の作り方に拠る精度変化を調べているところであるという回答がなされた.そ れに関連して聴講者から,一日のツイートに絞ると,共起辞書がスパースになっ てしまうのではないかという指摘があり,発表者から,有名な場所であれば問 題ないが,マイナーな場所では確かに獲得できるTweetが少なくなるので,今後 検討したいという回答があった.
最後に,最終的なアプリケーションイメージについての質問があり,発表者か ら,過去の Tweet の振り返り支援のために,旅行体験に関するTweetを地図上 にまとめてアルバムを作るなどのアプリケーションを考えている,という回答 があった.
2. Twitterからの交通情報検出の可能性
 ○佐々木 健太・長野 伸一・上野 晃嗣・長 健太 (株式会社東芝)
概要
近年,注目を浴びているスマートコミュニティを構成するモジュールの一つに,センサから取得した情報を利用してリアルタイムに交通情報を把握する次世代交通システムがある.本研究では,Twitterをセンサの一つとして見なし,Twitterから交通情報,特に鉄道の運転見合わせ,遅延などの運行情報をどの程度正確,且つ,迅速に検出できるのか,その可能性を探る.ツイートが持つ情報の不確実性についてはヒューリスティックスなルールによるテキスト処理,路線による情報量の違いについては統計処理におけるパラメータ値最適化により,検出結果のF値が0.85,検出までに掛かる時間が3分台となり,Twitterからの交通情報検出の潜在的可能性を確認した.
Keywords: 次世代交通システム,交通情報,運行情報,Twitter

質疑応答議事録
まず,聴講者から,未来の事象を「予測」しているわけではないので,「予測」 という言葉が不適切ではないか,という指摘があった.また,聴講者から,表 2に記載された運行情報のカウント方法についての質問があり,発表者から連 続して起きているものを1件(朝8時から11時まで運行情報が続いていれば それで1件)とみなしており,東京と渋谷のように別の場所で起きていても同 じ時間帯であれば1件と数えている,との説明があった.
次に聴講者から,本研究では F 値の向上に主眼を置いているが,実アプリケー ションを考えると,再現率を高めておいてユーザに判断させるのが実用的では ないか,というコメントがあった.
また,聴講者から Window サイズの自動設定の可能性についての質問があり, 発表者からは,現在は Window サイズは人手で決めているが,その幅自体はあ まり精度には影響がなく,むしろしきい値のほうが影響しているという回答が あった.それに関連して,聴講者から,絶対数よりも移動平均のほうが良いか もしれない,という指摘があった.
更に,聴講者から,電車が頻繁に来る地域ではあまり必要性は無いのでは,という 指摘があり,発表者から,その場合は運転見合わせのみに焦点を当てて,遅延は 対象としなければよい,という回答があった.
最後に,鉄道網のトポロジカルな情報を利用して,遅延状況の波及予測を検討 してはどうかというコメントが聴講者からあった.
3. リソース間の有意な関係を発見するRDFデータ解析手法の提案化
 ○大西 可奈子・小林 一郎 (お茶の水女子大学)
概要
Linked Dataの広がりにより様々な情報がRDFデータとして記述されるようになった.そのようなデータが巨大な集合知としての存在価値を高める一方で,巨大過ぎるが故に欲しい情報や重要な情報にたどり着くのが非常に困難であるという問題も生じてきた.本研究では,そのようなRDFデータから任意に選んだ特定のリソース群のグラフパターンを解析し,そのリソース群に最も依存している(関連が強い)と考えられるリソースの抽出を試みると共に,最も注目すべきリソースとリソースの関係を抽出する手法を提案する.
Keywords: RDFデータ解析,Linked Data,DBpedia

質疑応答議事録
まず,聴講者から,提案手法は,グラフ構造から関係性を見つける従来手法と 何が違うのか,という質問があり,発表者から,今回はプロパティの値まで考 慮してないので現時点の違いは少ないが,今後,プロパティの中身まで見てい くつもりなので,その段階になれば異なる,との回答があった.
次に,聴講者から提案手法の妥当性についての質問があり,発表者から,今の 段階はドメインに関する専門家の意見を聞きつつ試行錯誤している段階であり, 今後被験者実験を通じて,明らかにしていきたい,という回答があった.それ に関連して聴講者から,専門家の意見ではなく,RDFのグラフから読み取れるか 否かを検証比較する方が良いのではないか,という指摘があった.発表者はこ の指摘に対して,もともと推薦を考えていたので専門家の意見を尊重すること を考えている.DBPedia などとの比較による評価も検討すべきかもしれない, という回答があった.
また,聴講者から,現時点では,発見した関係に意味を後付しているように見 える,実際にはどのような関係を見つけたいのか,という質問があり,発表者 から,推薦システムへの応用を考えているため,作家間の影響関係から作風の 流れや広がりを見つけたい,との回答があった.
更に,聴講者から,WSDM2012 で発表された Inferring social ties across heterogenous networks (Jie Tang, Tiancheng Lou, Jon M. Kleinberg) が参 考になると思う,というコメントがあった.
最後に,聴講者から,関係性を見つけることが目的なのにオーソリティ/ハブと いうノードの評価手法を用いているのはなぜか,という質問があり,著者から, 距離2で見ているので,間に挟んでいる複数の人のうち,どの人を経由すれば 良いかを判断するため,という回答があった.
4. 住民参画Webプラットフォームのための地域の社会問題に関するLOD構築支援システム
 ○平田 紀史・佐野 博之・Robin Swezey・白松 俊・大囿 忠親・新谷 虎松 (名古屋工業大学)
概要
本研究では,地域の住民参画支援を目指した住民参画WebプラットフォームO2を開発中である.地域の社会問題に関連する情報をLinked Open Data (LOD) として蓄積し,住民参画のための情報共有基盤を目指している.ここでは,住民による議題の設定や意見入力が可能であり,これらの情報もLODとして蓄積する.住民参画における問題の分析には,意見自体の収集や,評価基準や役割などの意見の意味の推定などが必要である.本システムでは,意見やニュース記事などについて,意味情報を付与した関連付けを可能とする.構造化された意見や関連情報は,意見間の関係や議論全体の把握に役立ち,住民の意見入力の促進や,関連情報を用いた議論の円滑化などが期待できる.
Keywords: 住民参画Webプラットフォーム,議論支援システム,意見構造化,Linked Open Data,Twitter

質疑応答議事録
聴講者から,地域SNSなど住民参加型プラットフォームはいままで色々出ている が,それらとの違い,ならびに LOD を使ったメリットは何か,という質問があっ た.それに対して発表者から,実際にはあまり他のデータを参照しているもの は少ない.また,LOD を用いることで,住民から意見を把握したりする時に透 明性を確保することが期待できる,という回答があった.関連して,聴講者か ら,住民参加型でオープンな場では,意見を書きにくい状況もあるのではない か,という指摘があり,発表者から,現状では Twitter のアカウントと連携す ることを考えており,匿名でも言えるようにしている.それによってうまく本 音を引き出したい,という回答があった.
次に聴講者から,住民からの意見がゴミみたいなのもあるので,リンク付する のではなく,全部集めておいて検索できるようにしたら良いのではないか,と いう指摘があり,発表者から,匿名の投稿に関してはゴミが多い印象を持って いる,ユーザ管理によって対処したい,という回答があった.
また聴講者から,収集したデータをRDF化していくメカニズムについての質問が あった.発表者からは,現時点ではニュース記事などはタイトルなどを使ってい るのみで,詳しい言語解析はまだやっていない,という回答があった.
更に,聴講者から,イベントにはリテラルで名前はついてるのか,という質問 があった.この質問に発表者から,イベントの一覧としても見せるため,ニュー ス記事のタイトルの中から近似するものを付与するようにしている,という回 答があった.加えて,イベントをきっちり抽出するのが目的ではなく,議論の タネとして提供できればいいので,イベント抽出に時間をかけるのではなく後 の分析への利用に重点を置いている,との説明があった.それに対して,そう いった分析による知識体系の構築が主眼であれば,LODを用いる必要性が低いの ではないか,という指摘があった.発表者からは,住民がどう思っているのか をアクセス可能にすることが役に立つと考えている,という回答があった.
セッション2: テキストマイニング(ショート発表)
 座長: 櫻井 茂明(東芝ソリューション)
 副座長: 風間 一洋(日本電信電話株式会社)

5. 共起関係に基づく制約知識を用いた潜在トピック分類の一考察
 ○立川 華代・小林 一郎 (お茶の水女子大学)
概要
LDAを用いたトピック抽出では,各単語のトピック割り当てが確率モデルに従い推定されるため,意図しないトピックの抽出が起こる場合がある.それに対応するために特定のトピックを代表するような単語群をトピックの事前知識として与え,トピック抽出をする手法が提案されている.それを踏まえて,本研究では共起頻度が高い単語は同一トピックに含まれる可能性が高いと仮定し,文書内の単語間の自己相互情報量を基に,共起する単語群をトピック割り当ての制約となる事前知識として作成する.この事前知識を用いてトピック抽出を行い,その結果を考察する.
Keywords: トピック分類,ディリクレ森分布,事前知識,自己相互情報量

質疑応答議事録
単語共起は使用するデータセットに依存し,例えば宮島の鹿は広島の観光ブログのデータセットを使えばよいが,花札に関するデータセットでは鹿と蝶が結びつく,また大量のデータを使いすぎると一般的な単語が結びつきやすくなるので,制約抽出にどのようなデータセットを用いると良いかという質問には,例えば野田総理の例ではあらかじめ関連している英字新聞10記事に限定していると回答があり,さらにトピック抽出にどのようなデータセットを用いているのかという質問には,現在は制約抽出と同じであるという回答があった.
また,鍛冶らの類義語の自動獲得による制約付きの単語クラスタリング手法との違いは単に文書規模が違うだけかという質問には,さまざまな内容の文書からトピックを選ぶとおおまかなものしか選べないという回答があり,さらにそれに対して定量的な評価をして欲しいという要望があった.
最後に,対象文書数の選択基準を教えて欲しいという質問には,本当は最適なトピック数を推定しなければいけないが,今回は文書数に関わらず10個に決めうちしたという回答があった.
6. 複数の時系列データの関連性に基づく言語化のための基礎的考察
 ○小林 瑞季・小林 一郎 (お茶の水女子大学)
概要
私たちの身の回りで観測されるデータの多くは時系列データである.大量の時系列データを扱う際,個々の時系列データの振る舞いだけでなくそれぞれの時系列間の関連性をみる必要性も生じるが,それらを視覚的に俯瞰するのは難しい. そこで本研究では,複数の時系列データを比較し,それらの関係をわかりやすく言葉で説明することを目的とする.具体的なアプローチとして二つの時系列データの相関係数をとることより,おおまかに,(i)類似の動きをするもの(ii)対称の動きをするもの(iii)関連性がないもの,の3つのタイプに分類する.それぞれの分類に対して,SAX法を用いて数値データを記号化し,編集距離を拡張し,2つのデータの特徴的な箇所を抽出して言語で表現する.
Keywords: 時系列データ,相関係数,SAX,編集距離,言語化

質疑応答議事録
データ間の距離を直接計算せずに,わざわざ記号化してから編集距離を使う理由は何かという質問には,そのまま処理すると粒度が細かすぎるのでスムージングしたかったという回答があった.
さらに実験に用いた日経平均株価の17業種の選択基準は何か,業種で評価結果が違うのではないかという質問には,今回は特に基準を設けなかったので,今後は明確な基準を用いて選択したいという回答があった.
また,例えば任天堂の株価が上がり始めたら少し遅れてコナミの株価が上がることが多いので,そこでコナミ株を購入するような用途に使えるかという質問には,そのような用途にも適用できるようにしたい,現在でも5分後の動きでも対応できるはずだという回答があった.
なお,時系列データは一に予測,二に予測,三に予測,四に予測なので,将来的にどうなるかという予測という方向に持っていくと面白い研究になるというコメントがあった.
最後に,今回はどの部分が言語化なのか,「上昇」や「下落」と表現する部分かという質問には,あらかじめ用意したテンプレートから適切なものを選択している点を言語化と呼ぶという回答があった.
7. ラフ集合を用いた個人の嗜好に関する感性のモデル化および検証
 ○小玉 一貴・荻野 晃大・中島 伸介 (京都産業大学)
概要
本研究の目的は,各個人の好みに適する洋服や雑貨などをデータベース内から検索する個人適応型の情報検索システムを開発し,そのシステムを利用した個人適応型 Web サイトを構築することである. 本論文では,個人適応型の情報検索システムを実現するために,対象に関する人の好みを決定する過程をシステム上で模倣するためのモデルを生成する方法を提案する. 本提案手法により,各個人が好みの判断するときに重要視する対象の特徴とその関連の度合いを導出できる. 本論文では,嗜好モデルの生成方法と嗜好モデルの推定能力の評価実験結果について述べる.
Keywords: 感性モデル,ユーザ・プロファイル,個人化,情報検索,ラフ集合

質疑応答議事録
データセットをより注意して選ばないと,既存手法よりも本方法の方が有用とは言えないのではないかという質問には,これは第一段階で比較的良い傾向が出たが,今後どうなるかはまだわからないという回答があり,さらに従来手法との差分はどこかという質問には,重みを付けてルールが長い場合の関連度を低くしていること,ラフ集合はルールの抽出が目的だがどのルールが効いているかわかりにくいが,本手法ではどの属性が効いているかを分析していることであるという回答があった.
また,現実にはユーザのクリックなど好きに近い情報は収集できても,嫌いという情報はなかなか収集できない,本当に本手法を適用できるのかという指摘に関しては,今後の課題であるという回答があった.
協調フィルタリング的な方法で推薦した場合には,推薦理由とは別の理由を説明する問題点があるのではないかという質問には,協調フィルタリングの場合には理由の説明は難しいので,適した推薦手法を使う必要があるという回答があった.
重要な属性や嗜好に支配的な理由を見つけたいのだと思うが,機械学習にはルールを評価する方法がいくつか存在するが,なぜラフ集合を選択したのかという質問には,ラフ集合では好きか嫌いかというあいまいな部分を表現しやすいという回答がされたが,今の質問によりしっかり答えられるようにしてほしいという要望があった.
ユーザが洋服のシルエットのような現在の属性にない情報で選択した場合には,自分の意図していない理由で推薦されてしまわないかという質問には,ある程度データがたまってくれば,シルエットなども処理できるかもしれない,問題はどの程度学習できるかという点にあるという回答があり,さらにシルエットは色と異なり属性として表現できないという指摘に関しては,属性として100%表すことはできないが,なるべく人間の価値観に合う説明を付与できるように努力するしかないという回答があった.
最後に,単なる洋服の推薦ではなく,Amazonのように購入を意識させて推薦する場合には,もうすぐ春になるけど,そろそろ半袖がいいという実世界的な側面を入れると実用的になるというコメントがあった.
セッション3: 情報アクセス(ショート発表)
 座長: 小林 一郎(お茶の水女子大学)
 副座長: 杉原 太郎(北陸先端科学技術大学院大学)

8. 就職活動における内省支援のための予備検討 -- エントリーシートの改善点に対する気づきの観察
 ○木津川 翔太 (関西大学)・白水 菜々重 (奈良先端科学技術大学院大学)・松下 光範 (関西大学)
概要
本研究の目的は就職活動における内省支援システムの実現である. 就職活動において,エントリーシートの練度は選考に影響を及ぼす.多数の参考情報 が存在するにも拘らず,現状ではすべての学生がその内容を汲み取って実践できていない.この問題解決の一助として,本稿では瑕疵のある架空のエントリーシートの改善点を指摘させる課題を就職活動経験のある大学生に与え,聞き取り調査を行った.その結果,的確な指摘ができる学生ほど,批判的思考を行っている様子が確認された.一方で,指摘が乏しい学生には,発話数が少ない,問題点が明確にできない,論拠を伴わない指摘を行うことがわかった.
Keywords: 批判的思考,就職活動支援,文章産出,ユーザ支援,ペルソナ

質疑応答議事録
最初に,実験に使った仮想的なエントリーシート(ES)は正解があることを前提にしていたが,研究をはじめた動機として挙げていた「皆が同じようにESを作ることを避けたい」としたことと反するのではないかとの質問があった.今回は,第一段階の検討としてスクリーニングとして機能するかどうかを試してみることが目的であり,今後,多様なESの書き方を支援する方向に研究を進めたいと回答された.
続いて,他人の間違いは指摘できるが,自分のことはよく見えない人が多いように思うので,今後も自分でチェックするやり方で進めていくのかどうかについて,もう少しその辺りについて検討してはどうかと助言された.同様に,文章が上手であることと,批判的思考ができることと(自分のことについて理解していること)は別であり,両者をどのように切り分けているのかが実験を設計する上で重要な点であるので,慎重に検討して欲しいとコメントが呈された.
9. 効率的な食材消費を支援する献立推薦手法の提案
 ○永吉 智也 (京都産業大学)・上田 真由美 (京都大学)・木原 ひかり・宮脇 佑介・中島 伸介 (京都産業大学)
概要
共働きの夫婦など,1週間分の買い物をまとめて行うケースが考えられるが,単純に7日分のレシピを決定し,必要な食材を購入すると使い切れずに無駄になる食材が出る可能性がある.そこで,一定期間で食材を使い切れるようなレシピ群の推薦が必要となる.我々は先行研究にて,一定期間(例えば7日間)を対象とし,セット売りの食材や,1個の分量が多い食材を使い切ることができるレシピ群の推薦手法の提案を行ってきたが,主菜のみの推薦であり献立の推薦を行えていない,また,レシピの栄養バランスは考慮されていない.したがって,本稿では,栄養バランスを考慮することが可能な,効率的な食材消費を支援する献立推薦手法の提案を行う.
Keywords: レシピ推薦,献立推薦,余剰食材使いきり,PFCバランス,食材賞味期限

質疑応答議事録
まず,提案手法が7日間まとめ献立を推薦することを前提にしているのは現実的なのかと疑義が示され,もっと状況に応じて推薦するシステムにしてはどうかを提案された.同じように提案手法の前提についての質問が連続した.
必要な食材を推薦するのではなく,必要性の低い食材かつ献立が成立する情報を推薦する方法があるのではないかと質問があり,今は冷蔵庫にあるものを使いきるようにシステムの利用方法を考えていると回答があった.現実的には副菜の作りおきをしておくことが多いので,それをした上で,主菜を決定をするような現実的な利用方法は考えてないのかという問いに対しては,毎回作り,消費することを想定していたので,今回は考えていなかったと答えがあった.
献立推薦は最適問題を解くような課題設定だが,最尤法やモンテカルロ法を採用せず提案手法を採用した理由は何かとの質問に対しては,ユーザに選択肢の幅を与えたいので,意図的にそのような方法を避けているとの回答であった.
10. 機関横断型文献情報Wiki 〜コミュニティベースのメタデータ対応付けの試み〜
 ○日向野 達郎・増田 英孝・山田 剛一 (東京電機大学)・清田 陽司・中川 裕志 (東京大学)
概要
現在Web上には,論文や書籍等の文献検索サイトが存在しているが,それぞれ独立した機関によってメタデータが管理されているため,複数のサイトを横断的に検索することができない.本研究では,機関の枠を超えて文献情報を統合的に検索することを可能にするサービスの開発を目的としている.このためには各機関がメタデータに対してそれぞれ割り当てている固有のIDを互いに対応付ける必要がある.そこでMediaWikiを用いることによって,複数の文献検索サイトのメタデータを容易に対応付けることを可能にする枠組みを提案している.
Keywords: 文献検索サイト,MediaWiki,メタデータの対応付け,ユーザによる情報修正

質疑応答議事録
最初に,同一人物の重複の程度について確認があり,具体的な数値は出していないと答えられた.
異動が多い場合,同じ名前で同じ組織に所属するようなケースもあるのではと質問が続き,あり得るので今後検討したいと述べられた.
NIIの研究者リゾルバ−でも研究機関単位での登録を行なっている.そういう活動と連携してはどうかとコメントがあった.
本研究の活用方法の具体例を教えて欲しい,また,その際にWikiを利用するのが適切なのかとの質問に対しては,いずれ横断検索としての展開を検討しており,その際には複数人で編集できるメディアWikiが適切ではないかと考えていると回答された.
続いて,本システムでWikiで記述が必要なのは,リダイレクトをする部分であるので,簡単なGUIで実装できるのではないかと質問があり,1行程度のコードであっても気後れするユーザはいる.多くのユーザに編集してほしいのでWikiは適しているとの見解が示された.
11. アフィニティ・プロパゲーションを用いた高精度な3次元モデル分割手法
 ○村上 卓,青野 雅樹(豊橋技術科学大学)
概要
本研究では3次元モデルの分割を目的とし,比較的新しいクラスタリング手法であるアフィニティ・プロパゲーション(以下AP)を用いた実験を行ったので報告する.APはクラスタ生成にあたりメッセージ交換型アプローチを採用しており,これによりk-meansと比較した時,高精度かつ高速にクラスタリングできるとされている.本報告では,まずAPのアルゴリズムを紹介し,3次元モデルの分割問題を,3次元モデルを構成する三角メッシュの重心となる点集合のクラスタリング問題と考え,APを3次元モデルの分割に適用した実験結果について述べる.
Keywords: 3次元モデル分割,k-means,アフィニティ・プロパゲーション

質疑応答議事録
発表キャンセル
12. 投稿パターンの時系列分析による先読みブロガー発見手法
 ○朝永 聖也・中島 伸介 (京都産業大学)・Adam JATOWT (京都大学)・張 建偉 (京都産業大学)・稲垣 陽一・Reyn NAKAMOTO (きざしカンパニー)・田中 克己 (京都大学)
概要
我々は先行研究において,あるブロガーが投稿した記事の履歴と,世の中で語られた話題の推移を時系列的に分析することによって,話題を先取りしている先読みブロガーを発見する手法を提案している.しかしながら,この手法で使用されている話題の推移の情報を保持している約12000トピックに対して作成された24ヶ月分の関連語辞書に多くの共通の語が存在し,時系列的な話題の推移を十分に表現できていない可能性がある.したがって,時系列変化に対応した関連語辞書に改良することにより,投稿パターンの時系列分析による先読みブロガー発見精度の向上を実現するための手法を検討した.
Keywords: ブログ時系列分析,話題分析,先読みブロガー,Webマイニング

質疑応答議事録
最初の質問は,共通語を除くと特徴のある単語が残る点は面白いが,抽出された特徴語が流行語であるかどうかは別問題である.それの評価はどのように行なっているのかであった.今は実施できていないので,今後の課題として検討したいとされた.
「先読みブロガーを発見できた」ことを示すのが難しいが,どのように証明するのかという質問に対しては,一定期間,特徴量を算出する人を正解としていると回答された.
実際に本システムを利用して先読みブロガーをピックアップできているのかと問われ,まだなので今後の課題として検討したいと回答された.論文に掲載されたキーワードが一般的である.例題として取り上げた単語が適切であったのかとの疑義が呈され,現在は,試験のためにこの単語群を取り上げたと答えがあった.
セッション4: CGM (Consumer Generated Media) 分析(ショート発表)
 座長: 鈴木 優(名古屋大学)
 副座長: 西山 莉紗(日本アイ・ビー・エム株式会社)

13. Analysis of New Year's Resolutions Extracted from Twitter Post to Capture User's Long Term Goals
 ○Dandan ZHU (The University of Tokyo)・Yusuke Fukazawa (The University of Tokyo/NTT DOCOMO, INC.)・Karapetsas Eleftherios・Jun Ota (The University of Tokyo)
概要
Twitter provides a platform to users to post their plans. In this paper, we use the tweets about New Year's resolution as data source to capture users' long term goals. The key words following ``New Year’s resolution'' of each tweet are extracted for LDA(Latent Dirichlet Allocation) topic modeling. The output well summarizes topics, and by manually naming the labels and long term goals according to the clusters, the model of users' long term goals is built.
Keywords: Twitter,Long Term Goals,LDA,Topic Modeling

質疑応答議事録
まず,long-term goalはどのように抽出しているのか,long-term goalというのは解決するのが難しい目標であるはずであり,新年の誓い(new year's resolution)の中にはそうでないものも入っているはずだという質問があった.この質問に対して発表者からは,この研究においてlong-term goalは叶えるために大きな努力が必要になる目標と定義しており,新年の誓いとして挙げられる目標はこの定義に適っているだろうと考えている旨が説明された.その説明に対して前述の質問者はさらに「叶えるために大きな努力が必要になる目標」を表す表現をTweetから発見するべきであり,その点について著者らはどのような工夫をしているのかという質問を投げかけた.これに対し発表者はまだ始めたばかりの研究であり,人々がどのようなlong-term goalを持っているのか調査している段階であるという回答があった.
また,LDAは基本的に単語の分布からトピックを推定するモデルであるが,単語のみからではlong-term goalを見出すことが難しいのではないかという質問が出された.これに対し,発表者から,実際の新年の誓いを見たところ基本的に短い表現で書かれているので,単語の組み合わせで表現できると判断したという旨の回答があった.
次に,予稿中Table. 3にあるようなlong-term goalはどのようにして抽出されたのかという質問があった.その質問に対しては,"new year('s)(s) resolution(s) is(are) to"に続く表現をlong-term goalとみなして抽出した旨の回答があった.この回答に対し,質問者からはこの方法ではshort-term goalが取れる場合もあるのではないか,という質問があったが,発表者は新年の誓いなのでlong-term goalとして適切なものが示されていることが多いとは思うが,指摘のようにshort-term goalが混ざっている可能性も否定できないという旨の回答をした.
最後に会場からコメントとして,外国人は新年の誓いとして,確実に実現するつもりの目標を掲げる傾向があるが,日本人は,例えば英語がうまくなりたいなど,実現したいと考えている希望を掲げる傾向があるように見えるので,日本人の新年の近いからはlong-term goalがうまく獲得できるのではないか,という意見が示された.
14. ランキング学習によるQAコンテンツのベストアンサー推定
 ○長野 敬介・青野 雅樹 (豊橋技術科学大学)
概要
近年,ユーザ同士が質問や回答をやりとりして情報を得ることのできるYahoo!知恵袋や教えて!gooなどの質問応答サイト(QAサイト)における質問解答コンテンツ(以下QAコンテンツ)には多くの質問が投稿され,各質問には回答が投稿される.その中から質問者であるユーザはベストアンサーという,そのユーザにとっての最良の回答が決められる.しかし,質問に寄せられる回答は1件しかないものもあれば,複数件あるものも存在する.質問者であるユーザはその中から妥当だと考えられるベストアンサーを決めなくてはならない.このQAコンテンツのベストアンサーを本研究ではランキング学習(Learning to rank)を用いて推定する研究を行う.
Keywords: 機械学習,ランキング学習(Learning to rank),QAコンテンツ,RankingSVM

質疑応答議事録
まず,Lengthなどのランキング手法は単一のものを使うではなく複数のものを使うようにするとうまくいくのではないか,という意見が提示された.これに対し発表者は同じ方針で検討中である旨回答した.
次に,研究の目的はある質問に対する最も良い答えを選択するということにあるのか,という確認の質問が出された.これについて発表者はその通りであり,実験ではベストアンサーがわかっている質問を用いて評価を行ったが,最終的にはまだベストアンサーが選定されていない質問について,質問者にベストアンサーの候補を提示することを考えているという旨の回答があった.
続けて,ベストアンサーの推定にあたり回答の中身の良し悪しを考慮するべきでないのか,という質問がなされたが,これに対しては考慮する方向で現在検討中であるという回答があった.
また,今回18個の素性が提案されているが,これはより多くの素性候補からAICなどを用いて選別した結果か,という質問に対しては,今回は他の候補はなく,この18素性で試したもので,個々の素性の効果については今後調査したいという回答があった.これに対し質問者から,直感的には動詞の活用形なども,例えば否定的な内容を書いていると悪い印象になるといった特徴把握につながるので有用な素性だと思う,というコメントがあった.
最後に,訓練データとして使われている元々のベストアンサーについて,本当にベストアンサーだと言えるものであるのか,というデータの信頼性に関する質問があった.これに対し発表者からは,確かに回答の妥当性以外でベストアンサーが決まっているケースもあるかもしれないという回答があった.
15. コスメアイテム口コミサイト構築のための種類別の評価観点の抽出手法の提案
 ○濱岡 祐美 (京都産業大学)・上田 真由美 (京都大学)・中島 伸介 (京都産業大学)
概要
コスメは目的や価格に応じて様々な商品が存在することから,コスメ専門の口コミサイトが増加してきた.しかし,目的や価格は他の利用者の口コミを利用することは可能であるが,コスメは個人の肌質に大きく依存するため,他の利用者が投稿した口コミに従ってそのまま購入することは困難である.したがって,膨大な数のコスメの中から,自分に合うコスメを選ぶのは容易ではない.そこで我々は将来的に書き込みユーザの特徴も考慮したコスメ口コミサイトの構築を目指し,広くブログやSNSから収集した口コミがポジティブなのかネガティブなのかを判定可能とするために,ポジティブな口コミにおける特徴的表現,ネガティブな口コミにおける特徴的表現の抽出方法を提案する.
Keywords: コスメ,口コミサイト,評価観点抽出,情報推薦

質疑応答議事録
まず,一般的なポジティブ・ネガティブを示す単語との共起をとることで,ドメイン依存のポジティブ・ネガティブ表現を獲得できるのではないか,という提案が出された.これに対して発表者からは今後の検討材料としたいという旨の回答があった.
また,化粧品レビュー特有の課題はどのようなものであり,他の汎用的なレビュー分析手法を化粧品レビューの分析に適用するとどういう問題があるのか,という質問があった.これに対しては,共著者より,現在は従来のレビュー分析手法を適用可能かどうかということを判断するためにデータを見ている段階であるという説明がなされた.
最後に,例えば「安い」はポジティブの意味で使われる場合も,ネガティブの意味で使われる場合もあるので,各単語を確定的にどちらかに振り分けるのではなく,文脈の情報をうまく使ってこのような単語の極性を精度良く判断することはできないか,という提案が出された.これに対して発表者からは今後の参考にしたいという旨の回答があった.
16. 価値観に基づく情報推薦に向けて:ユーザのこだわりに着目したレビュー分析手法の提案
 ○服部 俊一・毛 中杰・高間 康史 (首都大学東京)
概要
利用者にとって有用な情報を見つけ出す情報推薦システムが情報フィルタリングの一手法として注目されているが,推薦されたアイテムはユーザにとって既知のものであることが多く,満足な推薦結果を得ることができない場合が多い.一方で,マーケティングの分野では個人の嗜好や消費行動を推定する要素として価値観が注目され,広く活用されている.価値観はアイテムの属性から独立した要素であることから,これを用いることで従来手法とは異なる新たな観点からの推薦が可能になるのではないかと考える.本稿ではショッピングサイト等における商品レビューを対象とし,価値観と繋がりの深い要素としてユーザの「こだわり」を推論することで新たな観点によるユーザのモデリングを行う手法について提案する.
Keywords: 情報推薦,価値観,ユーザモデリング,レビュー分析

質疑応答議事録
まず,調査の結果,ユーザーごとのレビュー傾向はどの程度取ることができたか,という質問があった.これに対して発表者からは,今回の実験ではレビュー数が少なく,評価属性がなかなか一致しないなどうまくユーザーごとの傾向が取れないものもあった,という旨の回答があった.また,今後,より多くのレビューを有する楽天のデータを用いて検証したいという説明がなされた.
次に,同じユーザーでも例えば映画とドラマでは重視するポイントが異なるなど,ジャンルによって傾向は異なるのではないか,という質問があった.これに対し,発表者から映画と音楽を対象にしてアンケート調査を行った結果,映画と音楽で嗜好が近くなるという調査結果は出ているが,ジャンルによって異なる場合もあると考えるので,今後検討していきたいという旨の回答がった.
そして,属性と属性値の獲得方法についての質問があり,係り受け解析器の出力を利用する旨の回答があった.続いて,同じ質問者よりその手法でどの程度属性と属性値を獲得可能か,という質問があった.これに対して,発表者からは獲得できていないものもあるので対応を検討中である旨の回答があった.
さらに,この研究で扱っているこだわりとは,ある要素についてのみ言及するレビューを書くことと,マイナス要素をも覆す,特に思い入れの強い要素を持つことのどちらであるのか,という質問が出された.これに対し,発表者からはどちらかといえば後者をこだわりととらえているが,各要素のバランスのよさを重視するユーザーもいれば,そもそもこだわりがないユーザーもいるので,今後対応を考えていきたいという旨の回答があった.
最後に,こだわりを考慮することで推薦精度が高くなるとは限らない.推薦精度を高めたいのと,ユーザーのこだわりを考慮した推薦を行いたいのとどちらであるのか,という旨の質問が出された.これに対し発表者からは,こだわりを持っているユーザーに対して,こだわりに合致しつつ他のものを推薦したい,例えば,水嶋ヒロを好きなユーザーに対して,他の水嶋ヒロ主演の映画を推薦するのではなく,俳優の演技が良いほかの映画を推薦するということを実現したいという旨の説明があった.質問者からのコメントとして,こだわっているものに他のものを推薦することに意味はあるのか,こだわりとは何かということを考えるべきなのではないかという意見が提示された.
17. 商品の評価を対象としたレビュー文書の分析への取り組み
 ○落合 恵理香・小林 一郎 (お茶の水女子大学)
概要
近年,インターネットの発達により,Webサイトを通して商品に対する意見を発信する機会が増加してきている.このような商品に対する意見文(以下,レビュー文)は,個人が商品を購入する際に参考になることから非常に有用である.しかし,商品に対するレビュー文の量は膨大であり,人がレビュー文の内容を一つずつ確認し,必要とする情報を取得することは非常に手間がかかる.そこで本研究では,レビュー文から商品の情報を抽出し,比較することを目的とする.情報を比較する際に,レビュー文の表層的な情報だけでは捉えることができない潜在的な情報に基づいた比較を行うことを目指し,商品に対する潜在的なトピックの観点から比較を行う手法を提案する.
Keywords: LDA,レビュー文,比較

質疑応答議事録
まず,LDAを用いると何のトピックかよくわからないものが出てくるのではないか,という質問があった.これに対し発表者からはそのような場合もあるという回答があった.
また,レビューデータ全てに対してではなく,商品別にLDAを適用したら商品の特徴が出るなど,様々な適用範囲を検討できるのではないか,というコメントがあった.これに対し,発表者からは試してみたい旨の回答があった.
そして,「する」「なる」「こと」などの単語がLDAの邪魔になるのではないか,「する」はLDAの対象となる単語から除外するなど前処理すると良いかもしれない,というコメントがあった.これに対し発表者からは,サ変名詞のときは「する」とつなげる,という工夫も行っているが,今後の検討課題にしたい旨の回答があった.
18. 複数のオンラインソーシャルネットワーク間におけるアカウント到達可能性を利用したプライバシ攻撃モデルの調査と考察
 ○石澤 恵・渡辺 知恵美(お茶の水女子大学)
概要
近年SNSの利用者が増加している.SNSではユーザ達の交流を促進する利便性と共に個人情報の漏洩の危険性もある.その為ユーザは各々で個人情報の公開基準を決めるが,ユーザが考える個人情報の公開基準と実際の公開度合いは気付かないうちに乖離することがある.我々はこの乖離を考察する為,個人情報漏洩の実例の調査を行い,ユーザの想定以上の個人情報が集められるきっかけは同じユーザが利用している複数のSNSやwebページが判明した時であると仮定した.その仮定を基に,あるSNSのアカウントと別のSNSのアカウントが同じ人のものであると第3者によって推定される可能性をアカウント到達可能性とし,求める式を定義した.また,実際に複数アカウントにおいてアカウント到達性の実験を行ったので報告する
Keywords: SNS,プライバシ保護,アカウント到達可能性

質疑応答議事録
まず,発表中にあったmixiからTwitterのアカウントが分かる例について,片方向(mixi→Twitter)の検出が可能であるということであるのか,という確認があり,発表者はその通りである,と回答した.回答への返答として,mixiからTwitterのアカウントは知られてもいいが,Twitterからmixiは知られてほしくない,という場合がありそうなので,アカウント到達可能性の方向性についても考慮したら面白いのでは,というコメントが出され,発表者からは今後の課題にしたいという回答があった.
次に,アカウント到達可能性を計算するための4つの計算式は独自の研究成果であるのか,ということについての確認があった.これに対し,発表者からは,アカウント到達可能性の定義は参考文献から取ったものであるが,計算式は今回の研究で独自に提案したものである,という回答がなされた.
そして,今回の実験では,Twitterにアカウントがあるということを知っているという前提で,mixiとTwitter両者のIDを結びつけることを考えているのか,という確認があった.これについても発表者はその通りである,と回答した.確認者より,例えば多くの人が好きなアイドルについてわざとたくさん書いたりすることで,自分の本来の属性を隠し,かく乱させることもできるのではないか,そしてその場合,アカウントに到達可能ではあるが特定可能ではなくなるのではないか,という旨の質問があった.これに対し発表者からは,現在特定可能性についても考察をおこなっており,具体的にはユーザー属性が合致する・しないの二値で判断するのではなく,合致しそうなユーザーを上位に配するようなランキング形式にすることを検討しているという旨の回答があった.
また,過去に「炎上」したユーザー(他のSNSのアカウントを暴かれてしまったユーザー)のアカウント到達可能性はどの程度であったか,また,アカウント到達可能性のスコアをどのくらい下げれば安全なのか,ということについての質問があった.これに対して発表者からは,過去の炎上事例を調べたが,まだスコアは計算していないのでこれから調査したい旨の回答があった.
さらに,アカウント到達可能性を計算する際にTwitter上のリスト名やフォローワーの情報は考慮しているか,という質問があった.これについては今はまだ考慮していないが,今後の検討材料にしたいという旨の回答があった.
最後に,アカウント到達可能性のスコアはおそらくゼロにはならず,限界最小値のようなものがあって,そこに近づけることになるだろう.その限界最小値がいくつくらいか,という知見が得られたらそれだけでも非常に有用な研究成果になると思うというコメントがあった.
■ 平成24年3月18日(日)
セッション5: 情報アクセス(ロング発表)
 座長: 渡辺 知恵美(お茶の水女子大学)
 副座長: 大西 可奈子(お茶の水女子大学大学院)

19. 適合性フィードバックと統計的仮説検定を利用したニュース推薦手法の提案
 ○藤田 将成 (NTTサイバーソリューション研究所)
概要
ユーザの情報閲覧履歴を利用した推薦技術が数多く研究されている.ニュースを代表例とする推薦技術の適用分野では,新規追加アイテムの重要なことは多い.特にニュースでは,新規アイテムの主要トピックが重大イベント,事件等で変化することの対応が重要である.この新規アイテムの推薦精度向上には,コンテンツベースフィルタ技術が有効とされているが,広く利用される推薦順のアイテムをリストとして提示するUIでは,推薦技術適用による提示アイテム同質化や,大量に生まれる選択しなかったアイテムの分析方法に課題がある.また,記事のトピック変遷に追従するため,より少ない履歴にて高精度化する必要がある.このため提案法は,ユーザが閲覧したアイテムについて,提示したリストからの標本抽出と捉えて各アイテムに付与したタグの出現数を,無作為抽出との乖離を確率として分析する.この分析では,各タグの出現が少ない場合も負の興味として分析し,複数の検定結果を統合するstouffer's methodを利用した統合により推薦を行う.提案法についてニュース記事推薦を対象とした実験を行い有効性を確認した.
Keywords: ニュース,推薦,適合性フィードバック

質疑応答議事録
聴講者より,tf/idfを使った場合よりもよくなるのかという質問があり,発表者 から,本論文の評価においてRoccioアルゴリズムの重みにtf/idf値が利用してい ること,また,ニュースにはトピックの変遷があるが,提案手法ではそれに対応 できるという利点があるという回答があった.
それに対してさらに聴講者より,トピックの変遷にはどのように対応しているの か, という質問があり,発表者から,4回程度という少ない記事である程度の精 度が出せること,すなわち,一日一回新聞を見ると仮定すれば4日分程度の履歴 を使えば精度を出せるため, その程度の時間のオーダーであればトピックの変 遷も限られるため 記事の変遷に対応できているのだと考えているとの回答が あった.
続けて,聴講者より,履歴の長期傾向と短期傾向に関する質問があり, 発表者 より,長期傾向と短期傾向をわけて分析する手法も提案されているが, 本論文 の評価実験では、ニュース推薦に関してより重要と考えられる短期の履歴の傾向 分析に注力しており,長期傾向を分けて分析することは,技術的には問題ない が,実験方法等について今後の課題と考えているとの回答があった.
最後に,聴講者より,提案手法はアンドロイドのスマートフォンにより利用して いるが, スマートフォンでニュースを見る時には,その日あっとことをざっと 確認する目的と,自分の興味にあった記事について詳細をみる目的の2つがある と思うが, 前者に対するアプローチとして何か行っているものはあるか,とい う質問があり, 発表者より,見出しを一覧化することで見やすい表示をした り, 高速でスクロールできるような対応で一定の対処があるが,その日の情報 を概観する目的については,提案法のスコープから離れるため,別に工夫をすべ きと考えているとの回答があった.
また,聴講者からのコメントとして, 選択しなかったアイテムを積極的に利用 する方法と理解したが,機械学習の分野でも,出てきたルールに対して,その ルールの残りの情報を使って評価するようなものがあるのではないかと思ったの で(例えばマーケットバスケット分析拡張の一種として), そういうところも 調査したら良いのではないかという意見が聞かれた.
20. Webハザードマップにおけるコンテキストアウェアな情報提示に関する検討
 ○辻 俊光・北川 悠一・堀 雅洋 (関西大学)
概要
災害時の避難所や危険箇所をはじめとする防災情報を地図上に掲載したハザードマップは全国の自治体で作成され公開されている.その多くは紙媒体のハザードマップで,縮尺や掲載可能な情報量にも制約があり,マップ上の各所に掲載された情報を状況に応じて適宜参照することは容易ではない.本稿では,Web-GISベースのハザードマップにおいて,想定された所在地において考慮すべき危険状況や安全を確保するために必要な情報提示方式を提案する.提案手法をWeb-GISベースの地図アプリケーションとして実装し,状況に応じて提示されるべき情報へのナビゲーション容易性の観点からその操作性について遠隔実験によって評価した結果を報告する.
Keywords: ハザードマップ,Web-GIS,コンテキストアウェア,情報提示,ユーザビリティ評価

質疑応答議事録
希望しない
21. 潜在トピックの配分を考慮した複数文書要約
 ○重松 遥・小林 一郎 (お茶の水女子大学)
概要
近年,文書内に潜在するトピックを確率的に求めるモデルの研究が盛んに行われている.そこで,本研究では,関連する複数文書に潜在するトピックをLDAを用いて抽出し,トピックに基づいた要約文の生成を行う.また,正解とされる要約文中に含まれるトピック比率が,対象となる複数文書中に含まれるトピック比率とほぼ同じになることが予備実験により確認されたことから, トピック比率を考慮して文の重要度を定義する.複数文書を対象にした要約の場合,文書集合中に内容が重複した文が存在している可能性がある.そこで,整数計画法を用いて文間の被覆度を考慮した重要文抽出し,要約文を生成する.また,提案手法と先行研究の性能比較を行い,提案手法の有効性を示す.
Keywords: 複数文書要約,潜在的ディリクレ配分法,整数計画法,冗長性削減

質疑応答議事録
聴講者より,複数文書の要約では一般的には記事セットの集まり方で手法が違うと思うが それを吸収したのかという質問があり,発表者から,吸収できたと考えているとの回答があった.
さらに聴講者より,使っているデータセットは毎日新聞と読売新聞を混ぜて 同じような記事を集めて作成していることから,どちらかというと冗長性をいかに削除するかが 重要になってくるデータセットだったため,今後は記事(データセット)の集め方や集まり方によって 手法を変えるような,もう少し丁寧な方向にいっても良いのではないかと思うとの意見が聞かれた.
また聴講者より,とてもうまくいっているように見えるが, 反対に提案手法でうまくいかないところというのはどういうところがあるのかという質問があり, 発表者より,トピック比率が低いものになると何のトピックについて言っているのか 単語出現確率を見てもわからないものがあり,トピックの冗長を回避するかしないかを どうするのかという問題があったが, 現在はLDAは絶対にトピックを分けてくれているという前提のもとやっているため, 今後はトピックの冗長も考えてやりたいと思っているとの回答があった.
次に聴講者より,新聞によってニッチな情報がある場合もあると思うが, そういう情報はとれるのか,要約した場合影響はないのかという質問があり,発表者から, 複数文書全体を文書と見なすので綺麗にトピックが分かれてくれると考えられるため, そういった情報はとれる,要約も可能であると思うとの回答があった.
また聴講者より,口コミサイト等の要約にも応用できるのかという質問があり, 発表者より,そういった研究(先輩がやっている)もあるため 恐らくできると考えているとの回答があった.
さらに聴講者より,LDAはバラバラの話題があるものに対してそれらを分けることに 効果を発揮すると思うのだが,共通のトピックに関して書かれたものにLDAをかけたのは 何を分析していることになるのかという質問があり,発表者から, そのような文書の中でもさらに細かい話題があり,それを推定し, その話題を取得することによって重要文を推定するというところに効いていると 思うとの回答があった.
最後に聴講者より,名詞を中心にしているようだが, 同じ名詞で反対のことをいっている場合はうまくいくのか, 動詞や形容詞を使ったりはしないのかという質問があり,発表者より, 動詞や形容詞も実際に使おうと考えていたが,今はまず簡単のため名詞しか利用していないため, 今後は使っていくつもりであるとの回答があった.
22. ファセット検索と統合されたキーワードサジェストのための重み付け手法の評価
 ○木村 久美子・久世 皓司・堀 雅洋 (関西大学)
概要
Webサイトにおける動的ビゲーション方式としては,ファセット検索,キーワード検索およびそれを支援するキーワードサジェスト機能が用いられている.しかし,これらを併用した場合の有用性はほとんど検証されていない.特に,ファセット検索とキーワードサジェストを効果的に併用するには,ファセット検索による絞り込み状態を考慮した索引語の重み付けが必要となる.本稿では検索対象のテキストから抽出した領域語彙の頻度情報に基づいてサジェスト候補を順序付ける重み付け方式について提案する.そして,提案方式によるキーワードサジェスト機能を組み込んだ検索サイトを用いて実施したユーザ評価とその結果について報告する.
Keywords: オートサジェスト,ユーザ評価,領域語彙,ファセット検索,動的ナビゲーション

質疑応答議事録
希望しない
セッション6: 情報インタフェースとWebインタラクション(ショート発表)
 座長: 高間 康史(首都大学東京)
 副座長: 齋藤 ひとみ(愛知教育大学)

23. 学習機能をもったアイコン整理システム
 ○大河原 昭・坂本 大介・五十嵐 健夫 (東京大学/JST ERATO)
概要
ユーザによって異なるデスクトップの整理法に対応するために,ユーザとシステムの対話によるアイコンの半自動整理手法を提案する.1つ目の手法では,配置予測を容易に行うためにBubble Clustersを用いてアイコンのグルーピングを行う.グルーピングされたクラスタ内のファイルの内容を元に分類器を学習させ,それを用いて追加されたアイコンの配置予測を行う.2つ目の手法では,ユーザが移動したアイコンの配置とメタデータから,その配列規則を抽出する.ユーザが新しくアイコンを置く度に,その配列規則を用いてアイコンの配置を予測する.これらの手法が間違えて予測を行った場合は,ユーザが他の予測候補を選択したりすることで予測を訂正することできる.
Keywords: デスクトップ,アイコン,学習

質疑応答議事録
希望しない
24. アプリケーションを操作する自然言語インタフェース開発への取り組み
 ○大谷 麻璃・小林 一郎 (お茶の水女子大学)
概要
近年コンピュータやスマートフォンなどの普及によりアプリケーションソフトウェアを利用する機会が増加しているが,より日常に近く人にとって親しみやすい操作方法として人が日常的に使用している自然言語による操作が挙げられる.本研究では操作対象となるアプリケーションが持つ機能と,操作入力となる自然言語を柔軟に結びつける手法の開発を目的とし,自然言語の解析には意味格を抽出し,アプリケーションのユースケースと結び付ける.その一例として,Googleカレンダーを対象とした自然言語操作のためのモデル化とインタフェースの構築を行った実行例について述べる.
Keywords: 自然言語インタフェース,自然言語解釈,オントロジー

質疑応答議事録
希望しない
25. 視線データとログデータに基づくWebサイト閲覧者の目的達成の確率推論モデル
 ○前田 俊介・松下 裕 (金沢工業大学)
概要
本研究ではWebサイト閲覧者の視線,ログデータからサイトの目的達成を確率的に推論するモデルを構築し,目的達成に関する行動指針を提案することを目的とする.ショッピングサイトにおける閲覧者の購入,閲覧中断を目的変数に,行動データを説明変数にモデルを構築する.このモデルより,視線停留回数が多く,視線停留時間が短く,商品一覧ページ滞在時間が短い見方では目的達成率が高いことが示される.さらに感性データの予測モデルから,この見方は興味の高い人がストレスをあまり感じない見方に対応しており,指針となりうるものであることが示される.
Keywords: web,視線データ,感性データ,ベイジアンネットワーク,推論

質疑応答議事録
聴講者から,ショッピングサイトでは必ずしも購入するかどうかが目標達成では ないのではという質問があった.発表者からは,今回の実験での目標達成率は一 般的な割合よりもとても高く,そういう意味では今回の実験に参加したユーザの 意識として,購入というよりも自分の好きな商品を探すという感じになっていた のではないかという回答があった.
他の聴講者から,DVDの購入にも買うものが決まっている場合や,いろんなジャ ンルを見て良いものを選ぶなどのパターンがあり,他の研究でマウスカーソルの 動きをクラスタリングしてパターンを分けるという研究もあるので,それらの考 え方が適用できるのではという質問があった.
それに対して,発表者はマウスの移動とスクロール回数,量も使ったが,結果と してはベイジアンネットワークに選出されなかったので,説明変数としてそこま で重要ではなかったと回答した.
26. ハウツー情報間の共通性に基づく検索結果の提示手法
 ○湯本 高行 (兵庫県立大学)
概要
レシピなどのハウツー情報の検索結果の提示方法として,共通性に基づく階層化の手法を提案する.本研究では,ハウツー情報を動作と対象のペアからなる構成要素の集合として表現する.構成要素の抽出は,ハウツー情報を説明している文を形態素解析した結果に対してパターンに基づいて行う.また,構成要素の集合を用いて共通度を定義し,これによって共通性を表現する.共通性を持つハウツー情報からなるツリーを構築し,ツリーのリストを検索結果としてユーザに提示する.ツリーを構築する際には,共通度の値に基づき,ハウツー情報間の詳細関係を定義し,これによってノード間の親子関係を決定する.
Keywords: ハウツー情報,情報検索,階層化,WWW

質疑応答議事録
聴講者からは,ハウツーのグループはどの程度分かれるのかという質問があり, 発表者からは,同じ肉じゃがでも,作り方が異なるものが分かれるという回答が あった.
それを受け,聴講者からは,レシピを使う側の気持ちとして,必要な食材とかで 代わると言うのもよいのではという意見があった.
他の聴講者からは,名詞と動詞を使われているので,汎用性のあるタスクモデル とかタスクオントロジーがこの研究にも適用できるのではという意見があった.
さらに,他の聴講者からは,ある手順がより詳しいのか,別の手順なのかを区別 するためには,もう少しエッジを考える必要があるのではという意見があった.
 
───────
運営委員会
───────
実行統括担当:杉原太郎 (北陸先端大)
ローカル担当:庄司 裕子(中央大学)
プログラム担当:西山 莉紗(日本IBM)
受付担当:小林 一郎 (お茶の水女子大学)
特別企画担当:杉原太郎 (北陸先端大)


「これまでの活動」に戻る
 
本ページに関する問い合わせ
wi2−webmaster@mail,ieice.org