メインメニュー






















第14回研究会
●第14回Webインテリジェンスとインタラクション研究会
日 時:平成21年3月23日(月) 13:30 - 18:30
平成21年3月24日(火) 9:00 - 11:50(受付8:30-)
平成21年3月25日(水) 9:00 - 15:50(受付8:30-)

会 場: 島根大学 松江キャンパス

→プログラム →特別講演 →質疑応答議事録 →学生参加報告(PDF)
→運営委員会

2009年3月23日(月)〜25日(水)に,島根大学松江キャンパスにて「第14回Webインテリジェンスとインタラクション研究会が開催されました.今回は,当研究会が属する電子情報通信学会ヒューマンコミュニケーショングループ(HCG)が主催するHCGシンポジウム2009内での開催でした.講演件数は,26件(ロング発表は17件,ショート発表9件)で,参加者数は77人でした.

一般講演では,ソーシャルタギング,コミュニティ分析,ソーシャルネットワーク分析,情報推薦,オントロジー構築と応用,次世代情報検索,モバイルサービス,情報抽出,ユーザ行動分析,情報信憑性などに関する研究がありました.
今回は特別講演として,プログラミング言語Rubyを開発した,ネットワーク応用通信研究所のまつもとゆきひろ氏に,「オブジェクト指向言語 「Ruby」の開発」という講演をお願いしました.本特別講演は,HCGシンポジウム共通のイベントとして行われ,WI2研究会の参加者だけでなく,HCGシンポジウムの多くの参加者にご参加いただきました.まつもと氏は,プログラミングの生産性だけでなく,プログラミングの楽しさについても触れられ,会場からは今後のプログラミング教育などに関して,活発な意見が出ました.懇親会は,地元の新鮮な魚介や野菜をふんだんに使ったフランス料理を楽しめるワインバーで行いました.店内からは大橋川が望め,おしゃれな一時を過ごせました.


一般発表の様子です


壇上にまで上がり,白熱した議論になりました


夜はおしゃれなワインバーで地元の食材を使った美味しいフランス料理をいただきました

プログラム言語屋さん,言語処理屋さん,HI屋さん,データベース屋さんが同席しました


あこがれの人と話をすることができました

あこがれの魚を食べることもできました
(HCGシンポジウム懇親会にて)

発表者の方には,写真掲載の許可をいただきました.ありがとうございました.
 
───────
プログラム
───────
日 時:平成21年3月23日(月) 13:30 - 18:30
平成21年3月24日(火) 9:00 - 11:50
平成21年3月25日(水) 9:00 - 15:50

会 場: 島根大学 松江キャンパス
(〒690-8504 島根県松江市西川津町1060)
    http://www.shimane-u.ac.jp/

■3月23日(月)
□ 13:30 - 15:30 セッションI:「ユーザコミュニティ」(ロング発表)
【座長:熊本 忠彦(千葉工大),副座長:杉原 太郎(北陸先端大)】

1. トピックの需要分析に基づくソーシャルブックマークの評価手法
  湯本高行・角谷和俊(兵庫県立大)

2. ソーシャルまとめサイトシステムの試作
  高橋庸介・佐々木 祥・宮田高道(東工大)・小林亜樹(工学院)・
  山岡克式(東工大)

3. リアルタイムブログ配信のための配信先ユーザ高速選択方式
  服部 元(KDDI研)・原 隆浩(阪大)・小野智弘・滝嶋康弘(KDDI研)・
  西尾章治郎(阪大)

4. 良い回答とは何か 〜 Q&Aコミュニティにおける良回答の要因分析 〜
  佐藤芙美・松村 敦・宇陀則彦(筑波大)

−−− 休憩 ( 20分 ) −−−

□ 15:50 - 17:05 セッションII:「SNSとコンテンツ」 (ショート発表)
【座長:福本 淳一(立命館大),副座長:波多野 賢治(同大)】

5. 擬人化コンテンツによる提示型インタフェース
  菅野夏美・松村 敦・宇陀則彦(筑波大)

6. Webコンテンツ推薦におけるJaccard係数方式と尤度比検定方式の適用領域に
  関する検討
  王 琳g(東工大)・小林亜樹(工学院)・佐々木 祥・宮田高道・山岡克式
  (東工大)

7. 研究リソースの共有を支援する研究室SNSの開発
  越智洋司・真木 努・井口信和(近畿大)

8. ソーシャルブックマークのコメントにおける言語表現と機能の分析
  山田剛一・本 晶夫・絹川博之(東京電機大)

9. ユーザの行動目的に着目したWebログの傾向分析
  市川裕介・石井久治・佐藤宏之・小林 透(NTT)

−−− 休憩・準備 ( 25分 ) −−−

□ 17:30 - 18:30 WI2特別企画
 「オブジェクト指向スクリプト言語 「Ruby」の開発」
  まつもと ゆきひろ氏 (ネットワーク応用通信研究所)

−−− 移動 ( 30分 ) −−−

□ 19:00-21:00 WI2懇親会(有料)
  レストランバー リバービューにて


■ 3月24日(火)
□ 9:00 - 10:00 セッションIII 「文書解析」(ロング発表)
【座長:笹島 宗彦(阪大),副座長:大塚 真吾(物質・材料研究機構)】

10. 固有表現の共起情報を用いたオントロジー語彙拡充技術
  稲葉真純・長野伸一・服部正典(東芝)

11. 語と語の関連性に基づくスコアリング手法の文書検索への応用利用とその
  評価
  伊藤ゆかり・波多野賢治(同大)

−−− 休憩 ( 20分 ) −−−

□ 10:20 - 11:50 セッションIV「情報検索」(ロング発表)
【座長:是津 耕司(情報通信研究機構),副座長:井口 誠(シンクロア)】

12. 文書内容の一貫性を考慮した検索手法の実装とその評価
  田村航弥・波多野賢治(同大)

13. Webコンテンツ作成支援のためのリンク目的を意識したリンク先推薦システ
  ムの実装と評価
  武吉朋也・服部 元・小野智弘・滝嶋康弘(KDDI研)

14. アクセスランキング掲載サイト情報をまとめたユーザーズランキング生成
  日野滋樹(NTT)

□ 13:30 - 15:30 HCG特別企画
 「エンタテインメント工学:心を豊かにする科学技術の創生」
  稲見昌彦(慶應義塾大学),苗村健(東京大学)

−−− 休憩 ( 20分 ) −−−

□ 15:50 - 17:20 HCG特別企画 「HC研究の過去・現在・未来 〜 MVE研の事例から 〜」
  佐藤 誠(東京工業大学)
  (MVE研究会企画)

−−− 休憩 ( 10分 ) −−−

□ 17:30 - 19:30 HCG合同懇親会・HC賞表彰式 (大学会館2階 参加費無料)


■ 3月25日(水)
□ 9:00 - 10:00 セッションV 「モバイル環境」(ロング発表)
【座長:市川 哲彦(山口大),副座長:松下 光範(関西大)】

15. モバイルサービス向けタスク指向型メニューの実規模試作と評価に関する一考察
  笹嶋宗彦・古谷孝一郎・來村徳信(阪大)・深澤佑介・長沼武史・倉掛正治
  (NTTドコモ)・溝口理一郎(阪大)

16. 異種複数の履歴に基づく行動ターゲティング
  深澤佑介・長沼武史・大野木碧・倉掛正治(NTTドコモ)

−−− 休憩 ( 20分 ) −−−

□ 10:20 - 11:50 セッションVI 「情報抽出」(ロング発表)
【座長:難波 英嗣(広島市大),副座長:品川 徳秀(東京農工大)】

17. ハイパーリンク自動生成のためのキーワード抽出方式の提案とコンタクト
  センターへの適用
  立石健二・細見 格・久寿居大(NEC)

18. 検索クエリログを用いた商品絞り込み属性抽出手法の検討
  関口裕一郎・北川結香子・田中明通・内山 匡(NTT)

19. Grammar-gramとGrammarVerb-gramを用いたドメイン非依存型Whyテキスト
  セグメント判定と回答抽出
  田中克幸・滝口哲也・有木康雄(神戸大)

−−− 昼食 ( 70分 ) −−−

□ 13:00 - 14:00 セッションVII 「システム開発と分析」 (ショート発表)
【座長:齋藤 ひとみ(愛教大),副座長:小林 亜樹(工学院大)】

20. 検索エンジンを利用した印象語からの概念推定
  永井洋平・黒木さやか・山名早人(早大)

21. 異なる知識を持つ人々の合意形成に関する分析
  〜 選好誘因が動的に変化する場合を対象として 〜
  松下光範(関西大)

22. タスクをマップ化することで見える化するプロジェクト管理ソフトウェアの
  開発
  高橋純一(システムフレンド)

23. 雰囲気メタファによる街の偏在情報の集約・提示システムの検討
  宮森恒・水口 充・河合由起子(京産大)・是津耕司・木俵 豊(NICT)

−−− 休憩 ( 20分 ) −−−

□ 14:20 - 15:50 セッションVIII 「ユーザ行動の調査」(ロング発表)
【座長:土方 嘉徳(阪大),副座長:立石 健二(NEC)】

24. 複数情報源のデータ比較に基づく事物の妥当性判断支援
  宮森恒(京産大)

25. 新聞記事の印象は読む順番によって変わるのか
  熊本忠彦(千葉工大)

26. ユーザのWeb閲覧パターンに基づくコンテンツ提示制御
  大野木碧・山田直治・礒田佳徳・倉掛正治(NTTドコモ)
○18:00 閉会挨拶

 
──────────────────────────────────
特別講演「オブジェクト指向言語 「Ruby」の開発」
──────────────────────────────────
司会:土方 嘉徳 (大阪大学)

タイトル:オブジェクト指向言語 「Ruby」の開発
講演者:まつもと ゆきひろ (ネットワーク応用通信研究所)
概要:
昨今,Rubyに代表される動的言語の台頭は著しく,Webアプリケーション開発など 様々な領域において適用事例が増加している.本講演では,Rubyの背景・思想・ 歴史から,変化しつつあるアプリケーション開発のトレンドに合致する Rubyの 特徴・利点などを解説する.


 
───────
質疑応答議事録
───────
■平成21年3月23日(月)13:30〜18:30

□13:30〜15:30 セッションI:「ユーザコミュニティ」(ロング発表)
  座 長: 熊本 忠彦(千葉工大)
  副座長: 杉原 太郎(北陸先端大)

1. トピックの需要分析に基づくソーシャルブックマークの評価手法
○湯本高行・角谷和俊(兵庫県立大)
概要
ソーシャルブックマークは注目を集めているWeb ページを知る手段としても使われているが,トピック毎にブックマークのされやすさ(需要) が異なるため,その数をそのまま注目の高さとみなすことはできない.そこで,本研究では,トピック毎の需要の違いを考慮して注目の高さを表現する主要ブックマーク比を提案する.主要ブックマーク比は,共通の代表タグ集合を持つ他のページのソーシャルブックマーク数を用いて算出される.代表タグ集合とは,そのページのトピックを最もよく表現するタグ集合である.また,本稿では代表タグ集合の発見のための精度の評価を行うと共に,主要ブックマーク比を実際に求め,考察を行った.
Keywords: ソーシャルブックマーク, ソーシャルタギング,フォークソノミー,トピック

質疑応答議事録
まず,「トピックを限定すると人気のあるページがランキングされるのではないか」との疑問が提示され,発表者からは,「雑多なコンテンツの中でどのようなものが注目されているのかを知る場合や,より注目されているコンテンツが何か知りたいときに利用される」と回答された.「テキストのブログエントリではなく,フリッカーのようなマルチメディアを使用したエントリにも使用できるのか」という質問に対しては,「話題が限定されれば,マルチメディアでも利用できるのではないか」と応じられた.情報の信頼性・信憑性を分析するにはどのように利用されるのかとの問いがあり,主要ブックマーク比を利用すれば,どのトピックが注目されているのかが分かるとコメントされた.スパムを除去した上で再度分析することによって信頼性・信憑性を向上させるのかとの質問に対しては,そうしたいとの答えであった.続いて,有害なサイトが表示結果に入っていなかったが,これは自然な分析結果かとの質問があり,アダルトサイトのようなものは事前に除いていると回答された.発表者が提案した主要ブックマーク比の計算方法について確認があり,対象ページのブックマーク数をトピック重要で除し,正規化したものであると返答された.類語のタグはどのくらいの精度で検出できたのかとの問いを受け,再現率はおよそ8割くらいで,適合率がおよそ6割であると回答された.
2. ソーシャルまとめサイトシステムの試作
○高橋庸介・佐々木 祥・宮田高道(東工大)・小林亜樹(工学院)・山岡克式(東工大)
概要
Web 上のまとめサイト生成には多大な労力がかかり,その故もあり多数の関心事以外では成立しにくく,多様な情報整理の観点で問題である.本稿で提案するソーシャルまとめサイトのシステムでは,多数のユーザが入力した利己的かつ単純な2Web ページ間の関係情報を協調的に集約することで容易なまとめサイト生成を支援し,また,データベース中の任意URL を中心としてインタラクティブにまとめサイトを生成することで多様な事象のまとめサイトを成立させる.関係情報は,関係するURL の選択,クラスタリング,クラスタへのタグ付けをシステムが自動的に行うことで集約される.試作システムにより,実入力からのまとめサイト生成実験を行い,労力を削減しつつ多様なまとめサイトが生成できることを確認した.
Keywords: まとめサイト,まとめサイト,関係タグ,RSS

質疑応答議事録
自分のコメントや評価を積極的に反映させやすいかとの質問には,システムの構成上,少数意見は反映させにくいと回答された.続いて,進化していくようなイベントのまとめサイトに使えるのかとの質問が飛び,リンクに登録させれば,部分木の変更によって対応できると返答された.その質疑を受け,イベントそのものが進行してしまえば対応しにくいのではと指摘された.まとめサイトの作り手のモチベーションについて問われ,発表者は友人に推薦したい場合や,他人より先んじて情報を有していることを誇りたい場合に作られると述べた.提案手法では労力は削減できるが,目的に含まれている知識の積み増しやニッチトピックへの対応などへは対応できないのではないかと疑義が呈され,まずは労力に焦点を当てたものであると回答された.個人がまとめサイトを作るためのものではなく,複数人でまとめサイトを作る際に,ニッチトピックへの対応などが行えるようになるのではないかと指摘があった.評価実験では,効率や満足度で効果測定をしているが,最終的に作り上げたまとめサイトの多様性はどのようなものであったかと質問があり,出来上がるサイトのコアの部分は似たようなものであったと回答された.この質疑を受け,まとめた結果が多様性が高ければ,効率や満足度以外の評価項目が必要なのではないかと指摘があった.
3. リアルタイムブログ配信のための配信先ユーザ高速選択方式
○服部 元(KDDI研)・原 隆浩(阪大)・小野智弘・滝嶋康弘(KDDI研)・西尾章治郎(阪大)
概要
本稿では,ブログ記事が投稿されると即座に,内容に興味のあるユーザにそのブログ記事を配信するブログ配信システムの実現を目的とした,配信先ユーザの高速選択手法について述べる.ブログ配信システムは,新着ブログ記事の内容と,配信サーバに登録している全ユーザの好み情報との類似度を計算し,類似度の高いユーザから順に配信する.ところが,商用のブログサイトの新着記事は1 秒間に1 件以上の高頻度で投稿される時間帯もあることから,システムには類似度計算を高速に行うことが要求される.そこで,絞り込みと優先度付けの2段階で配信先を選択することを特徴とする,配信先ユーザ高速選択方式を提案する.約11,000 人の登録ユーザを想定したシミュレーション実験を行い,優先度付けのみの方式と同等の精度を維持しながら,約40 倍の高速な選択処理が実現できていることを示した.
Keywords: ブログ配信システム,配信先ユーザ選択,コンテンツ・ベース・マッチング,高速選択処理

質疑応答議事録
まず,1件当たりのブログのテキスト長はどの程度かとの問いがあり,1000文字程度であると返答された.文字長が短いとTF/IDFでは効果が得られないのではないか,どの程度フィージビリティがありのかと質問があり,平均では1000文字より少なく,計算は実用的なレベルであると回答された.ユーザにカテゴリを入力させるのであれば,情報がユーザに届いたときに似たカテゴリであると通達できるようにすると良いのではないかとの質問に対しては,現在はテキスト色を変えて表示していると回答された.提案手法は個人の選好にあわせて表示するものであるが,それはユーザにとって本当にうれしいことなのか,官能評価は実施しているかと質問があり,官能評価は実施していないと回答があった.また,ユーザにとってうれしいかどうかは今後の課題であると述べられた.この質疑を受け,個人の選好に完全に合致するよりも,適度にぶれていたほうがユーザにとって望ましいと考えられるので検討してほしいとコメントがあった.また,興味の選好についてをシステムに組み込む際に,カテゴリをどう設定するかが問題になる.カテゴリを細かくすればユーザの個性に対応できるが,多くなりすぎると処理に時間がかかる.それはどのようにすべきなのかとの質問があり,適度にぶれさせ,トータルとして冗長にしないようにすることで,対応するのが重要だとの意見が述べられた.
4. 良い回答とは何か 〜 Q&Aコミュニティにおける良回答の要因分析 〜
○佐藤芙美・松村 敦・宇陀則彦(筑波大)
概要
Q&A コミュニティにおいて,どの様な回答が評価を受けているかを明らかにするため,質問,回答,お礼の記述から回答が評価を受ける要因を分析した.Q&A コミュニティのOKWave からハードウェア,ダイエット&フィットネス,恋愛相談,レシピの4 カテゴリを対象に400 件を人手で分析した.その結果,ハードウェアでは「回答を投稿する早さ」が,ダイエット&フィットネスでは「解決前の情報の有用性」が,恋愛相談では「励まし」が,レシピでは「質問者が知らない方法」が高い評価を受けていることが分かった.さらに経験の記述に着目すると,ダイエット&フィットネスとレシピのカテゴリで回答の経験記述の評価が高いことが分かった.
Keywords: Q&A コミュニティ,回答評価,内容分析,経験,OKWave,良回答

質疑応答議事録
最初に,Q&Aコミュニティ以外に適用可能かと質問があり,適用できると回答された.評価要因の付与を行う際に回答に人手でタグ付けしていくので,作業者の個性が反映されてしまうのではないかとの指摘に対しては,評価のブレが起きないように,2人1組で行い,客観的な視点で回答を抽出するようにしたとコメントがあった.1つの記述が複数の意味に取れる場合はどうするのかとの質問には,一文に対して複数の意味を付与できるようにしたと返答された.Q&Aコミュニティでの回答は自由記述であるから,評価に関係ないことが書かれている.その部分はどのように処理したのかと問われ,除外した上で分析したと回答された.文末の表現がタグ付けにどの程度影響したのかと質問には,分析していないので分からないと回答された.さらに,回答の評価要因を付与する際に,文末を見るが,全体の印象も影響する.文末のみに注目したわけではないと分析方法が説明された.続いて,質問に対する回答はベストアンサーかとの確認に対しては「そうである」と述べられた.「良い」と評価されたものの中に入っている要因と,「悪い」と評価されたものにも同じ要因が会った場合,それはどうするのかとの質問があり,今後の課題とすると述べられた.良い回答が出易いカテゴリ(質問タイプ)があったかどうかという質問に対しては,質問タイプに回答は影響していないと回答された.
□15:50〜17:05 セッションII:「SNSとコンテンツ」 (ショート発表)
  座 長: 福本 淳一(立命館大)
  副座長: 波多野 賢治(同大)

5. 擬人化コンテンツによる提示型インタフェース
 ○菅野夏美・松村敦・宇陀則彦 (筑波大学)
概要
本研究では,擬人化コンテンツによる提示型インタフェースを提案する.本インタフェースでは,まずコンテンツを擬人化し,服の色や表情を利用して様々なイメージを分かりやすく表現する.その上で,擬人化されたコンテンツをランダムに提示する.これによって,ユーザが未知のコンテンツと効果的に出会えるようにする.実際に,Amazonの書籍を対象にインタフェースを実装し,利用実験を行なった.その結果,多くの人が本インタフェースにより興味ある未知のコンテンツと出会えることができた.また,擬人化したことによって面白く飽きずに眺め続けられるという効果があることが分かった.
Keywords: 提示型インタフェース, 擬人化コンテンツ, 感性語, Amazon

質疑応答議事録
最初に会場より「提示型インタフェースになぜ擬人化が必要か? また擬人化の際の人の表情や服の色に着目した理由はなぜか?」という質問がなされた.これに対し発表者は「複数のイメージを提示するための擬人化であり,擬人化されたものをユーザが閲覧することで素早くまた感性での理解ができるためである」という回答がなされた.これに対してさらに「情報可視化に関する書籍は多く発行されており,それらには対象のコンテンツから人間の常識にあわせて素直に想起できるという点と,それと複数の情報が一目で分かるという点が重視されることが重要であるとも書かれているので,対象のコンテンツと擬人化が結びつくものかどうかをご検討いただきたい」というコメントがなされた.また別の質問者から「システムに使用されている感性語の個数はいくつくらい定義しているのか?」という質問がなされたが,発表者から「擬人化インタフェースの洋服の色に関しては 219 語,表情に関しては一表情当たり 50〜100 語程度の感性語を付与している」という回答がなされた.
6. Webコンテンツ推薦におけるJaccard係数方式と尤度比検定方式の適用領域に関する検討
 ○王 琳g(東工大)・小林亜樹(工学院)・佐々木 祥・宮田高道・山岡克式(東工大)
概要
情報推薦が注目されているが,その多くは未だに数理的な解析が行われていな い.本研究では,推薦方式におけるJaccard係数方式と尤度比検定方式の適用領 域を明らかにするため,Social Bookmark Service (SBM)での情報推薦を模した 実験環境を設定し,ユーザの全体からbookmarkするコンテンツ数とコンテンツ総 数の割合の違い(観測率)が,両方式による被推薦者との類似度に及ぼす影響につ いて比較した.観測率が小さい場合の実験結果より,尤度比検定方式では観測さ れた状態の信頼性が低いことを反映して,低い類似度となる. Jaccard係数方式 では,類似度の分散が大きくなるだけで平均は変わらない.推薦値の計算に悪影 響を及ぼす類似度の誤り率は,尤度比検定方式ではJaccard係数方式のおよそ 1/3程度である.SBM における情報推薦では,観測率が小さい場合が多いため, 尤度比検定方式の優位性が明らかとなった.
Keywords: 推薦システム,類似度,bookmark,SBM,尤度,数理解析

質疑応答議事録
最初に会場より「情報推薦の研究領域で使用されている類似度のうちメジャーな指標はコサイン尺度とピアソン相関だと個人的には考えているのだが,なぜジャッカード係数を研究対象として進められたのか? またメジャーな指標との比較が行われていないことに疑問を感じているのだが,その理由をお聞かせいただきたい」という質問がなされた.これに対し発表者は「当初からメジャーな指標であるコサイン尺度やシンプソン係数など様々な指標を研究対象にしていたのですが,ジャッカード係数以外にはこれといった特徴を発見することができなかったため,最終的にジャッカード係数を選択した」という回答がなされた.これに対してさらに「調査研究であるならば多くの指標を用いて実験し,その結果を事実として残すことが重要ですから,研究発表の際には報告していただきたい」というコメントがなされた.また座長から「自然言語処理の研究分野でもデータ量やその性質によって,そうした指標がどのような振る舞いをして,どういう場合にはどの指標を用いるとよいという研究が,日立の方がやっておられたので参考になさってください」というコメントがなされた.
7. 研究リソースの共有を支援する研究室 SNS の開発
 ○越智洋司・真木努・井口 信和 (近畿大学)
概要
我々は,研究活動を支援するためのリソース共有システムの開発を行っている.研究活動においては,人的リソース,物的リソース,知識的リソースの活用が必要となるが,人的リソースの不足が各種リソースの活用を困難とすることがある.我々は,大学における研究室が,研究活動を行う1つの集団(コミュニティ)であることから, SNS的な応用が可能であると考えた.本研究では,研究室内の学生の研究活動やリソース情報を共有する研究室SNSの開発に着手する.本発表では,研究活動における諸問題を取り上げ,SNS的アプローチによる研究活動支援モデルを提案し,研究室SNSの概要を述べる.
Keywords: 研究室SNS,研究活動支援,研究リソース

質疑応答議事録
最初に会場から「グループウェアなどの知識共有支援システムは,これまでクローズドな世界を対象としてきたが,最近の研究の流れとしてはオープンな世界を対象とするために SNS を使用して情報共有を促進させようとしているところがある.これに対してこの研究は SNS の研究を逆にクローズドな世界に限定しようとしているように思われるが,そうであるならば,従来研究のグループウェアとの違いを説明していただきたい」という質問がなされた.これに対して発表者は「実際に機能的にはグループウェアと何ら変わらないかもしれない.ただ学生に使ってもらうことを考えたときはグループウェアという古めかしい用語を使うよりは SNS というほうがうけがよい」という回答がなされた.また別の質問者から「SNS を利用するのであれば,他の研究室との連携等を考えるという方向はあるのではないか?」というコメントがなされたが,「大学の中で他の研究室との情報交流することはあまりないので,そういう方向性にはならない」という回答がなされた.さらに別の質問者から「JABEE では学生の教育レベルを問うという要件があるので,SNS にそうした機能があればよいのではないか」というコメントがなされ,これに対して発表者は「JABEE では卒業研究に何時間時間をかけたかといったことも要求されるので,そうした機能はすでに研究時間を記録することで対応している」との回答があった.最後に会場から「学生に強制して使わせるという形ではなく,何とかして使ってもらうようにするのが研究であるのではないか?」というコメントがなされたが,発表者は「今回は SNS を使用する価値に関しては話さなかったが,SNS を使用することで学生間でコミュニケーションが発生し,学生の研究に対するモチベーションが上がってくれないかというところを狙いたい」という回答を行った.
8. ソーシャルブックマークのコメントにおける言語表現と機能の分析
 ○山田剛一・本晶夫・絹川博之 (東京電機大学)
概要
ソーシャルブックマークサービスにおけるコメント欄のあり方について注目が集まってい る.ソーシャルブックマークサービスにはブックマークされたページに対するコメントを 一覧で表示する機能が備わっており,これは制約つきの掲示板と見なすことができる.ブ ログ記事のコメント欄と異なり記事の著者との対話を前提としていないことから,様々な タイプのコメントが存在している.このコメントの内容を分析した結果,コメント欄が主 に意見を述べる場として機能していることがわかった.本稿ではコメント内容の分析に基 づき,コメント閲覧者が読みたいコメントとは何かを,コンテンツの既読/未読という観 点から検討する.また,その検討を踏まえたコメントフィルタリングのサービスを提案す る.
Keywords: ソーシャルブックマークのコメント, ブクマコメント,ソーシャルブックマーク, ソーシャルメディア,コメントフィルタリング

9. ユーザの行動目的に着目した Web ログの傾向分析
 ○市川裕介・石井久治・佐藤宏之・小林透 (NTT)
概要
我々は,ユーザの心理的な状況をアクセス履歴の単純な統計処理で得られる傾向から 推定する方式の確立を目的として,ユーザのWebへのアクセス傾向とユーザの行動目 的との関係について分析を行った.分析の結果,ユーザ毎のサイトへのアクセス傾向 がべき乗分布を示すこと,そのべき指数からユーザのWeb利用の目的の明確さを推定 できる可能性があることを確認した.
Keywords: パーソナライズ,履歴分析,ユーザ行動分析,べき乗則,ユーザプロファイリング

質疑応答議事録
最初に会場から「一年といった長期間の傾向は Web ログの分析ではっきり出てくると思われるが,もっと短い期間の場合の傾向というものはとれるものなのか? また,分析結果である傾向が傾きが大きいか小さいかの二択であれば,ユーザが自らどちらの利用傾向があるのかを指定してもよいのではないかと思うのだがそれについてはどうか?」という質問があった.これに対し発表者は「短い期間の傾向がとれることに意味があると感じているが,現状では一週間単位であれば傾向がとれるのではないかという感触は得ている.また二つ目の質問に関しては本システムがプッシュ型のサービスで利用,ユーザからの入力が望めないという状況での使用を想定しているので,そういうことは考えていない」という回答を行った.また別の質問者からは「使用しているログはクライアントサイドのログだと思われるが,そういうログ分析だけではなくユーザがどのような検索をして,Web ページをどのくらいたどったのかといったレベルでの分析が必要ではないか?」という質問がなされたが,「テキストマイニングを行った結果に基づいて,ユーザが今どういうプロセスのどういうフェーズにいるのかを分かった上で,何かしらのアプローチをかけるというプッシュ型のサービスにつなげていきたいと思っているので,そのような細かな分析を併せて行うことも必要だと思っている」という回答がなされた.
□17:30〜18:30 WI2特別企画:「オブジェクト指向スクリプト言語 「Ruby」の開発」
  まつもと ゆきひろ氏 (ネットワーク応用通信研究所)


■平成21年3月24日(火)9:00〜11:50

□9:00〜10:00 セッションIII 「文書解析」(ロング発表)
  座 長: 笹島 宗彦(阪大)
  副座長: 大塚 真吾(物質・材料研究機構)

10. 固有表現の共起情報を用いたオントロジー語彙拡充技術
 ○稲葉 真純,長野 伸一,服部 正典((株)東芝 研究開発センター)
概要
オントロジーを用いたアプリケーションの構築運用において,効率的なオントロジーの整備は重要な課題である.修飾語を含む大量の商品名データから,新商品の名称を表す部分文字列を獲得するために,固有表現の共起情報を用いた語彙抽出手法を提案している.提案手法では,75.51%の精度で商品名を抽出できた.更に,機械学習を用いた既存手法との比較評価により,提案手法の方が高い精度で商品名を抽出できた.その結果として,商品名のような固有表現が頻出するデータでは,従来の文章を対象とした素性は語彙抽出に対する効果が小さく,1 センテンス,およびセンテンス集合における出現語彙の規則性を考慮した素性が有効であるとわかった.
Keywords: オントロジー,オントロジー語彙拡充,固有表現抽出

質疑応答議事録
聴講者より,Webから商品名を持ってくる方法はどういうものを想定しているのか,また,商品名の特定方法に関する質問があり,発表者からは商品名を抽出する方法として今回は「商品名」と分かる部分を人手で取ってきている.自動的に取るとしたら,イーコマースサイトのメタデータが配信されているところなどで,商品名のタイトルタグなどで囲まれている部分を抽出することを想定している.また,Webページの場合は商品名の一覧のようなテーブルになっている部分からの抽出を想定しているという回答があった.さらに同じ質問者から,DVDの商品タイトルに「スペシャルエディション」や「初回限定バージョン」などが付いている場合はノイズになるのかという質問があり,発表者からは評判分析サービスでの検索を考えた場合,ユーザはタイトル名だけで「スペシャルエディション」まで入力するユーザはあまりいないと考えているという回答があった.同じ質問者から,オークションの場合などは「初回限定バージョン」の場合は高い値が付くこともあるため,どこまでを商品タイトルとするかは状況によると思うというコメントがあった.
座長より,最近は商品の多機能化が進んでいるため,例えばワンセグチューナーを内蔵したノートPCはどのクラスに属するのかなど,構築されているサイトで用意しているクラスジャンルとインスタンス(実際の商品)がずれて来た場合はどうするのかという質問があり,発表者からは,今回の発表ではインスタンス(商品)を増やすことに着目しているが,クラスについては新しいものを追加したり組み替えたりして対応するという回答があった.さらに座長から,映画のタイトルなどはきちんとタグ付けされているものが他のサイトにもあるが,そのような情報(リソース)を利用することは想定しているのかという質問があり,発表者からそれらの情報は「本当に人名なのか」「本当に商品名なのか」などの確認作業で利用できると考えている.既存リソースも利用していきたいとの回答があった.
他の聴講者より,このシステムが有効だと思うのはユーザがどの商品を個別のものとして認識しているかのバウンダリーを掴むのに良いと感じていて,Cognitive marketを調べると応用範囲が広がると思うとのコメントがあった.
他の聴講者より,商品によってはISBNなど品番があるため,簡単に商品名を抽出できる場合もあるが,それについてはどう考えているかという質問があり,発表者からは確かに品番を使うという方法もあるが,ユーザが実際の商品をどういう風に呼ぶかやどういう風キーワードを入力するかなどなかなか難しい部分もあるので,品番だけから1つの商品名を抽出することは難しいとの回答があった.
また,提案手法ではユーザが入力する色々多様性をもった商品名を抽出したいのか,商品の正式名称を抽出したいのか,どちらが目的なのかという質問があり,発表者からは本音を言えばどちらも抽出したいが,今回の手法では正式名称に近いものを抽出するのが目的という回答があった.
11. 語と語の関連性に基づくスコアリング手法の文書検索への応用利用とその評価
 ○伊藤 ゆかり,波多野 賢治(同志社大学 文化情報学部)
概要
本稿ではリンクで関連付けられたページ間の関連性を用いてメタデータを作成するために,その前段階としてWikipedia を対象にページ間の関連性の抽出を試みた.その過程として,Wikipedia 内ページのタイトル語句をリンク元内容とし,また,そのページにリンクを伴って生起する語彙群をリンク先内容として,ページの内容をそれぞれ特定の語彙群に置き換え,最終的にこれらの語彙間における概念的な関連性について,WordNet を用いてその関連度の算出を試みた.本手法の有用性を確認するため評価実験として本手法を文書検索システムに適用し,従来手法との比較実験を行った結果,従来手法より精度の低下がみられたが,概念辞書では把握できない概念が存在する可能性及び対象文書に応じて採用する概念を選択する必要性があるという,二つの知見が得られた. Keywords: Semantic Web,リンク,関連度,ウィキペディア,WordNet

質疑応答議事録
聴講者より,リンクへのメタデータというのはどういうものを設定しているのか,例えばis aなどでしょうか?という質問があり,発表者からはis aも含めてどのようなものを使えば良いのか考え今回のスコア算出を行ったが,できればis a以外でも色々なものも付与したいと考えている.さらに聴講者より,webページの中には色々な内容が書かれているので,ページとページの関係がis aという意味が分からないという質問があり,発表者からは今回はリンクに付与すると考えたため,部分文書での関係を測ることを目的としており,ページとページそのものの関係ということでは無いとの回答があった.また,今回は従来手法の方が良いという結果だが,他の尺度では提案手法が良かったという点はあるかという質問があり,発表者からは今後の課題であるという回答があった.
他の聴講者より,スコア値からis aの関係だと見極める指標はあるのかという質問があり,発表者からは今回は紐づいたセットの意味から判断しているとの回答があった.
座長より,今後の課題である目的に応じた推薦が関わる部分で,目的や閲覧者がやることはどのように分類するのかという質問があり,発表者からは目的はシステム側で提示することはできないので,ユーザに何らかのパラメータを入力するしてもらい,関連のあるものを提示することを考えているとの回答があった.
他の聴講者より,この研究でやりたいことと評価実験にズレがあるので,なぜ文書検索をやろうと思ったのかの説明が欲しい.やりたいことの評価になっていないと感じるとのコメントと質問があり,発表者からは出来ればメタデータ付与まで行ってから評価をしたかったが,まずはスコアの評価を行いたかったため,今回はこのような評価となったという回答があった.
□10:20〜11:50 セッションIV「情報検索」(ロング発表)
  座 長: 是津 耕司(情報通信研究機構)
  副座長: 井口 誠(シンクロア)

12. 文書内容の一貫性を考慮した検索手法の実装とその評価
○田村航弥・波多野賢治(同志社大)
概要
インターネットの普及に伴いWeb データが増加し続けているなか,情報検索 システムによって提示されたデータは,質の良いデータから質の悪いデータに 至るまでと多岐にわたる.このような背景の中,データの信頼性に対して関心が 高まっている.データの信頼性を評価する尺度として意味内容を考慮する方法が あるが,文書の意味内容を計算機を用いて解釈するのは困難なため,これに関連 する研究は進められていない.そこで本稿では意味内容を考慮する一手段として, 文書内容の一貫性を解析する手法を提案する.ここでの一貫性とは,ある文書の 内容がどれだけ一つの事象に則して記述されているかということを意味し,これ をデータ自身のもつ信頼性の指標とし,ユーザに負担なく質のよいデータを提示 することを目的とする.さらに,本手法を文書検索へ適用し,一貫性を考慮しな い検索手法と検索精度を比較し本手法の評価を行った結果,単一クエリに対する 一貫性を考慮する検索において精度の向上が見られた.
Keywords: 信頼性,一貫性,Wikipedia,情報検索

質疑応答議事録
聴講者より,ページ間の関連度としてPageRankを採用した理由について質問が あり,発表者からはWikipediaの記事の情報量に影響されない関連性の重要度を 算出するために,ページ間のリンク情報を基にしたPageRankを採用したとの 回答があった.これに関連して,記事間の関連度と重要度との関係について質問 があり,発表者よりリンクがある種の投票のような役割を果たしているため 「PageRankが大きい=リンク先を信頼している」という解釈が成り立つと考えて いるとの回答があった.これに対して,会場からは,関連性は1対1の関係だが, 重要度は1対多の関係なので若干意味合いが異なるのではないかとのコメントが 寄せられた. また,他の聴講者より,PageRank算出時に遭遇した問題についての質問があり, 発表者からは自己リンクのみ存在するページや2ページ間の相互リンクしか存在しない ページなどがあったため,これらをノイズデータとして除去する必要があったとの 回答があった. この他,会場より,既存手法との比較をしつつ,今回Wikipediaを利用した理由を 明確にした方がよいというコメントや,一貫性のある文章を探すという命題に対して, 今回のクエリ拡張というアプローチが本当に適切なのか再検討するべきであるという コメント,さらにはPageRankだけではなくHITSアルゴリズムなどとの比較をしてみて はどうかなどといったコメントが寄せられた.
13. Webコンテンツ作成支援のためのリンク目的を意識したリンク先推薦システムの 実装と評価
○武吉 朋也・服部 元・小野 智弘・滝嶋 康弘(KDDI)
概要
近年,ブログの登場により,一般ユーザであってもWebコンテンツの作成と公開が 容易になった.Webコンテンツ作成過程において,他のコンテンツへのリンクを 作成することがあるが,これらのリンクは公式サイトの参照や過去に自らが作成 したコンテンツの参照等,様々な目的をもって作成される.適切なリンクを作成 するためには,該当コンテンツの検索やURLの転記といった煩雑な作業を伴うため, これらの負担を軽減する支援システムが必要である.筆者らはこれまでに,Web コンテンツ作成者がリンクを作成する目的を考慮し,リンク先の候補を提示する リンク先推薦手法の概念を提案した.本稿では,リンク先候補の適切さを推定 する具体的な予測モデルの提案と,実装および評価を行う.
Keywords: Webコンテンツ,リンク作成の支援,情報推薦

質疑応答議事録
聴講者より,リンク元の文章として適切ではないケースについて質問があり,発表者 からは,例えば「ここ」という単語に対してリンクを推薦するのは困難であるとの 回答があった. 併せて,「今日」などの単語については,尺度に「時間表現」を導入することで 今後対応する予定であるとの回答があった. 他の聴講者より,リンク目的がwholeまたはpartialの場合,実際にリンク先を 見ないとリンクを貼るべきか判断できないのではないかとの質問があった.この 質問に対して,発表者からは,今回の提案手法はリンク作成支援を目的としており, 最終的にユーザが リンク先を確認して判断することもあり得るとの回答であった.さらに,過去に 見た記事を手がかりにしてはどうかとの質問があった.これに対して,発表者 からは,今回ターゲットとしているのはWebでの情報収集を日常的には行わない ユーザであるため,閲覧履歴が残っていないことを前提としたシステムになっている との回答があった. これ以外に,会場より現在のシステムにおけるインタフェースの完熟度に関する質問があり, 発表者より現在のインタフェースは主観評価実験を実施するために用意した最低限のもので あるとの回答があった.
14. アクセスランキング掲載サイト情報をまとめたユーザーズランキング生成
○日野滋樹(NTT)
概要
知名度が低いなどのため大規模検索サイトで発見しづらいが特定の利用者に とって関わりのあるWeb サイトを発見する方法について検討した.それぞれが 独自の観点から選定したURL群で構成されている公開ランキングページの 情報を利用して抽出したサイト間の関係強度を利用し,ユーザーが指定した サイトを起点とした関係強度ランキングを生成する.ユーザーが知っている リンク集,ランキング等から直接見つけにくいサイトも早期に見つけることが 出来る.実在のサイト群に提案方法を適用し,複数の経路を介した関係強度 合成によって起点から直接のリンクがない隠れた関連サイトを上位にピック アップ出来る場合があることを確かめた.
Keywords: ランキング,関係強度,重み付きグラフ,収集,合成

質疑応答議事録
聴講者より,提案手法により発見したいサイトは具体的にどのようなもの なのかという質問があり,発表者より例えば「萌え系」などのような, マニアな人たちには知られているものの,検索サイトのランキングでは 上位にランクインしない隠れページ的なものがターゲットであるとの回答があった. これについて,会場より,なぜそのようなサイトが検索結果でランク上位に 来ないのかという質問があり,発表者からはこれらのサイトが画像バナーを 多用しているため不当にPageRankが低くなっている可能性や,テキストが極端に 少ない・タイトルに凝りすぎているなどといったサイトの特徴が原因で キーワードベースの検索がうまく働かなくなっている可能性があるとの 回答がなされた. この他,ランキングサイト間の共通の度合をはっきりさせないと,複数の ランキングサイトをまたいで位置する2つのサイトの関係の有意性が明確に ならないのではないかという指摘や,どのようなドメインをターゲットと するのかを明確にしてほしいなどといったコメントが会場より寄せられた.
■平成21年3月25日(水)9:00〜15:50

□9:00〜10:00 セッションV 「モバイル環境」(ロング発表)
  座 長: 市川 哲彦(山口大)
  副座長: 松下 光範(関西大)

15. モバイルサービス向けタスク指向型メニューの実規模試作と評価に関する一考察
 ○笹嶋宗彦, 古谷孝一郎, 來村徳信 (大阪大学), 深澤佑介, 長沼武史, 倉掛正治 (NTTドコモ), 溝口理一郎 (大阪大学)
概要
モバイルサービスの利便性向上を目的として,著者らが共同で研究を進めてい るモバイルユーザのコンテキストを反映したタスク指向型メニューについて報 告する.本発表では,オントロジーに基づくユーザモデルを参照し実規模のモ バイルサービスを内包する形でタスク指向型メニューによるモバイルサービス 試作過程と,その実環境下での評価実験について述べる.実際のi-modeサービ スの規模でシステムを構築し,13人の被験者にそれぞれ1週間自由に使用させ る形式での実験を行ったところ約82%の場面で被験者を適切なメニューへ誘導 できた.
Keywords: モバイルサービス,タスクオントロジー,タスク指向型メニュー

質疑応答議事録
会場から検索型サービスとどちらが有効なのかについて質問があった.これに 対して,タスク指向のナビゲーションは,初心者に有効であり,エキスパート 向けには望みのサービスが発見できなかったりするケースもあったという回答 があった.会場からコメントで,タスク自体が定義されていない場合は,どう いう見方で定義されていないタスクに誘導するのが有効かが重要という指摘が あった.このコメントに対しては,「タスク指向で誘導していくことの効果だ けを確かめたかった.もっと細かく状況を指定して,アドホックにタスクを入 力していくようなIFの工夫はこれからやっていく.」という回答があった.ま た,会場からのコメントで,オントロジーをWeb2.0的に共同編集できると良い という指摘があった.また,「タスクを個人に特化していくことは考えている のか?」という質問があった.これについては,個人特化もする予定である旨 回答があり,例えば,「やってしまったことがあるタスクを消すような工夫」 などをやろうと思っているとのことであった.これに対するコメントとして, 10代の若い人たちは,携帯をつかいこなせるが,お年寄りにやさしいシステム が良いという指摘があった.特に,タスクの細分化にユーザプロファイル(年 齢や年収など)を考慮できると良いという指摘があった.最後に会場から, 「オントロジーを人手で書けば,かなり洗練化されたメニューがかける.どこ に,学術的新規性や技術的工夫があるのか?」という質問があった.これに対 しては,「サービスを受けるというタスクのモデルをオントロジカルにしっか り書いていると,オントロジー設計者,サービス提供者,サービス事業者間で 知識の共有ができる.自分のサービスに他人の書いたタスクオントロジーが使 えるかなどを考えることができる.」という回答があった.
16. 異種複数の履歴に基づく行動ターゲティング
 ○深澤佑介, 長沼 武史, 大野木碧, 倉掛正治 (NTTドコモ)
概要
個人適応型のサービスを実現する一手法として「行動ターゲティング (Behavioral Targeting)」が注目されている.本稿では,従来の行動ターゲティ ングでの対象であったインターネット閲覧履歴に加え,TV 番組の視聴履歴, ニュース閲覧履歴,i-mode 閲覧履歴等の異種複数の履歴からユーザの嗜好を 推定し,コンテンツの推薦を行う手法を提案する.具体的には,異種複数の履 歴から共通の嗜好を推定するため,嗜好セグメントに対し,嗜好セグメントが 対象とするユーザの種類を行動の観点から網羅的に定義した.ここでは,大阪 大学溝口研究室と共同で開発したタスクの語彙集で定義された語彙を用いる. また,未知のコンテンツの評価を行うため,満足・不満足の履歴データに基づ くSVM:Support Vector Machine を用いたコンテンツランキング手法を提案し た.提案手法のユーザ評価を行い,ユーザの5 段階評価において,従来の行動 ターゲティング(コンテンツマッチングアルゴリズム)に比べ9%,人気ラン キングに比べて21%評価が向上した.
Keywords: 情報推薦,SVM,嗜好推定,行動ターゲティング

質疑応答議事録
会場から,タスクという考え方を取り入れたアイデアは面白いが,今回の提案 の範囲ではユーザの行動と呼べるところまでたどり着いていないのではないか, という指摘があった.これに対して,確かに今回は最終的に推定しているのは 「ムービー」とか「ミュージック」であり手法の効果を推薦精度でしか測定で きていないが,履歴に基づいてユーザが「音楽を聴くことに興味がある」とか 「音楽を作ることに興味がある」というレベルで提示ができるようになれば, 今回の手法の良さがわかると思うとの回答があった. これに対して,音楽を 「聴く」と「作る」は違う嗜好セグメントになるのか,タスクレベルで分かれ るのか微妙な気がするとのコメントがされた.次に,嗜好セグメントの下にタ スクモデルがきれいにぶら下がるものなのか,いろんな嗜好セグメントにぶら 下がってそんなきれいなツリーにならないのではないか指摘があった.これに 対して,今回は嗜好セグメントをドメイン(名詞)と捕らえ,タスクの動詞と 組み合わせているので現在は単純な単層階層であるが,いろいろなドメインの 概念が入ってくると多重階層になってくるので,単純にはならないと思う,と の回答があった.また,推薦精度に関して,モバイル状況下で単純に暇つぶし したいのであればゲームや音楽,映画など何を推薦しても良い推薦になると考 えられるが,何を基準に測定しているのか,という質問に対して,現状は単純 に提示されたコンテンツが気に入ったか気に入らないかの5段階で評価してい るが,本来ならば「暇なときには」とか「電車に乗るときは」といった状況を 設定して調べるべきであったかもしれないとの回答があった. また,共通嗜 好セグメントに関して,「音楽」や「映像」と違って「旅行」のように名詞だ が動詞のように振舞うものもあるので,名詞と動詞から派生した名詞をわけた ほうがいいのではないかというコメントがあった. 最後に座長から,モデルの精緻化と作成コストのトレードオフに関する議論を したほうがよい,というコメントがなされた.
□10:20〜11:50 セッションVI 「情報抽出」(ロング発表)
  座 長: 難波 英嗣(広島市大)
  副座長: 品川 徳秀(東京農工大)

17. ハイパーリンク自動生成のためのキーワード抽出方式の提案とコンタクトセンターへの適用
○立石健二・細見格・久寿居大 (NEC)
概要
本稿では,文書間のハイパーリンクの自動生成のためのキーワード 抽出方式を提案する.筆者らは,企業の顧客窓口の問合せ回答のための 情報収集支援を目的として,オペレータが参照する様々な情報源 (Web サイト) の間のハイパーリンクを自動的に生成するハイパーリンク 自動生成システムを開発している.本システムは文書から抽出した キーワードを用いてリンクを生成する.文書からキーワードとなる 重要な単語列を選択する方式としてはtf とidf がよく知られているが, これら2 つの指標だけでは正確なキーワード抽出は難しい. 本稿では,単語列の重要度を測る新しい指標を用いたキーワード 抽出方式を提案する.この指標は,適切なリンク生成対象の文書 セット間に含まれるリンクの特徴から導かれるキーワードの出現傾向に 基づく指標である.製品保守の窓口業務で使用する文書を用いて 提案手法を評価したところ,従来の指標 (tf やidf) と組み合わせる ことにより正解率を約10%向上でき,提案方式の有効性を確認した.
keywords: ハイパーリンク, キーワード抽出, コンタクトセンター

質疑応答議事録
聴講者より,「機械学習させているという理解でよいか」 という確認に対し,「そう考えてよい.1 回目の仮説に対して 2 回目で補正をしている.」という旨の回答があった. 更に,「rich-get-richer 現象が発生し,後から良い資料が出現しても 全く参照されないままになる可能性はないか」という指摘に対し, 「発生する可能性はあるが未検証である.更新されるごとに逐次 更新するなどで対応できるかもしれない.」という回答があった.
また,「予稿集 図 3 では,同じキーワード A に,リンク生成された 黒 A とそうでない白 A が記載されているが,これはどのような 基準による違いか」という質問に対し,「指標計算の結果, 重要キーワードとみなされなかった語である」旨が確認された. 別の聴講者から,「特徴 1 と 特徴 2 は直観的には同じことを指している ように思える.ハブやオーソリティと類似した概念と考えても良いか.」 という質問に対し,「前提条件が違うので単純に同一視できないかも しれないが,そのような見方をしても良いだろう」との回答がされた. また,「補正をかけたリンクとはどのようなものと考えれば良いのか」 という質問に対し,「本研究は,オペレータがある文書を見た後に別の ある文書を頻繁に参照する,という関係に着目したものである. これは,リンクされているべきものを暗黙的に表しているとみなしている.」 との回答があった. 「単語として,どのようなものを用いているか」という質問には, 「フレーズを用いており,基本的に名詞を用いるが 『カートリッジの交換』なども候補である」と説明された.
更に別の聴講者から,「発表中でも言及されたように, リンク生成は20年近く前から行なわれてきている. 近年はオントロジを用いた生成方法が増えていると思う. 国際会議 ACM HYPERTEXT などを参照されたい.」とのコメントがあった. 続けて,「この研究は,参照元と参照先を明示的に分けている点が非常に 興味深い.」とのコメントに対し, 発表者から,「もしかするとマイナスになる可能性もないわけでもないが, オペレータには典型的な情報参照のプロセスがあり,ある程度のクラスタが 有効だろうとの着眼によるものである」との補足があった. 最後に,「リンクの特徴は,閲覧履歴を利用すれば参照の依存関係が 見出せるかもしれない」というコメントに対し,「それを行なうためには, 多くのログが必要になる.また,どこからどこにリンクを張るのが 望ましいのかは機械的には分からないだろう.提案手法とは補完関係にあり, 組み合わせて展開して行く必要があると考えている.」との説明が述べられた.
18. 検索クエリログを用いた商品絞り込み属性抽出手法の検討
○関口裕一郎・北川結香子・田中明通・内山匡 (NTT)
概要
インターネットの普及により,EC サイトにおいて商品を検索し 比較検討した上で購入するという行為が一般的になってきている. そのような中で,個々のユーザーがどのような商品を求め, どのように検索しているのかを把握するのは,サイトのページ構成や 商品品揃えを改善するための知識源として利用できる重要な情報である. 一方でEC サイトにおいては,大まかな検索クエリを入力し, その結果を見ながら商品を絞り込んでいくような使われ方がされるため, ユーザの入力した検索クエリの情報だけでは,どのような商品に 絞り込んで探しているのかを把握するには不十分である. 本研究では,このような検索クエリには記述されないが,検索結果からの 商品の絞り込みに用いている絞り込み属性を抽出することを目的とし, 多数のユーザによって入力された検索クエリのログを用いることにより, 精度よく絞り込み属性となっている語句を抽出する手法を提案する. オークションサイトにおける検索行為にたいして提案手法を適用し, 閲覧したページのみから絞り込み属性を抽出した場合に比べ, スコア上位1 件での精度が0.28向上することを確認した.
keywords: データマイニング,ウェブマイニング,検索エンジン,属性抽出 質疑応答議事録
聴講者から,「言語処理学会年次大会で,ヤフオクのデータで 出品データから自動抽出するという研究発表があった. また,研究の方向性がやや異なるが,クエリログでの共起度を使う 研究もある.それらも調査してはどうか.」というコメントがあった.
別の聴講者から,「提案手法ではクエリログを用いているが,『株価』や 『採用情報』など購買目的ではない検索がノイズになったりはないか」 という質問に対し,「ブランド名やショップなどが出て来ることはある. 商品属性は,商品説明文からのみ抽出しているので,大きく問題になる ことはない.重複するようなものは意外と限定的なので,ブラックリストを 作ることで対応できるであろう.」と回答された.
更に別の聴講者から,「目的の違う共通度,クエリ度,共起度の組合せによる アプローチであるが,何が最も影響が強いのか.クエリ度,共起度だけを 用いた場合とはどのような違いが出るか.」という質問に対し, 「クエリ度が最も支配的である.共通度によってフィルタリングしており, クエリ度のみでは算出できない手法になっている.」と説明された. また,「クエリログだけを分析した方が良い結果を得られるかもしれないが どうか」という質問に対し,「検索語が商品名の一部に含まれることがあり, 単純な共起性だけでは上手く行かない場合がある.ブランド名で検索した後に ブランド名と商品名で検索するなど,検索の順序を考えると良いと考えている. そのような場合には単純な共起性だけでは上手く行かない」と回答された.
19. Grammar-gramとGrammarVerb-gramを用いたドメイン非依存型Whyテキストセグメント判定と回答抽出
○田中克幸・滝口哲也・有木康雄 (神戸大)
概要
本研究では,テキストセグメントの文法情報に着目して, ドメイン依存性の少ない学習器の構築により,Why テキスト セグメント判定と回答抽出の自動化手法を提案し,1 度の学習と ラベル付けで様々なドメインにおけるWhy 型質問応答が可能となる グロ−バル学習器の構築を提案する.これにより従来のWhy 型 質問応答の問題点であった,ルール作成に手間が掛かる, ドメイン依存性,学習時間が長いといった問題が改善された.
keywords: QA,IR,Non-factoid

質疑応答議事録
聴講者から「G-gram, GV-gram を 4種類分類したデータで機械学習を させているが,対象としている品詞に対するラベルが効いたのか, 従来と同様に形容詞が効いたのか.」という質問があった.これに対し, 「学習時には品詞ではなく,形態素と品詞を考慮して学習している. 助詞などの機能語によって文の構造を学習することが目的である.」 との回答がなされた.
別の聴講者から,「ドメイン非依存性のために名詞を使わないとの ことであるが,情報を落とし過ぎてしまうのではないか. 人名や組織名など,部分的に使うのが良いのではないか.」との 質問に,「類似した文書を検索するには名詞情報なども必要であるが, コンセプトを判定するためには名詞情報は不要というのが特徴的な 成果である」との説明があった.
また,「学習したものは様々なものに適用できるか」「どのような 品詞が有効か.」との質問には,「適用できる」「どのような品詞が 有効かを決定する試みではなく,機能語を用いるのみでテキスト セグメントを判定することが目的」と回答があった.
更に,「あらかじめ回答文があるものを分類するのに用いるのか」 との質問に対して,「そうではなく,任意のウェブページから テキストセグメントを抽出するものである」との回答があった.
「『空が青いのは?』という質問に対して『空』『青』という語は 有効なのではないか」との質問に対しては,「IR では必要であるが, コンセプトの判定には不要.両者は目的が異なり,組み合わせて 利用する必要がある.」との回答があった.
□13:00〜14:00 セッションVII 「システム開発と分析」 (ショート発表)
  座 長: 齋藤 ひとみ(愛教大)
  副座長: 小林 亜樹(工学院大)

20. 検索エンジンを利用した印象語からの概念推定
  ○永井 洋平・黒木 さやか・山名 早人(早大)
概要
本論文では検索エンジンのフレーズ検索を利用して,印象語を用いた概念ベースの自動構築手法を提案する.概念を一般形容詞及び動詞を属性とする特徴ベクトルとして表現する.動詞の基本形と名詞からフレーズを生成し,フレーズをクエリとした検索エンジンのヒット件数を特徴量とすることで,概念を多次元の特徴ベクトルで表現する.この手法により,概念を概念と関連がある語句により特徴付けるのではなく,概念が保有する印象により特徴付けることができる.実験では,構築した概念ベースを利用して複数の印象語から概念を推定するシステムを実装した.評価は人手により行い,77%の精度を得ることができた.
Keywords: 概念ベース , 連想メカニズム , 関連度

質疑応答議事録
聴講者よりの,印象語から属性ベクトルを生成し,さらに対象物の属する「りんご」-果物 の関係のようなカテゴリ判定にも属性ベクトルを再度用いているという理解でよいか?もしそうなら,別々の判定処理ではなく,統合して行えるのではないか,との質問に対して,処理自体はそのとおりだが,一旦カテゴリを限定することで,概念の絞り込みを行う形としたとの回答があった. 他の聴講者よりの,集合知〜意外なものの発見が目的だったが,実際に意外なものはあったか?との質問に対して,試作段階で一般名詞に限った概念登録のため,意外性はない結果しか出ていないとの回答があった.
21. 異なる知識を持つ人々の合意形成に関する分析〜 選好誘因が動的に変化する場合を対象として 〜
  ○松下 光範(関西大)
概要
本研究の目的は,異なる知識を持つ人々が協同を支援する システムのデザイン指針を明らかにすることである.課題 解決の場面で複数の代替案がある場合,各々の参加者が もつ知識の非対称性ゆえに,代替案に関する選好が異なる 場合が多い.また,各人の選好は静的であるとは限らず, 議論の過程や外的な要因によって変化する可能性もある. このような状況下で,人々はどのように妥協案を見出すのか についての実験を行ったので報告する.
Keywords: 対面協調作業,非対称な知識,誘因変化,ワンナイン課題,CSCW

質疑応答議事録
座長よりの条件Bが最良だったが,実際の実験中で自己犠牲的な振る舞いが見られたか,との質問に対して, 3人の被験者は衝立で仕切られており,挙手するという合意の合図自体は互いに見えないという補足説明の後, 条件Bでは,最も損をする被験者が合意しないという戦略を採りうるが,実験でのストーリーに納得したところで合意に達している様子が見られた,との回答があった.また,より深い分析をしていきたいとした. 聴講者より,「暗黙の仮定=全体情報のフィードバック」を用いた条件で良い合意結果が得られ,これは常識通りであったという理解でよいか,という質問があり,それに対して,その通りとの回答があった.一方,C案に見る「シミュレーション等による最終価値の提示」は合意を促進することはなかった.続けて,3人の立場と報酬との関係がどうなっているのか,との質問があり,それに対して,報酬構造自体は3人とも同様になっているが,より深い考察のためにはこれだけでは不十分でもあるとの回答があった.
22. タスクをマップ化することで見える化するプロジェクト管理ソフトウェアの開発
  ○高橋純一(システムフレンド)
概要
見える化, 情報視覚化とは文書や数値であらわされるデータを地図形式やガントチャートといった表形式で表すことによって, 人間からみた場合, データを直観的に理解できるようにするためのものである.本研究はその情報視覚化を, 階層的や期日等が決まっていない, 例えばオープンソースソフトウェア開発等で活用できる形で提供することを目標とした.視覚化に用いられるタスクの開発作業等におけるデータには, 階層的なデータ(画面ごと等), 時系列的なデータ(期日等)が代表的だが, 昨今のオープンソースソフトウェア開発では, バグ報告やソースコードのパッチ送付等が, 階層的に割り当てられず, また期日も決まっていない状態でコミットされることがある.その場合, 従来のガントチャート等は利用できないため,データ行であらわされたタスクシートしか開発者はみることしかできない.そういった状況を打開するため, 本研究では, ソフトウェア開発等のタスク情報を内容の文書から二次元の地図形式で表すことによって, また進捗状態を色の濃淡であらわすことにより, 残タスク量や進捗状態, タスクの関連性などを直観的に理解できるようにことをすることを, 目標としている.
Keywords:

質疑応答議事録
聴講者より,システム開発ではgantt chartなどを用いるのが一般的であろうと思われるが, 階層化や時系列情報のないタスクマップで管理されるというのはどのようなソフトウェア開発現場なのか?との質問があり, それに対して,OSSのようなユーザが開発タスクを自由に追加していき,開発者がどのタスクから作業にかかるかを自由に選択できる状況下を想定している,との回答があった. 他の聴講者より,視覚化の観点の種類数に対する質問があり,現状,「進捗」「回答」の2観点のみで,「タスク重要度」も検討したがユーザ主観のため未実装であるとの回答があった.その後,その程度の少数の観点であればマップからのタスク状況の把握が難しいとの指摘があり,それに対して,全体的な把握ができればいいと考えていた,との回答があり,それに対して,全体状況の把握だけなら,他の方法の方がよくないか?インタラクションを交えないと,可視化しただけの効果が得られないのではないか? 実際に使用される状況をもっと具体的に追求した萌芽良いと思う,といったコメントが寄せられた. 座長より,似たものが近くにマップされるが,クラスタリングしてラベル名をつけるなどして情報を付与してみたらどうか? 進捗状況表示ではタスクの開始時点などの情報も重要なので,それらも考慮した視覚化は?とのコメントがあり,時系列表示についてはアニメーションなどを検討している旨の回答があった. 他の聴講者より,似たものを近くに配置するならバネモデルのようなネットワーク構造の方が良さそうに思うが,方眼紙にした理由を問う質問があり,それに対してゲームのマップ様の表示という着想によるとの回答があった. さらに他の聴講者より,タスク間の依存関係をどのように表現していこうと思うか?との質問があり,現時点ではタスクの順序関係が捨てられてしまっているため,なんらかの表示を考えているが,具体的な解まではないとの回答があった. 最後に,2次元mapでは,自己組織化マップもあるので,これも検討してみて欲しいとのコメントもあった.
23. 雰囲気メタファによる街の偏在情報の集約・提示システムの検討
  ○宮森 恒・水口 充・河合 由起子(京産大)・是津 耕司・木俵 豊(NICT)
概要
本稿では,実空間情報の管理基盤技術の応用システムとして,街のさまざまな場所や時刻における特徴的なイベントや状況を,雰囲気メタファとして集約・提示するシステムを提案する.雰囲気メタファは,街の特定位置の領域形状にしばられない緩やかな時空間領域と,その領域内の特徴を示すラベルから構成され,携帯端末等で街のさまざまな場所から発信される位置,時刻,発話を集約することで生成される.提案システムによって,道の凍結など日常生活における重要情報が空間的な領域形状に依存せずに効率よく取得できる.京都市内を一定期間散策することでデータを収集し,提案システムの有効性を確認した.
Keywords: 実世界, 実空間, 時空間領域, 情報集約, 雰囲気マイニング

質疑応答議事録
聴講者より,イベントの起こりやすい場所が決まっていたりすることがあるなど,空間でのクラスタリングの有効性,他の方法についての質問があり,それは相当慎重に検討していく必要があるとの回答があった.他の聴講者より,利用のユーザモデルにはどういったものを想定しているのか?その場で知るのか,家で知るのか?利用モデルによってインタフェースも変わるのではないか?との質問に対して,クエリキーワードの関連情報だけを集約するというのも一法であるとの回答があった.さらに,そういったキーワードが思いつかない段階での「気づき」に生きる技術ではないかとの指摘があった.他の聴講者より,正確性の望めるテキスト入力ではなく,音声入力を採用した理由について質問があり,既存の音声マイクロブログの有効性検証と併せてデータ収集したためとの回答があった.これに対して,今後大量データを収集する際に,音声認識の困難さが障害にならないかとの指摘があった.他の聴講者より,サイクルが生じるなどの時間依存性についての指摘があり,今後の検討課題とするとの回答があった.また,「雰囲気メタファ」のメタファ,比喩の名称についての質問に対して,美術館でのざわざわとしたつぶやきのようなものを把握できるようなシステムとしたかった,という経緯があるとの回答があった.
□14:20〜15:50 セッションVIII 「ユーザ行動の調査」(ロング発表)
  座 長: 土方 嘉徳(阪大)
  副座長: 立石 健二(NEC)

24. 組成の類似性に基づく事物の妥当性判断支援
 ○宮森恒(京都産業大学)
概要
本稿では,ある事物を構成する要素とその分量,重みからなる集合を組成とみなし,これを利用者が信頼する規範となる事物の組成と比較することにより,その事物の妥当性を効率よく判断する手法を提案する.料理レシピを例として,その材料の構成割合を各レシピの組成とみなし,組成同士の比較と類似度計算により,そのレシピが,関連した他のレシピと予想される味付けにおいてどのような関係にあるか,その位置づけを提示する.比較対象として,指定したレシピと同じ料理に属する他の複数レシピの平均と,その平均に最も近いレシピを検出する.料理講師や一般投稿者によるレシピ投稿サイトのデータを使った予備実験により,指定したレシピが,同じ料理の他のレシピと比べて平均的な味付けになるのか特異な味付けになるのかを効率よく把握でき,自分に合った料理として妥当かどうかの判断がしやすくなることを確認した.
Keywords:情報信頼性,情報分析,組成割合,類似性,料理,レシピ

質疑応答議事録
「検出の感度に興味がある.どの程度酷いレシピを書くと良くないと判断されるのか.」という質問に対して,「例えば,酢の基準の量を1とすると1.5倍以上を強め,2倍以上で弱めといった風に決めている」といった回答があった.また,「例えば,唐辛子のような少し間違えるだけで味に大きく影響するのはどのような扱いになのか?」という質問に対して「調味料リストに重みを自動的に付与するので区別できる.」といった回答があった.さらに,「単純に考えれば料理レシピをベクトル表現し,ベクトル間を比較すれば良い気がする.提案手法のポイントは何か?」という質問に対して「要素一つずつの重み付けを考慮している点になる.例えば,酢豚を作るときには,砂糖や酢が重要で,胡椒がそれほど利かないといったことを自動的に判定する.」という回答があった.また,「料理レシピ以外にも応用できるのか?」という質問に対して「定量的にはかれる要素であれば適用可能.」という回答があった.またコメントとして,「現在は2つの料理サイトで評価しているが,サイトの種類が多くなるとフォーマットやパタンの作成が大変になるため,その対策が必要」といったものがあった.
25. 新聞記事の印象は読む順番によって変わるのか
 ○熊本忠彦(千葉工業大学)
概要
著者らは,テキストから印象を抽出する印象マイニング手法を提案するとともに,ユーザの記事閲覧履歴から話題と印象の両面において興味のある記事を推薦するシステムMPV-Plus やニュースサイトの記事群からニュース番組風のCG アニメーションを生成し,記事の印象に応じてキャラクタの声色等を変えるシステムwEE を開発してきた.しかしながら,これらのシステムでは記事の提示順序が記事の印象に及ぼす影響について何の考慮もしていなかった.そこで本稿では,大規模なアンケート調査を行い,記事を読む順番が記事から受ける印象にどのような影響を与えるのか分析する.具体的には,明るい記事,暗い記事,どちらでもない記事の3 種類の記事(各6 記事)を用意し,先行記事と後続記事の組み合わせ方(9 通り)によって後続記事の印象がどう変わるのかを調べる.
Keywords:印象マイニング,新聞記事,印象,閲覧順序,アンケート調査

質疑応答議事録
「アンケートの際,記事ペアの2番目に読んだ記事は,次の記事ペアの1番目の記事に影響を受けないのか?」という質問に対して,「記事ペアの順番をランダムにすることで影響を排除している.」という回答があった.次に,「インターネットアンケートの不真面目回答に対する対策はとったのか?」という質問に対して「今回はとっていない.どこまでが真面目でどこまでが不真面目かを判断できるようなアンケートではない.」という回答があった.さらに,「記事を読んだときの本人の機嫌や興味に印象が影響を受けないのか?」という質問に対して「悲しい記事を読んだときに悲しいと感じる人もあるし,そう感じない人もいる.そこはもっと深い解析が必要.この辺りは,パーソナライズに利用できると考えている」との回答があった.また,「どのようなサービスに使えるのか?」という質問に対して「ユーザに連続してニュース記事を推薦するという場合に使える」との回答があった.
26. ユーザのWeb閲覧パターンに基づくコンテンツ提示制御
 ○大野木 碧・山田 直治・礒田 佳徳・倉掛 正治(NTTドコモ)
概要
近年,Web上の広告コンテンツの受容性を高める取り組みとして,ユーザのWeb閲覧履歴やインターネット上での購買履歴を分析し,ユーザの趣味嗜好に合わせた広告を表示するサービスが普及している.このような広告コンテンツの受容性を高める取り組みは,近年の携帯電話によるインターネット利用の爆発的な増加により, PCだけでなく,携帯電話用のWebページでも広く行われている.携帯電話ユーザに対するWeb広告の受容性を高めるためには,ユーザの趣味嗜好だけでなく,ユーザの置かれている状況を考慮することが重要である.従来より,センサ情報からユーザの状況を詳細に推定し,コンテンツのPush配信制御を行う研究が広く行われているが,Web上の広告コンテンツにおいても同様に,ユーザ状況を考慮した提示制御を行う必要がある.そこで我々は,携帯電話のWeb上の広告コンテンツを対象とした.Web閲覧パターンからユーザのWeb閲覧目的をユーザの状況として推定し,広告コンテンツの提示制御を行う方法を提案する.
Keywords:Webアクセスログ,頻出パターン,シーケンシャルパターンマイニング

質疑応答議事録
「評価実験用のインターフェースにSolutionやCrawlingを示す表示がないが,どのように評価者は理解したのか?」という質問に対して「画面には表示しなかったが,それぞれの意味を評価者に理解してもらった」との回答があった.また,「端末は何を使ったのか?」という質問に対して「評価者自身の端末を用いた」との回答があった.さらに,「閲覧パターンの推定は,モバイルに特化したものなのか,Webにも適用できるものなのか?」という質問に対して,「モバイルに特化している方法である.Webでは未知情報の検索が多いと思うので,これらは閲覧パターンから推定するのが難しい.モバイルではcrawlingとsolutionが多いので閲覧パターンから推定することが可能.」との回答があった.また,「モバイルで,広告を見る人はどのような人なのか?」との質問に対して「例えば,Google Adsenseを見る人は絶対に見る.そのときには広告として認識していない.ユーザは現在のほしいものにマッチしてれば広告であろうがなかろうが見るはず.」との回答があった.また,「未知情報の検索では広告の受容性が低い結果になっているが,これは調べたい内容に依存すると思う.今回のような分類軸を選択した根拠は何かあるのか?重要なことは購買意欲があって検索しているかであると思う」という質問に対して「今回は,モバイルのWebページの閲覧のログを観察して分類した.モバイルについては未知情報の検索の目的が少ないので,今回は一纏めにした」との回答があった.最後に,「Crawlingにおいては,実際にどのような広告を見せればいいと考えるか」という質問に対して「個人特化したものを出せればよいと考える.」との回答があった.
 
───────
運営委員会
───────
実行統括担当:大塚 真吾 (物質・材料研究機構)
プログラム担当:是津 耕司 (情報通信研究機構)
受付担当:笹嶋 宗彦 (大阪大学)
特別企画担当:土方 嘉徳 (大阪大学)


「これまでの活動」に戻る
 
本ページに関する問い合わせ
wi2−webmaster@mail,ieice.org