概要: 本稿ではデジタル文書では引用が容易であるという特徴を利用して,デジタル文書間の情報フローネットワーク構造を推定する手法を提案する.本手法では,データ集合中の任意の文書の組に対して文字$n$-gram類似度を計算し,内容の類似性と時刻から導かれる因果関係を用いて,情報フローネットワークを意味する有向ネットワークの構造を推定する.本手法を,実際に学生レポートの集合に適用して,情報フローネットワーク構造を推定する場合の類似度の妥当性を評価した。さらに,情報フローネットワーク構造を可視化し,学生レポート集合で引用がどのように行われたかを示した. Keywords: 類似度,n-gram,情報伝播,ネットワーク構造,デジタル文書 質疑応答議事録[ 「今回なぜ文字 n-gram 類似度,単語 n-gram 類似度,LCS 類似度, コサイン類似度の 4 種類の類似尺度を用いたのか? これらがこの研究の目的に適していたのか」という質問については, 「今回は類似研究で用いられていた類似尺度を実際に用いて評価するのが目的だったので, かならずしもすべてが適しているわけではない, 特に本研究では意味的な類似性ではなく, 文章の電子的な引用・コピーなどの形式的な類似性に着目しているのが特徴で, ブログのような統制されていない文書に適用するつもりなので, 文字 n-gram 類似度が適していた」という回答があった. また,「Web に適用した時にも文字 n-gram と単語 n-gram はあまり違いはないのか?」という質問に対しては, 「実際に試してみないとわからないが大きな違いはないように思う, それよりも他の処理で品詞情報を使いたいなど他の理由で選択することになるだろう」 という回答があった.
概要: 文書の共起関係から得られる共起グラフは、スモールワールド、スケールフリーネットワークなどのネットワーク特徴を持つことが知られている。本稿では、これらネットワーク特徴を示すパラメータ(次数、クラスタ係数、平均パス長など)に加え、新たに通過数パラメータを導入し、これらネットワークパラメータを包括的に利用することによりキーワードを抽出する手法を提案する。新聞の見出しと記事の関係を用いて、キーワードとなる語のネットワーク特徴のSVMによる機械学習を行い、さらにネットワークパラメータを用いた評価関数を設定した。従来の類似手法と本手法の比較実験を行い、従来手法に対する本手法の優位性を示す。また、共起語ネットワーク特徴が言語や文書の種類に依存しないことを実験により示し、ある学習モデルが他言語、他文書種に適用可能であることを示す。 Keywords: 共起語ネットワーク、キーワード抽出、スモールワールド、スケールフリーネットワーク、クロスリンガル、サポートベクターマシン 質疑応答議事録 PASSとbetweennessの違いは何かという質問に対しては,PASSはパラメータは同じだが正規化されていないという回答があった.また,SVM+NP評価関数を分けているが,ロジスティック関数を使うとまとめて行えるのではないかという指摘があった.見出しをPostive/Negativeとして使用しているが,記事の特徴によって異なるのではないかという質問に対しては,確かにブログなどではきちんとした見出しが付けられていない場合があり,現在それらはノイズとして削除しているという回答があった.また,本文中に重要語があるパターンもあるというコメントや,新聞記事にあるキーワードを使って評価するのはどうかというコメントもあった.ニュース記事に比べ,価格コムの見出しのノイズは大きいと考えられるが,それはどの程度だったのかという質問については,日本語記事は約6-7割が有効だったのに対し,価格コムと英語記事は約半分程度だったという回答があった.NP評価関数の各係数の範囲について質問があったが,出現頻度や平均パス長の範囲が-5から5程度でばらつきがあり,他は1から2程度であるという回答があった.
概要: 大学における履修講義の選択は,シラバスによって提供される講義内容や必修・選択の区分,開講時期に加えて,学生間の口コミなどによる情報に基づいて決定するのが一般的である.本稿では,教員側からトップダウンに与えられる前者の情報と,学生によるボトムアップな情報を統合した講義選択支援システムを提案する.具体的には,シラバスのコンテンツによるテキスト分類に加えて,利用者である学生自身が付加する「講義を抽象するソーシャルタグ」と「関連の深い講義間のソーシャルリンク」を用いて科目間の関係性を抽出し,学生に提示する.また,今後の実証実験に向けて本システムを評価するための方法についても議論する. Keywords: 講義選択支援, ソーシャルブックマーク, ソーシャルリンキング, コミュニティ 質疑応答議事録 リンキングの利点は何かという質問に対して,今まで受けた講義を思い出すのに役に立つという回答があった.また,タグに比べてリンクが少ないので,もっと利点がないといけないのではないかという指摘があった.教員がシラバス登録時に,関係のある科目などを入力させるようにして,その結果との比較をすると良いのではないかというコメントもあった.また会場より,シラバスを学生側から見るというのは面白いが,匿名で行うとコメントが適当なことが多いという質問があったが,現在は半匿名性であり,ネガティブな情報ばかりにはならないと考えているという回答があった.関係のあるタグが多かったとあるが,事前にタグ付けの意図を被験者に説明したのかという質問については,キーワードを入力するという程度しか説明していないが,サンプルのタグとして入力例が提示されていたので,それを参考に付けた人が多かったのではないかという回答があった.また,どういう研究室でどういう研究をしたかまでわかると学生にとって便利なのではないかというコメントがあった.データは今年一年分なのかという質問については,シラバスは今年度で,タグは2週間程度でつけたものであるという回答があった.それに対して,毎年積み重ねることで,年度毎の違いなどもでてくると面白いというコメントがあった.
概要: World Wide Webや社会ネットワーク,タンパク質の相互作用といった複雑ネットワークに対する研究が増えており,スケールフリー性やスモールワールド現象,クラスター性などの性質が発見されている.近年では,複雑ネットワーク内のコミュニティ構造とその発見手法が注目されている.コミュニティとは,ネットワーク内で密に繋がったノードの集合であり,World Wide Webではあるトピックに関するページ群,社会ネットワークでは同じ職場内のグループなどに相当する.コミュニティを発見することは,複雑ネットワークを理解するうえで重要な性質であると考えられている.本稿では,コミュニティ発見のためのフレームワークを提案する.このフレームワークは交グラフの概念とネットワーク内の意味的な情報の類似度を利用する.実験においてこのフレームワークに基づく手法を実装し,現実上の社会ネットワークに適用する. Keywords: 複雑ネットワーク,コミュニティ発見問題,フレームワーク,テキストマイニング,交グラフ 質疑応答議事録 会場より,手法を適用できない場合に,クラスタができるかどうかを分析する前にわからないのかという質問があったが,元のネットワークから交グラフを作る段階でわかると考えているという回答があった.また,存在しているリンクを切ることでクラスタを作れるのではというコメントがあった.交グラフを作り,それをさらにクラスタリングということなので,凝縮されたものができやすいが,単純に元のデータをクラスタリングしたものとの比較はしているのかという質問に対しては,今後元ネットワークからファジーを利用して抽出する方法との比較をするつもりであるという回答があった.エッジの重みの値について質問があったが,値はほとんどは0-1の間だが,たまにsimilarityが1に近いと10-100になり,そこがエッジになるという回答があった.また,クリークコミュニティを発見するCFinderとの違いは何かという質問があったが,ベースラインとして用いたシステムが少し異なるという回答があった.
概要: 現在,インターネット上に存在するショッピングサイトの多くが商品の検索方法としてキーワード検索やカテゴリー検索を採用している.しかし,膨大な量の商品から希望の商品の適切なキーワードを推測することは容易ではなく複数回キーワードを変更して再検索することが多々あり,さらに様々なカテゴリー中から希望する商品のカテゴリーを選択することも容易ではない.したがって,本研究ではキーワードを用いた検索ではなく自然言語文を用いた入力からマッチする商品を検索する商品推薦システムを提案する.また,本稿ではまずユーザのある特定の状況を想定し,推薦対象商品を衣服とした目的指向衣服推薦システムを試作し,本システムの有効性を確かめる. Keywords: 推薦システム,検索 質疑応答議事録 聴講者より,推薦画面で工夫した点,および商品単体の提示方法についての質問があり,発表者よりアバター像で推薦商品(シャツ,ジャケット,ズボン)の組合せを確認できること,商品単体はウィンドウ右側に商品毎に提示されるとの回答があった.また,自然言語入力を採用しているが,現状ではユーザにとってかえって不親切ではとの指摘があり,発表者より,他の質問入力方法も検討しているとの回答があった.同一イベントであってもフォーマル度に多様性があるのではないかとの指摘については,今後被験者実験によりフォーマル度についての一般常識的なものを整理していくこと,詳細な状況を入力できるような質問入力手法を検討することが必要との回答があった.
概要: 近年,インターネットに接続可能な携帯端末が増加傾向にあり, いつでも,どこでも, 自由にグルメ情報や店舗情報などの地域情報を手軽に取得することが可能になった. しかし,地域情報を配信する多くのサイトでは, ユーザの現在地付近にある情報を表示するだけであり, ユーザの嗜好にあった情報が提供されない. そこで本研究では,ユーザの嗜好や現在地にあった地域情報を絞り込むため, ユーザの行動履歴と嗜好情報を利用してユーザに対する地域情報の重要度を求め, ユーザに適した有益な地域情報を推薦する手法を提案する. また,GPS機能を用いた携帯端末用地域情報配信システムの構築を行い, 提案手法の有効性を確認した. Keywords: 携帯電話,GPS,地域情報,行動履歴,情報推薦 質疑応答議事録 聴講者より,ユーザの興味を表すカテゴリ数を3にしたり,2カテゴリ以上一致で類似と判定すると決めた理由について質問があり,発表者より,被験者数が少なくデータがスパースなためその様な設定にしたが,被験者数が増えればもっと良い方法があるかもしれないとの回答があった.距離による重みの求め方についても質問があり,発表者より,GPSの誤差を考慮した定義になっているとの説明があった.また,飲食店の推薦だけなら行動履歴を使う必要性はないのではないかとの指摘があり,これについては今後は他の推薦目的も考慮していく予定であるとの回答があった.
概要: 行動履歴を利用して利便性を向上させるサービスが増加し, 様々な情報がデジタルデータとして保存されている. しかしながら,それぞれのサービス間で、行動履歴の共有化はされていない. 私たちはプロファイルパスポートという行動履歴データベースを提案し, 行動履歴の共有化と, そのデータベースを利用したサービス・事業の開発に取り組んでいる. 本稿では,プロファイルパスポート事業におけるモデルサービスの概要や内包する課題と展望について報告する. Keywords: レコメンデーション,ライフログ,行動履歴, コンテキストアウェアネス,情報大航海プロジェクト 質疑応答議事録 聴講者より,プロファイル情報を統合して管理する場合の個人情報保護の問題や,個人情報の収集法法について質問があり,発表者より,配信パートナーがすでに持っている情報を提供してもらうことを想定しているとの回答があった.また,個人情報収集時に,広告配信などを目的として他の関連団体に提供する事についての許可を得ている場合が多いので,法的な問題はないと考えていること,プロファイルパスポートを利用する際にもその都度ユーザから許可を得なくてはいけないようにすることを想定しているとの回答があった.プロファイルパスポートは静的な印象を受けるが状況に応じたサービスは可能であるか(考慮しているか)との質問に対しては,リアルタイムなコンテキスト情報よりも,ストックされた情報に焦点を当てているとの回答があった.
概要: 現在,Web上には個人の発信する情報がブログや掲示板上に多く存在している.特にブログは簡単な操作でWeb上に情報を発信できるシステムであるため,その数は急速に増加している.また,ブログは世の中の関心をリアルタイムに反映するメディアとして注目を集めている.本研究ではブログ上で話題になっているワードを収集し、ユーザに提示するシステムを構築する.そして、ユーザのアクセス履歴を利用して、ユーザの嗜好に合わせた情報を推薦する手法を提案し,実験により手法の有効性を評価した. Keywords: トレンドワード抽出,アクセス履歴,情報推薦,ブログ 質疑応答議事録 聴講者より,トレンドは新しさが重要であり,blog記事からキーワードを抽出し,さらにユーザに提示した後のアクセス履歴に基づいて推薦するのではタイムラグが発生しないのか,との質問があり,発表者より,タイムラグがあったとしても1,2日程度なので問題ないと考えている旨回答があった.また,多数の人が見たものを推薦してもトレンド情報として無益では,との指摘に対しては,本人がアクセスしたもの以外を推薦するので,本にとって新しい情報であれば有益と考えているとの回答があった.さらに,統計的手法に十分な量の情報が得られた後では,みんなが知っている情報しか出てこないおそれがあること,適切な評価のためには目的・コンセプトの整理が重要であるなどのコメントがあった.
概要: 近年,個人が収集したコンテンツを共有し, 共同で組織化するSocial Taggingが注目を集めている. Social Taggingでは,利用者が付与するタグと呼ばれる自由なキーワードを介してコンテンツがネットワークを形成し組織化されるが,このコンテンツ間のつながりは付与されたタグの一致によるものであり,必ずしも意味的な関係性があるとは限らない. そこで我々は,コンテンツ間の関係性を利用者が判断して明示的にリンクを付与することでコンテンツを組織化するSocial Linking を提案し,Social LinkingとSocial Tagging の比較実験を行った. 本稿では,実験によって形成された授業科目ネットワークの分析を通じ,Social Linking で形成されるコンテンツネットワークの構造の特徴を考察し,その応用可能性を示した. Keywords: Social Linking,Social Tagging,コミュニティ,ネットワーク分析 質疑応答議事録 聴講者より,実際の履修における共起関係から得られるネットワークとの比較について質問があり,発表者より,今後行う予定であるとの回答があった.学生による評価と,科目の履修状況の間に関連はあるか,との質問に対しては,次数中心性と履修者数の間には必ずしも対応がなかったとの回答があった.また,カリキュラムに現れない科目間の関係が観測された以外に,予期していなかった関連の発見はあったかとの質問に対しては,今のところ観測されていないとの回答があり,これに対して担当教員による関連なども見えてくると面白いとのコメントがあった.
概要: 商品に関する評判情報を含んだブログ文書の集合の中から,関連して話題になっている他の商品を連想トピックとして抽出するためのアルゴリズムを提案する.ブログ読者の印象はブログ文書の支持率に左右されるという仮説に基づき,ブログ文書間の相関関係を利用して各トピックの出現頻度と文書頻度に対する重み付けを行う.さらに,トピック抽出の過程で商品オントロジを参照することにより,指定商品と近い商品分野の商品名だけを分析の対象とする.提案法により重み付けされた連想スコアが,TF-IDFと比較して,ブログ読者の印象をよく再現していることを,評価実験により確認する. Keywords: CGM, 評判分析,連想トピック,オントロジ 質疑応答議事録 ブログではなく掲示板を用いていることに関する妥当性についての質問があり,ブログの中には価格情報しかないような記事や転記しただけの記事もあってそれらを除外する前処理をやってるが、実験に前処理を含めると提案手法と前処理のどちらが効いているのかわからなくなるため、今回は掲示板を用いた、との回答があった。また、掲示板ではリンク構造がないため、引用関係をみて独自に解釈したとの説明があった。オントロジ構築の詳細に関して質問があり、Web等から収集し人手で編集しており、インスタンスとしては約40万件程度、構築コストは1ジャンルあたり2人月程度(収集1人月、構築1人月)であるとの回答があった。オントロジを用いたジャンル判定の効果について質問があり、自動車以外の商品名はほとんど無かった(のでャンル判定が不要で実験結果に反映されていない)との回答があった。本実験ではアルゴリズムの3(文書頻度による重み付け)が効いているのではないか、という指摘については、掲示板を解析して擬似的にリンク付けしてるので2(文書間の相互関係によるトピックの重要さの重み付け)も同様に効いているだろう、との回答があった。
概要: 従来の協調フィルタリングによる推薦方法は,推薦の精度を向上させることに重点を置いて開発されてきた.そのため,すでに知っているアイテムが多く推薦されるという問題があった.この推薦は,好みのアイテムをリストアップしてもらうことだけを考えたときには良い推薦と言えるが,ユーザの満足度を考えたときには発見性の欠如のために必ずしも良い推薦とは言えない.本研究では,ユーザがどのようなアイテムを知っているかという観点でのユーザ間,アイテム間の類似度を計算し,ユーザが知らないであろうアイテムを推測する.この方法と従来の嗜好に基づく協調フィルタリングを組み合わせることで,ユーザが知らない好みと思われるアイテムを推薦する. Keywords: 協調フィルタリング,発見性,novelty,既知・不既知のプロファイル 質疑応答議事録 「ノベルティ」「発見性」と比べての「意外性」の意味について質問があり、意外性は推薦の傾向が予測できるかどうかではなく、一般傾向としての指標だとの説明があった。知らないものに対して評価をつけるというシチュエーションの是非についての質問があり、推薦システムではじめて見て、知らなかったけど好きだ、という状況を考えている、との回答があった。データ数の妥当性についての質問に対して、本研究で用いた実際データセットは少なく、また評価データもたくさん与えられているので実際とは違うが、量の妥当性については大規模データに適用してみないとわからない、との回答があった。 本研究では「知っている」「知らない」の評価を0/1ではなく連続値にしてはどうか、という指摘については、現状でもデータ取る段階で単純な0/1ではなく「曲名だけは知ってる」「聞いたことある」というように尋ねており、今回は曲名を知っているかどうかで区別したとの回答があった。これに対して、実際のショッピングの場面では「持っている」「持っていない」の違いは大きいと思われるので、それを考慮したほうがよいのではないか、というコメントがされた。
概要 近年,まとまった数の社会人が大学教育現場に院生として戻ってくるようになった. そこでは,多忙な彼らのために情報的・機械的なサポートが求められている. しかしながら,どのようにサポートをすればよいのかということについては, 学術的な蓄積が少ない現状がある. そこで本研究では,MOT(Management of Technology) の研究指導現場に調査に入り,そこで得た対話ログ分析と文献調査から, 通常の学生指導との違いを述べた上で, どのような情報のやり取りが行われているのかを分析した. さらに,情報共有が上手く行かない原因について, 文献レビューをもとに考察を行った. Keywords: 情報共有化プロセス,研究指導,遠隔会議システム,社会人学生 質疑応答議事録 聴講者より「従来研究の具体的事例として MOT の場面を適用して実際に利用 できるモノを作っていこうとしているのか,こうした事例を通して新しい研究 を行おうとしているのかを教えていただきたい」という質問があったが,それ に対して発表者からは「知識の伝達をサポートするためのシステム,人間の質 的な能力を兼ね備えたシステムの開発が根底にあるため,回答としてはその両 方を狙っている」との回答があった.さらに同じ聴講者より「そういうことで あれば,遠隔地でゼミ指導をしたいという話と,暗黙知を組織だってうまく体 系立てる話は,本質的に別次元の話,つまりプロセスの話をしたいのかインタ フェースの話をしたいのかよくわからない」という指摘があったが「遠隔地で ゼミ指導をすることによって利用させるシステムに,知識の伝達をサポートさ せることを考えている」という回答がなされた.さらに別の聴講者より「今回 のご発表は社会人学生の知識を教員側が共有する話だと理解したが,その逆も 必要ではないか,また,ケーススタディをどんどんと取り入れる必要があるの ではないか」という指摘があったが,発表者は「教員と社会人学生の考え方, 研究に対する認識の違いがこうしたすれ違いを生んでいるため,そうしたこと は確かに考えていかねばならないし,また,さまざまなケーススタディを元に 取り入れるのは確かなのだが,そうした環境が整っていないのも確かなので, 社会制度的な何かを考えていかねばならない」という回答がなされた. さらに別の聴講者より「データをとるだけのシステムは意味がないので,その 分析は重要だと思うが,分析の観点をどのように設定するか,またそれらをど う整理するのか,さらには学生へのフィードバックをどのように行うかを考え る必要があることも重要ではないか」という意見がなされたが,発表者からは 「分析方法の妥当性を議論する必要性があるのは確かである.その上で知識の やりとりをしているのか,単に情報のやりとりをしているのかを含めてコン ピュータ上でどのようにシステムとして実現していくのかを考えていく必要が ある.また学生へのフィードバックに関してはこうした関連研究が少ないので データとしてとって現状を把握し,そこからアクションプランを考えた上で 実現しないと説得力がないため現状ではしていない」という回答がなされた.
概要 アンケート回収率向上のため,簡易的で回答しやすい質問から多くのデータを回収することを試みた.選択型アンケートで得られるYes/Noデータから選択順位を推定したり,最終的な決断に至るまでの意思決定プロセスを,マウスの軌跡を用いて分析した.また,マウスの動きと意思決定時の心理状態との関連性を検討するため,視線追跡機を併用して視線とマウスの動きの関連性について検討した. Keywords: AJAX, マウス, アンケート,情報可視化,視線 質疑応答議事録 発表者希望せず.
概要 本研究では,「自己を取り巻く環境・知識を自己の身体や心理と関連づけて言葉にするというメタ認知的言語化が,個人生活における内なる価値創造を促す実践的指針である」仮説を設定し,その妥当性を検証するための試みとして.ブログベースのキャリアデザイン支援システムを利用した就職活動におけるメタ認知的言語化の実践プロセスを観察,分析した.本稿ではこの分析によって得られた知見を紹介し,個人生活におけるメタ認知的言語化による内なる価値創造の可能性について議論する.また,そこでのWebインタラクションの有用性についても考察する. Keywords: メタ認知, 価値創造 質疑応答議事録 発表者の都合によりキャンセル.
概要 ウェブ閲覧におけるユーザビリティ問題を特定し,その重大度を途中ページにおけるリンク選択数により評価する方法として,ウェブ認知ウォークスルー(CWW)がある.本研究では,CWWに利用される日本語LSA意味空間を新たに構築し,階層メニューを利用して記事の探索を行うことができるオンライン百科事典のユーザビリティ評価を行った.32のリンク選択予測値を,18名の参加者を得て実施した実験結果と比較した.予測値と観測値の間の一致率は低く,CWWのユーザビリティ問題特定基準を見直して適用すると多少改善した.問題が大きいと評価するほど誤差が大きくなる傾向が示され,日本語サイトで階層メニューを持つユーザビリティ評価の信頼度を高めるためには,CWWのユーザビリティ問題特定基準の改良,日本語LSA意味空間の整備が必要であることが示唆された. Keywords: 情報香,潜在意味解析(LSA: Latent Semantic Analysis),階層的情報構造,ウェブユーザビリティ評価法 質疑応答議事録 聴講者より「ウェブページを評価するような研究では, どのような利用者を対象とするのがよいのか教えていただきたい. ウェブページに関して明るい人なのか,全く無知な人なのか」 という質問がなされた. これに対して発表者は「クリック操作ができないような初心者ではなく, まずは操作には問題がなく,ページの内容が理解できる人を対象として, その後,初心者や子ども,高齢者などに広げていくのがよいのではないか」 という回答を行った. また別の聴講者からは「ご提案の手法を例えば Yahoo! のホームページなどに適用が可能なのか, つまりはご提案の手法はどういったサイトだと適用ができないのか, その限界点を知りたい」という質問がなされ, 「現時点では手作業に近い形で階層メニューを評価しているので, 大規模で複雑なサイトに適用するのは難しいが, 将来的にはマシンベースで客観的評価がおこなえる可能性があるのではないか」 という回答がなされた.
概要 近年,ブログや SNS 等の CGM と呼ばれるコンテンツが数多く配信されるようになり,これらに対する検索要求も高まっている.本研究では,ブロガーが過去に投稿したエントリに含まれるキーワードの頻度から,そのキーワードが表す話題に対するブロガーのマニア度を算出し,これに基づいてブログエントリのランキングを算出しようとするマニア指向ブログランキング方式を提案し,その実装システムのイメージを示す.本手法は単にランキングの尺度を与えるのみならず,ある話題に対して視点が異なるエントリの呈示が可能になると考えている.なお,今後の研究の方向性についても述べる. Keywords: ブログ検索,ランキング,Webマイニング,マニア指向 質疑応答議事録 マニア指向のランキングをどのような基準で出力するのかといった質問に対して、記事数を基準にして出力しているとの回答がなされた。また、本質問に関連して、記事数だけではスパムの影響でランキングが上位となる可能性もあるので、共起関係も見たほうがよいのではないかとのコメントがなされた。一方、記事数が少ないようなコミュニティの場合、発見すること自体が困難であるため、手動でコミュニティを追加した方がよいのではないかとの質問がなされ、できるだけ機械的に実施したいが、手動でも追加できるようにしたいとの回答がなされた。この他、KnowWho検索の分野で研究がなされている記載内容の深さに基づいた情報も、ランキングの決定に利用できるのではないかとの質問がなされ、参考にしたいが、新鮮さが大事であるため、できるだけ処理を軽くしたいとの回答がなされた。
概要 本論文は参考論文「2」に提案した画像多意味を反映する画像表現schemeに基づく画像・ビデオ検索システムのarchitectureを提出し,ウェブ上で実装した.本システムではコンテンツによる個人類似度判定基準のずれを考慮し,ユーザからの基準調整を導入した.実際にシステムを使ったユーザからのアンケート調査結果は本論文で提案した方法の有効性を示した. Keywords: 画像意味表現,画像・ビデオ検索,個人類似度判定基準,性能評価
概要 近年,情報検索システムの性能向上を目的とした自然言語処理の技術であるテキストマイニングが注目を集めている.情報検索システムの問題点として,ページ上の表記の揺れや類義語等の存在が挙げられ,利用者の入力する検索質問中の表現とWeb中の文書に実際に表記されている表現との相違が検索効率に影響を与える.そこで本稿では,情報検索の際に必要な同義語辞書を文書群から自動的に構築することを目的とする.具体的には係り受け関係を用いて同義関係である単語対を作成し,係り受け回数と共通の要素数を用いて単語間の類似度を計算する. Keywords: テキストマイニング,同義語,係り受け関係
概要 YouTube やニコニコ動画をはじめとした動画関連サイトが人気であるが,テレビや映画,音楽 PV などのコンテンツが主な閲覧対象となっており,一般ユーザが創作した動画はまだまだ少ない.一方ブログでは,一般ユーザが書いたエントリーも多く,中にはプロ顔負けの面白いコンテンツもある.ユーザによる質の高いコンテンツ制作が自然なことになりつつある中で,この流れは動画に対しても言えると思われるのだが,動画はブログに比べて圧倒的に少ない.その主たる理由を,制作に対する敷居の高さだと考え,誰もが簡単に動画を作成できる環境を提供することを試みる.初期試作として,ブロガーの持つ「文を書く」という技術に注目し,文章から動画作成を試みる「さしえショー」を提案する. Keywords: 動画,スライドショー,オーサリングツール 質疑応答議事録 課題として画像抽出精度の向上が挙げられているが、精度が高すぎると面白さが失われてしまうのではないかとの質問がなされ、現状誤った画像を抽出する割合が高すぎるので、時々誤った画像を抽出するレベルにまで、抽出精度を高めたいとの回答がなされた。また、画像の選択をしているのかとの質問がなされ、現状実施していないとの回答がなされた。この他、 音楽を流している際に、そのメタデータに対応してキャプションを付けるとおもしろいのではないか、文章中の改行などに基づいて動画表示のテンポを作るとよいのではないか、動画を適切にセグメンテーションできればコンテンツの量を確保できるのではないかとのコメントがなされた。
概要 近年,多くの高機能なWebアプリケーションがサービス提供を始めている.こうしたWebアプリケーションでは,サービス提供の為にユーザデータを収集しているが,どんなデータが収集されているのかユーザには知らされないことも多い.また収集したデータの管理をユーザが行うことができないことも多い.そのため,Webアプリケーションにおいてユーザプライバシが守られているとは言い難い側面もある.そこで,Webアプリケーションが収集しているデータを可視化し,必要に応じてコントロールを行うことのできる環境を提案する.加えて,Webアプリケーションが表示するプライバシデータにも着目し,ユーザのコンテキストに合わせて表示,非表示をコントロールするための環境も提案する. Keywords: Webアプリケーション,可視化,プライバシコントロール 質疑応答議事録 Webアプリケーションにおけるデータを暗号化すればよいのではないかとの質問がなされ、暗号化が利用者に受け入れられるかどうかが未知数であるとの回答がなされた。また、置換した情報を復元できなくなるのではないかとの質問がなされ、アプリ側で復元のためのテーブルを持つか予め設定しておくことにより復元可能であるとの回答がなされた。また、現在のシステムでは上下関係が一意に決まることを仮定しているが、上下関係が一意に決まらない場合もあるのではないかとの質問がなされ、現状は一意に決まることを仮定しており、本仮定をはずすにはスケジューラーそのものを開発する必要があるとの回答がなされた。この他、システムの設計思想がやや明確になっていないので、整理した方がよいとのコメントがなされた。
概要 Webアノテーションを利用した情報共有システムにおいて,付与されたアノテーションを正しい位置に再現することができないために情報をきちんと共有ができないことがある.これは,BlogやWikiといったCMSの普及により,アノテーションの対象となるコンテンツが頻繁に更新され,対象の情報が付与時とは異なる位置に移動してしまうことが原因である.そこで,付与時に位置周辺情報を取得し使い正しい再現位置を特定する手法を用いたWebアノテーションを作成し,情報共有の評価実験を行った.本稿では位置取得方法と評価実験結果について述べる. Keywords: セマンティック・ウェブ,メタデータ,ブログ,XPath,Webアノテーション 質疑応答議事録 聴講者より,新しい情報ソースの発展が重要である.アノテーションを作るだけではなくアノテートされたものを他の人が見て自分の業務に役だてることがポイントの一つだと思うというコメントがあり,さらに,5ヶ月間の実験を行ってみてユーザの情報共有に役立ったのか?実感や感想があったら教えて欲しいなどの質問があった.これに対し発表者は,知識系のシステムではユーザ全体にに知識が行渡ったという実感を得ることはなかなか無いと思う.厳密にデータをとった訳ではないが,このアノテーションシステムを導入した当初は有名な記事だけにアノテーションが付いていて,だんだんと技術寄りの細かい記事などに対するアノテーションも多くなったという印象があるという回答がなされた.また同じ質問者から,他の人がつけたアノテーションを探す仕組みはあるのか?という質問があり,発表者から,アノテーションの一覧などを使って探せる仕組みは用意しているという回答があった. 他の聴講者より,アノテーションにはそれを付ける人の意思やコンテキストが反映されるため,他の人がそのアノテーションを見たときの評価が異なる場合や,間違ったアノテーションによってそのページに対する理解を妨げる可能性があるのでは?今回のシステムではコンテキストを書く枠組みが無い分,その修正に認知的負荷がかかってしまうのではないか?という指摘があり,これに対して発表者からは,現状はこのシステムを使っている所は部署という非常に限られた世界であるので,アノテーションを書いた人が分かりそのコンテキストを何となく理解することができる.ユーザが多くなった場合は何かテーマを設けてなければいけないという認識はある.「こうことをやったけどうまく行かなかった.」など簡単なアノテーションでも意味はあると思う.ある程度小さなコミュニティで使うのが理想的だと思うという回答がなされた.
概要 今日,WEBサイトを利用した商品購入が一般化している.WEBには膨大な商品数があり選択肢が極めて多い.反面,必要な商品を効率よく検索するには,知的な検索技術が必要となる.そこで,本研究では,中古車検索サイトをケーススタディとして,ユーザが直感的に選好した商品からデータマイング(判別分析およびラフ集合)を行い,ユーザの選好に影響する属性・属性値を推論し,その属性・属性値を含む商品を提示するシステムを開発することを目的とした.また,中古車検索サイトの推論エンジンを開発し,それぞれの推論結果を比較し,両手法による推論解の特徴比較を行った. Keywords: 判別分析,ラフ集合,中古車検索サイト,推論エンジン 質疑応答議事録 聴講者より,価格が説明変数の中に入っていないのか?という質問があり,今のところ入っていないという回答がなされた.また,価格で選ぶユーザもいるので,説明変数に価格を取り入れた方が良いと思う.提案手法では収束が早いという特徴があるが,これは欠点でもあり利点でもあるのでうまく生かして欲しいというコメントがあった. 他の聴講者より,検索システムとして見た場合,離散的な特徴や値とユーザからのフィードバックを使って,それらの値を変えていくという手法はレリバンスフィードバックの一形態だと思います.この手法は画像検索の分野でかなり研究がされているので一度調査された方が良いというコメントがあった. 聴講者より,このシステムでは否定的な検索は可能なのか?という質問があり,質問を組み合わせればできるとの回答があった. 聴講者より,もう少しインタラクションの部分を重視した方が良い.質問がころころ変わる場合を想定し方が良い.今のシステムでは表示までの計算時間がかかっているので,もう少し簡単な計算にしてユーザに素早く表示させるのも手だと思うというコメントがあった. 座長から,閾値などの決め方や計算量などについての質問があり,発表者からは閾値は今のところは暫定的に決めたものであり経験的に決めている.今後は最適な値を探し予定である.計算量は調べていないので今は分からないという回答がなされた. さらに座長から,色などは簡単に選べると思う.傾向があまり無いような組み合わせで検索をかけた場合は,その結果も傾向がバラバラになるのか?という質問があり,発表者からは判別分析の場合はバラバラになる可能性があるが,ラフ集合の場合はユーザが意識していない組み合わせをうまく出すことができると考えているという回答があった. また,検索結果の一覧がどういう基準で選ばれたのかその根拠をユーザに示しているのか?という質問があり,発表者から現在はインターフェースを作るところまで至っていないが,簡単な表示を行っているの回答があった. 聴講者より,説明変数の項目数の決め方についての質問があり,色々調べた結果であるという回答がなされた.
概要 本研究では,WEB上に存在しない貴重な情報の書込みを促す方法を質問生成の観点から検討する.具体的には,小樽市について,住民,観光客が望んでいる情報を収集,提供するために,SNSを構築して,ポイントカードシステムのポイント付与サービスを利用する. Keywords: 地域情報,情報創出,SNS,ポイントカード 質疑応答議事録 質問者より、提案手法が対象となるポイントカードのユーザのリテラシーを向上させることができるのかどうかについて質問があった。これに対して、近隣の観光客や若い利用者からコンテンツを集め、ポイントカードのユーザが参加しやすい環境を作ることが目的であるとの回答があった。他の質問者からは、地域SNSとポイントカードを組み合わせた例が他に存在するかどうかの質問があり、一般のコミュニティサイトでの投げ銭システムが近いとの回答があった。また、ポイントによる動機付けではなく、積極的なユーザの活動が他のユーザにも見える環境を作るのがよいのではないかというコメントがあった。
概要 イベント情報が共有され,ユーザ間やユーザと情報の間のインタラクションが積極的に行われることは,イベントを有意義なものにするために主催者・参加者双方にとって重要である.そこで本論文では,ユーザがイベント情報を登録・再利用・再発信したり,情報を付加したりできるプラットフォームを設計・実装し,そこでイベント情報そのものやイベントに勧誘するユーザを適切に推薦することによってインタラクションを活性化させることを試みた.推薦の際には,それまでのインタラクションを重み付き有向グラフの形で蓄積したデータを用い,そこからユーザや情報の間の間接的な関連性を推量するアルゴリズムを用いた. Keywords: インタラクションネットワーク,情報推薦,イベント情報,価値共創 質疑応答議事録 質問者より、パスの重みの範囲に関する確認があり、重みは0から1の間の連続値であるとの回答があった。また、提案手法が想定するイベントの総数は1000程度であるとの質疑があった。知人関係にないユーザからの推薦があり得るのかについては、間接的なつながりも反映されるが、アルゴリズム上そのようなユーザの重みは相対的に小さくなるとの回答であった。他の聴講者からは、大きな組織において、既存のグループの枠組みをこえたつながりを作るための支援を求めるコメントや、システムからの推薦と勧誘による推薦の違いを見たいというコメントがあった。
概要 記事要約のように短い文章群については,本来,内容が重なる記事同士であっ ても,まったく同じ語が出現する可能性が低いためうまくクラスタリングでき ないことがある.本研究ではWikipediaのページ間のリンクを,ページの見出 し語間の関係と捉え,記事要約の持つ特徴を変えることなく記事間の関連性を 計算する手法を提案する.そうすることで、表現の異なる語同士であっても, 関連性のあると判断される語同士であれば,それらのTFIDF値を用いて,記事 間の関連性を高めることができる.そして最後に,提案手法と従来の手法とを 比較ため,文書クラスタリングによる実験し,結果の考察を行った. Keywords: クラスタリング,ウィキペディア,RSS,TFIDF,ベクトル空間モデル 質疑応答議事録 聴講者より、EPG(番組表)を対象とした研究での知見が紹介され、概念の上位・下位関係を利用することで精度を上げることができるのではないかとのアドバイスがあった。また、提案手法と他のクラスタリング手法との比較が必要ではないかとの指摘があった。
現在,SNS(Social Networking Service)やソーシャルブックマークなどのサービスが,ユーザ参加型のアーキテクチャとして注目されている.そのようなアーキテクチャで利用されるフォークソノミーとは,ユーザ自身がコンテンツに対して感じたまま分類していく手法である.そこで,ニュースサイトのコンテンツに対するフォークソノミーによるタグ付けに注目して,ソーシャルニュースサイトにおけるニュース記事推薦システムを提案する. Keywords: ソーシャルニュースサイト,フォークソノミー,推薦,タグ 質疑応答議事録 論文とデータが異なっている点について指摘があり、被験者を増やした結果とのことであった。また、比較手法としてベクトル空間モデルを使うべきではないか、対象を限定して精度・再現率・f値を出すべきではないかとのコメントがあった。今後の課題についての質問に対しては、ユーザの興味にあったカテゴリ分類を行えるようにしたいとのことであった。