概要 GoromiはWeb上の情報に対するインタフェースである.ほとんどの検索エンジンは検索結果をリストとして表示し,ユーザはそこからページを選んでブラウザで表示する.GoromiはWeb上の情報をより直感的な方法で提示する.検索結果より抽出された関連キーワードを表示するとともに,検索結果中のページタイトル,ページに存在する写真を表示する.これらの情報を見ることにより,ユーザは文字通り情報を「ブラウズ」することが可能となる.実際に使用した結果,Goromiを用いることによってユーザが当初意図しなかった情報を発見し,新しい方向に情報探索を行っていく現象が観察された.このことより,このシステムはWeb 上の情報発見ツールとして役立つのではないかと考えている. Keywords: GUI Web ブラウズ 質疑応答議事録 会場より,Memoriumのような二次元ではなく一次元を選択した理由は何かという質問があり,ランダムに二次元上に出されると目で追えないが,一次元だと可能という回答があった.それに対し,キーワードと検索結果の表示が分離していることがデメリットではないかという指摘があった.会場から,表示されたキーワードが間違っている際にユーザがシステムに教えられるのかという質問がでた.機構的には可能だが,怠けたユーザを想定しているので,なるべくユーザに能動的に行わせたくないという回答であった.それに対し,検索結果は能動的に行わなければならないので辛いという質問があった.回答は,当初は文章がもっと多かったが,指摘の通りだったので,写真とタイトルまでになった.これだけならなんとなくわかるようになるとのことだった.会場から,画像の類似検索も考えているのかという質問があり,画像の類似検索は処理時間がかかるが,このインタフェースは速い処理をすることも重要なので,難しいとの回答があった.順序をGoogleにまかせるのではなくて,わかりやすい情報から提示するほうがよいという質問については,詳細が知りたいとき(明示的にクリックしたときなど)は,情報になるページを上に,それ以外のときは適当に,という両方が必要だという回答があった.魅力的な画像と文がうまく重なっていないとキーワードに惹かれないのではという質問については,キーワードの意外性に興味を持つと考えており,ありきたりな単語とそうでない単語を適当に混ぜて試したが,ある程度はうまくいくという回答があった.また,固有名詞はまだ試していないという回答だった.会場から,キーワード入力もしたくないのではないかという質問があったが,二桁の数字をランダムに生成して適当に開始するという回答だった.ユーザのプロファイル,検索履歴などをキーワードにしたらどうかというコメントもあった.
概要 ナレッジマネジメントにおける代表的手法として SECIモデルがある.しかし,SECIモデルは人の知識創造のプロセスを一般的にモデル 化したもので,計算機を用いた支援を試みようとすれば,問題をある程度定式化する 必要がある.本研究では,二人のユーザが議論を行い分類型知識を獲得することを支 援する手法を提案する.具体的には,獲得する知識をIF THENルールで表すことと し,事例から帰納学習して得られた知識と二人のユーザの経験的な知識の3者間で矛 盾や相違を検出し,それに基づき知識を改善するための論点を提示する.専門領域と して垂水一文字におけるグレ釣りを取り上げ,具体例を基に説明する. Keywords: SECIモデル,グループ知識獲得,不都合,議論,論点提示 質疑応答議事録 暗黙値は経験によって異なるが,この研究では上級者のみとなっている.違ったレベルの知識の人が入ってきたときに議論ができるのかという質問について,レベルが違うと一方的に教えることになるために通常の議論でもうまくいかないという回答があった.暗黙値は形式化しにくいものがあるが,どこまで行うのかという質問には,実際に海の色や雰囲気など言葉にできないものがあるとの回答だった.選択できる属性が前もって決まっているが,ない属性を作りたいという要求はなかったのかという質問では,わかっている人が最初に属性を用意するからうまくいっており,他ドメインに適用するときにはドメイン毎に用意する必要があるとの回答だった.最終結果が,0/1ではなく何%になるのではないかという質問は,本来はそうだが,今回は経験的に何匹以上釣れるなら釣れる,というような制約を設けているとの回答があった.ルールには信頼度があるはずで,それがコンフリクトの検出に使えるのではないかという質問には,関連研究のKAISERでは信頼度を使っているとの回答があった.
概要 本稿は,情報検索を「魚釣り」に対応させることにより曖昧な要求に対する柔軟な検索作業を実現する手法について述べる.通常の情報検索システムは目的が明確な場合には即座に良好な結果を生成するが,そうでない場合にはあまり有効ではない.なぜなら,曖昧な要求に対して必要となるのは「正確な検索」ではなく,ユーザの思考を補完するようなシステムだからである.本手法では,検索キーワードを「餌」,情報を「魚」に見立て,人工生命的な規則に基づき自律的に動作させることにより,(1)要求の曖昧性を検索結果の流動性や確率性に反映させて多様で示唆に富む情報を提供する,(2)長時間の繰り返し作業を精神的に支持するために娯楽性を提供する,等の効果の実現を図った.また,上記の点についてユーザテストを行い,その結果に基づき本手法に求められる機能について検討した. Keywords: 情報検索,GUI,インタラクション,曖昧性 質疑応答議事録 会場から,被験者に与えられたテーマの決め方についての質問があり,Googleでの結果の総数が同じくらいのキーワードを対象として,被験者がCS学生ということと開発者の趣味で選択したという回答だった.テーマに関連したものであれば全て正解なのかという質問には,各々の文書が正解かどうかは考えず,被験者が関連すると思ったら良いということにしたという回答があった.システムの目的は継続的検索の支援だが,実験にそれが現れていないという質問については,これは予備的な実験で,創造的な仕事をするためにはバリエーションを多く出したほうが良いという観点から,多くの情報が出てくるかどうかを評価している.実際に創造的な作業ができたかどうかは,その作業がどのくらいクリエイティブだったかを評価しなければいけないが,評価手法がないので難しいとの回答だった.会場から,評価するのも入力クエリ数ではなく,一人の検索プロセス中に,継続的・持続的についてGoogleとこのシステムで変化があるかどうかを評価すればいいというコメントがあった.また,評価実験として,あるニュースに対して重要なファクターを探し,重要度をつけていくという実験が考えられるというコメントもあった.会場より多量の情報があったときには魚もたくさん出てくるのかという質問があり,魚が多いと死んでいくため,収集がつかないということはないが,たくさん集まって見にくくなることはあるという回答であった.自分が意図した魚が投網のときに逃げないのかという質問に対しては,拡大しているならゆっくり動くので問題なく,また,クエリに強い関連のある魚は逃げないようになっているとの回答だった.
概要 RSSリーダは,ブログやWEBサイトの更新情報を配信するためのフォーマットである RSS の閲読を支援するアプリケーションであり,様々なリーダが開発されている.既存の RSS リーダには便利な機能や簡便な操作方法を有するものも多いが,別の作業を行いながら周縁知覚で情報を取得したい,すなわち, “ながらみ”をしたいユーザにとっては必ずしも使いやすく設計されているとはいい難い.本稿では,このような問題を解決し,遂行中の作業を妨げずに RSS の“ながらみ”閲覧が可能な新しい RSS リーダ「ながらみニューズ」を提案する. Keywords: RSS,RSSリーダ,ながらみ閲覧 質疑応答議事録 会場からのコメントで,表示の切り替えを試した結果,視点を切り替えるだけで良いヘッドマウントディスプレイが一番良いとのことだった.会場から,大きな文字や文字が多くなったら画面占有されるのではないかという質問があった.確かに占有されるが,ユーザが判断するものなので,システムで制限することではないという回答があった.また,タイトルの長さによって幅がダイナミックに変化するため,気になってしまうという質問に対しては,幅や表示場所などは設定できるので問題ないという回答であった.表示するものとして,今はニュースが対象なのでタイトルだけで十分だろうが,本文が必要となったときにどう表示するか考えているかという質問があった.それに対して,descriptionはマウスを何秒間おいたらポップアップするとかが考えられるが,なるべくユーザの邪魔をしたくないのでやっておらず,現在はダブルクリックすると本文が見られるとの回答だった.また,表示が動いているので,ダブルクリックしづらいという質問に対しては,上がって一度止まってからまた上がるという動きなので,大丈夫であるという回答があった.ながらみを一時的に隠す機能はあるのかという質問に対しては,長押しすると消えるという回答があった.パーソナライズして,特定の記事だけ見られるといった拡張は考えているのかという質問では,現状ではすぐには付け加えないがそろそろやるべきかもしれないという回答があった.会場からは,スペースのとり方などについて多様の形態があったほうが良く,例えば関連しているものだけ見せ,詳細は操作した後に見せるなどが考えられるとのコメントがあった.
概要 我々は,今まで画像特徴量などを用いた,役割に基づくWeb画像の分類について示してきたが,その精度は充分に高いものではなかった.役割という観点において,Webページにおける画像のレイアウト情報に基づく位置情報は重要な要素である.DOMを利用し,レンダリング情報を抽出し,Web画像分類に対する寄与を調べ,精度の改善を行った. Keywords: Web画像,分類,レンダリング情報 質疑応答議事録 聴講者より「サイト内の定義」について質問があり,それに対して「ドメインが同じ事と定義し,今回の提案では主に企業サイトを対象にした.」との回答があった. 次に,クラスタリングの方法やその数値についての質問があり,それに対し「各画像の絶対座標からクラスタリングを行っている.複数のクラスタに属したかどうかを0,1で表現している.」との回答があった. その他,htmlに書かれているファイル名の拡張子の情報を利用したらどうかなどのコメントが聴講者からあった.
概要 インターネット上に存在するサービスやコンテンツは日々増えており,それに伴いユーザのプロファイルやコンテキスト情報のようなユーザ情報を利用したパーソナライズドサービスが様々なところで普及してきている.一方近年,個人情報保護に対するユーザの意識が高まってきており,今後サービス提供者はパーソナライゼーションを行う際のユーザ情報の取り扱いにより慎重にならなければならない.そこで我々は,ユーザが保持する端末にエージェントを組み込むことで,各々のサービス提供者が個々に保持しているユーザ情報を端末上に収集し,ユーザがユーザ情報をパーソナライズドサービスに平等にかつ安全に活用するための研究を行ってきた.本稿では,ユーザのプライバシーを保護しつつユーザ情報の柔軟な利用を可能とし,より高度なパーソナライゼーションを実現するためのパーソナライズドアーキテクチャの提案を行う. Keywords: パーソナライゼーション,レコメンデーション,ユーザプロファイル,コンテキスト情報 質疑応答議事録 聴講者より「提案方式はプライバシー保護の観点からは良いが,サーバの負荷がかかるのでは?」という質問があり,それについては「運用方法により負荷を分散させることが可能と考えており,具体的な方法については今後の課題である.」との回答がなされた. また,聴講者から「アマゾンなど既存のシステムとの共有はどうするのか?」という質問があり,これに対して「P2P技術を用いて対応したい.」との回答があった. 最後に,「全ての情報を自分のPCに保持しているのは不便では? Webメールの様にサーバ側にデータを置いていて運用されているシステムもありますが.」との質問があった.発表者は「便利さとセキュリティはトレードオフなので落とし所が難しい.USBキーを使うなど色々方法は考えられるが,具体的な方法は今後の課題」と回答した.
概要 国会議事録の質疑・応答において重要となる部分は質問とその答弁であるため,質問を質問発言から抽出し,質問とそれに対する答弁を対応させ要約を行った.本システムでは,まず,議長発言を基に質問発言と答弁発言を分ける.次に,質問文の特徴となる表現を基に質問発言から質問を抽出する.最後に,質問とその解答には共通の単語が見られることから,質問の特徴をベクトルで表現し,ベクトル同士のcosine値を計算し類似度を求める.類似度最高の文を質問に対する答弁として対応付ける.3回分の議事録(質問発言14回)に対して評価を行い,議長の発言内容の分類精度は96%,質問内容の抽出精度は88%,対応付けの精度は67%であった. Keywords: 国会議事録,質疑・応答,自動要約,類似度 質疑応答議事録 聴講者より「文の抽出の大変さ」についての質問がある.発表者は「議長発言は簡単.質問表現の抽出はしらみつぶしに探し出した.答弁については文の開始の抽出で良く楽だった.」との回答があった.また,会場から「法廷の議事録でやっても面白いかも」とのコメントがあった.その他,会場から「発言者(議員)の特定が可能なのでこれを基にマイニングできるのでは?」との質問があり,「実験を行ってみて,直感的には有効だと感じたので,今後行いたい.」との回答があった.また,「要約の質」や「評価基準」について質問があり,それに対して「今回は質問発言と答弁発言の対応が取れているかに焦点を当てたため,質については今後の課題.」との回答があった.会場から「国会の討論は前もって文章を作成しているので,表現が文語的なものが多いと思います.対応付けも殆んど決まっており,議論が前に戻ることもないので,一般の文章に比べ扱い易いと思います.」とのコメントがあった.さらに,「質問と答弁は1対1なのか?」との質問があり,「質問が1つで答弁が2つの場合があるが,この場合はこの手法では扱えない」との回答があった. 最後に「議論が噛み合わない時があると思うが,そういう時はどうするのか?」との質問があり,これに対して「答弁なしという項目を作る必要がある.」という回答があった.
概要 本論文では掲示板サイトから注目すべきスレッドを抽出する方法を提案する.提案法においては,SVMによって学習した分類モデルを利用することにより,スレッドを構成する記事の中からイベントを抽出する.また,抽出したイベントに対応する時間情報に基づいて時系列データを生成し,特徴的なイベントの並びを含んだ時系列データに対応するスレッドを注目すべきスレッドとして抽出する.提案法の効果を検証する第一弾として,掲示板サイトから収集した実験データから分類モデルを学習し,学習した分類モデルの抽出性能を評価する.これにより,注目すべきスレッドの抽出可能性を検証する. Keywords: 時系列マイニング,テキストマイニング,掲示板サイト,評判情報 質疑応答議事録 まず,研究の目的に関して,ユーザが興味のあるスレッドを探すということと,イベントを分類するということがどういう関係があるかという質問があった.それに対しては,ユーザが「不満」「満足」等のイベント群にスレッドを分類することでユーザが欲しいイベントのスレッドを見つけやすくなるという回答があった.また,イベントに関して,実際の運用ではどれぐらいのイベント数が必要なのかを今後調べて欲しいということや,「イベントがない」や「不満がない」という状態も実はイベントとして重要なのではないかということ,あらかじめ定められたイベントに分類するだけではユーザの興味は捕らえきれないのではないかというコメントがあった.最後に,評価方法に関するコメントとして,文書に複数のイベントラベルが付与されている場合に,現在は2値分類の性能評価を行っているが,多値分類の評価,すなわち各文書に対してすべてのイベントを検出ができるかを評価した方がよいのではないかということがあった.
概要 評判情報には,「実際に対象となる物事を体験した人の意見・評価」と「他の人の体験やマシンスペックなど提示された条件で書き手が予想・判断した意見・評価」がある.従来研究では,両者を区別なく扱っていた.しかし,商品購入などの利用シーンでは,実体験に基づく意見がより重視されることが多いと考えられる.そこで本稿では,ユーザの実体験を記述する際に現れる特徴を体験表現として定義し,前者に属する情報を取得するための評判情報判定方法について検討を行った.本実験ではBlogを解析した結果,体験表現と評価表現を組み合わせることで,評価表現のみで評判情報を取得するよりも評判情報以外の文書が除去できる事を確認した. Keywords: 体験表現,評判情報,評価表現,Blog 質疑応答議事録 まず,研究の動機としてはどのようなものかという質問があった.これに対して,エンドユーザとしての希望として検索エンジンの精度向上が重要である,例えばレストランの評判を探すときも,現在店の宣伝情報がたくさん出てきてしまう,という回答があった.次に,方式に関する質問として,用いた体験表現はどのぐらいバリエーションがあり分野依存は大きいのかという質問があった.それに対して,実際に数えているわけではないが,分野依存は小さいという回答があった.次に,実験に関して,用いた文書の種類や,前処理としてどのようなことを行っているのかという質問があった.それに対して,Blogの1エントリを1記事として扱っており,特に前処理的なフィルタリングは行っていないという回答があった.全体的なコメントとして,評判情報に対してどうして体験表現が必要かという議論が必要ということや,体験表現を加えてどのようにユーザにレポートするのかを考えることが必要ということがあった.
概要 本論文では, リコメンデーションblogの獲得手法について述べる. 分析の結果, リコメンデーションとは, 本文の内容は類似しているが少し違ったことを書いている文書を指し, そういったものがユーザーにとって有益であると考えた. リコメンデーションblogを獲得するために本文に出現する単語のうちtf・idfの値が高い重要語と重要語と一文内での共起語の情報を用いる. 3種の検索キーワードのblogセットに対して実験を行った結果, 本手法を用いることにより42.9%の精度でリコメンドblogを抽出することができた. Keywords: ブログ, リコメンド, 類似度, 本文内容 質疑応答議事録 まず,研究の動機について,WebコンテンツではなくBlogとした理由や,Blogならではの特徴に関する質問があった.これに関して,BlogはWebの中でも信頼度が高いためという回答があった.次に,方式に関して,単純なtf/idfを用いると記事の長さ(特に短い場合)によって重要度が適切にならない場合や,tf/idfは低いが実は重要な用語(例えば記事のトピックであるが当たり前すぎて記述されないような場合)があるのではないかという質問があった.それに対して,可能性はあるが,今回用いた文章では,毎日毎日トピックが違うほうが一般的で一つのテーマだけを書いている人は少なかったという回答があった.また,similarityを判定するときに重要語と関連語の2種類を用いているが,単純に文書全体の単語をtf/idfで選んでコサインで計算してもよいのではないかという質問があった.これに対して,それも試したが提案方式の方が性能が良かった,その理由は,tf/idfで含まれない重要な用語が関連語として抽出できているからという回答があった.全体的なコメントとして,似て非なるというのがノイズかもしれず,現在の手法ではノイズとリコメンドの区別がつかないので,もう少しこの辺りの工夫が欲しいというコメントがあった.
概要 本稿では,インターネットユーザのWebアクセスログデータからユーザの興味の遷移パターンを抽出するデータマイニング手法を提案する.本稿では,個々 のユーザの長期に渡るWebアクセスログを記録したWebPACデータベースを用いる.各ユーザが閲覧した類似Webサイトをクラスタリングし,時間方 向に配置することで,ユーザの興味が時間と共にどのように遷移しているのか観察する.また,遷移パターン可視化ツールWebPAC Viewerにより,各ユーザの興味の遷移パターンを可視化する.そして,4人のユーザの行動履歴解析を通して,クラスタリング手法を上手く利用するこ とで,Webアクセスログに記録された粗いデータから有用なユーザの興味の遷移パターンを抽出できることを示す. Keywords: Webユーザ,クラスタリング,可視化 質疑応答議事録 まず,研究の動機として,従来のように短い期間でなく,ロングレンジの行動履歴解析をすることでどのような利点があるのかという質問があった.これに対して,日々定期的に見るサイトとある時期だけ見るサイトを区別できるのがいいのではないか,その人の人生にかかわるような長期的なユーザプロファイルが抽出できるのではないかという回答があった.次に,分析方式について,クラスタリングの横軸のクラスの並びには意味があるのかという質問があり,比較的近くにあるのは意味が近いクラスタという回答があった.また,個別の人でなく複数の人をクラスタリングしてマッピングすると良いではないのかという質問に対して,試してみたが,個人個人の特徴が相殺されて埋もれてしまうという回答があった.最後に,今後の予定について,この結果をどのようにコミュニティ発見に使うのかという質問があり,例えば,Yahooオークションを見ている人をより細分化して分類することに利用するという回答があった.
概要 検索エンジンが返すページは膨大で重複が多く,絞り込むために適切な検索質問を作成するのは難しい.そこで,ユーザが指定した項目(ページ)との類似性に基づいて,検索結果の各項目(ページ)を一覧から削除したり残したいするインタフェースを提案する.検索結果一覧で各ページごとに用意された「類似ページのみを残す」と「類似ページを消す」というボタンによって,類似したページを残したり削除したりできる.ページ同士の類似度にはキーワードの重みによる類似度を用いる.キーワードの重みにはページを形態素解析して出現頻度を正規化したものを用いる.検索エンジンにGoogle,形態素解析にMeCabを用いた検索インタフェースを作成した. Keywords: ウェブページ選択,類似性,類似検索,インタフェース,検索エンジン 質疑応答議事録 聴講者より,タイトル,スニペット,本文キャッシュを使っているにも関わらず,使用しているのはただのTFで,Queryもベクトルの要素として入っているが,これではほとんどの検索結果において文書は類似しているとされてしまわないかとの質問があった.発表者からは,ベクトルを解析している(?)から全部が類似すると言うことはないとの回答があった.続いて,ユーザは検索結果を網羅的に見ていくモデルを採用しているようだが,ユーザはサマリを眺めて事前にフィルタリングした後でページを閲覧するし,検索結果の精度が望ましくないとユーザが感じれば,ユーザは検索質問に新たな語を加えて絞り込みをしてこれらの発表者の提示する問題は起こらないのではないかとの質問があった.それに対し発表者からは,検索結果が複雑なカテゴリ分類になったときや,初心者には判別が難しいような検索結果が現れたときに有用であるとの回答があった.聴講者のコメントとして,クラスタリングではいくつのクラスタに分けるかが問題になるがこの手法であれば必要になったときに消すことができるのでクラスタリングとは方向性が異なるとの意見が寄せられた.別の聴講者より,類似したページを集めてグループ化してそのグループを見せるだけでユーザの視点は広がると考えるが,グループを見せずに初めに全てのページを見せたのはなぜかとの質問があった.発表者からは,いきなりクラスタリングだけを見せるのはわかりにくいと考え,本インタフェースであればGoogleの検索結果とほとんど変わらないにも関わらず必要となったときに絞り込みの操作ができるという点が重要であると考えているとの回答があった.さらに聴講者より,本インタフェースの利用モデルを明確にしてこのような場合に有用であるとの利用モデルを提案して欲しいとのコメントがあった.さらに別の聴講者からは,タイトルおよびスニペットと本文キャッシュの内容は重複しているように見受けられるが,このような方法を選択した理由の質問と,片方を採用するときと両方を採用するときでは実験結果が異なるのではないかとの質問があった.発表者からは,本文キャッシュをGoogleから得られないときがあったのでタイトルとスニペットも付与することにしたが,どちらかだけを本文キャッシュかタイトルとスニペットかのどちらかを用いることも検討しており,今後は本文キャッシュの重みを大きく取ることも検討しながら多面的に検証したいとの回答があった.さらに別の聴講者からコメントがあった.クラスタリングのように一気に絞り込んでいくものとそうでないもので違いがあると考えている.例えば辞書にないようなものでクラスタリングするような場合には本インタフェースのような手法がひつようになるだろう.類似ページとして提示された理由を表示するとよいだろうとのことだった.
概要 Web検索を行うユーザは,過去に行ったWeb検索の記憶をもとに,検索対象についての大まかな概念を頭の中に描くことはできるが,検索に役立つ具体的な語を思いつかない場合がある.このため,ユーザが検索を行う際に,ユーザのこれまでの検索・閲覧履歴からユーザの検索に役立ちそうな語を提示できることが望ましい.本論文では,Web検索を行うユーザの検索・閲覧履歴を整理分類し,自己組織化マップを構成する.また,この自己組織化マップの適当なクラスタに含まれる語の中から,Web検索に役立ちそうな特徴語を抽出する手法を提案する.ユーザは抽出された特徴語のなかから,ユーザが検索対象に対して持っている概念と共通のものを選ぶ.さらに,このようにして得られた特徴語を用いて行うWebページ検索の評価を行う. Keywords: Webマイニング,情報検索,クラスタリング,自己組織化マップ 質疑応答議事録 希望無し.
概要 デザインの類似したWebページは,そのコンテンツやサービスも類似しているため情報検索時に視覚的類似性を考慮することは有効であると考える.我々は,Webページを画像として扱うことにより,視覚的類似性に基づき検索する手法を提案している.特に,Webサイトのトップページには業種毎に共通する視覚的類似性があるとの仮定に基づき,業種に基づくWebページ検索手法について検討している.本稿では,実際のWebページを収集して作成したテストコレクションを用いて評価実験を行った結果について報告する. Keywords: Web検索,視覚的類似性,レイアウト解析,グラフマッチング,カラーヒストグラム 質疑応答議事録 聴講者より,背景に画像が入った場合は領域が分割できるのかとの問い合わせに対し,発表者から認識できないとの回答があった.また,カラーヒストグラムはページ全体を対象にするのかとの問い合わせに対し,そうであるとの回答があった.さらに,カラーヒストグラムの評価において背景と文字がそれぞれ類似度が大きくなるのかとの問い合わせに対し,そうであるとの回答があった.別の聴講者からは,レイアウト解析とカラーヒストグラムとを混合して実行しているようだが,ヒストグラムで絞り込んだ上でレイアウト解析を行った方が良いように見えるので,今後の研究の方向性としてそのようなことも検討してはどうかとの問い合わせに対し,発表者から,領域ごとにカラーヒストグラムを用いることを検討している(???)との回答があった.さらに別の聴講者から,グラフマッチングによる比較では完全グラフを作成しているのかとの問い合わせに対し,回答者からそうであるとの回答があった.この聴講者からはコメントがあった.Webページのレイアウトはブロックを作ってそこに更にブロックを載せたり詳細な情報を載せたりなどといった階層的に作成していく.完全グラフでは階層性を意識していないことになり,これが精度が上がらない理由になっているような気がする.グラフを作るときに階層性を考慮した方が良いだろう.また,評価関数は要素の大きさと位置だけで決めているが,画像の内容についての意味的な内容を抽出することも検討すべきであるとのことだった.さらに別の聴講者からはコメントとして,同じ業種の中で異なるものを見つけ出せると実験結果が示しているので,独自のカラーを出して他組織と異なるスタイルをアピールする方法として本研究を進めていく方向性もあるのではないかとのことだった.
概要 Web上に公開されているシラバス情報は,内容は類似しているが教育機関毎に設計仕様が異なり比較,交換,統合,分析を行うのに不便な面がある.本稿では,Web上から幾つかの代表的な情報系教育機関のシラバスデータを収集し,@HTMLからXMLへの半自動変換を行い,AXML化されたシラバスに対して講義内容の分析・視覚化を行ったので,@とAに関して報告する.@の処理は,XML変換テンプレートによる自動変換と独自に開発したGUIによる半自動変換を組み合わせて行い,分析・視覚化には,情報処理学会が報告している「大学の理工系学部情報系学科のためのコンピュータサイエンス教育カリキュラム」(J97)との類似性を求め,各大学(学科)における特出する科目や,不足していると考えられる科目を示唆することによりカリキュラムの選定を促すプロトシステムを構築したことで行った. Keywords: シラバス,XML,XML変換,類似度,視覚化 質疑応答議事録 形態素解析を利用せずに全文一致でもよいのではないかとの質問に対して,文章が長い場合に,完全一致では駄目な場合があり,必要のない部分を検収する場合があるとの回答がなされた.また,idfをどのように取っているのかとの質問に対し,テキスト別にidfを取っているとの回答がなされた.これに対し,tfの方がかえって良いかも知れないとのコメントが出された.XMLの変換の際に移動を行うツールがあればルールは必要ないのではないかとの質問に対し,そのようなことはないとの回答がなされた.変換に失敗する例としてはどのようなものがあるのかとの質問に対し,装飾文字等のタグを前処理で消しており,そのようなタグがキーになる場合に失敗することがあるとの回答がなされた.構文木パスRにおいて,ラムダ要素が入れ子になっている場合に中にある要素と並列になる要素の区別がつかないのではないかとの質問に対し,そのようなことはないとの回答がなされた.dvi要素等の直接入れ子になる要素を記述する際に区別がつかなくなるのではないかとの質問に対し,そのようなタグは前処理で削除しているとの回答がなされた.最後に,XPATHのポジションを使った方がよいのではないかとの質問に対し,今後検討するとの回答がなされた.
概要 本研究では電子シラバスを活用した教養教育の科目選択支援を目標として進めている.教養科目は専門科目よりも選択の幅が極めて広い上,専門知識がなく,学問体系をあまり知らない学生が,正しく科目を探せるとは考えにくい.シラバスは,授業の内容を表す最も重要な情報源であり,科目選択において有効な判断材料であるといえる.そこでWeb上に公開されている教養科目の電子シラバスを取得し,シラバスの分析を行った.科目の情報として「科目名」「授業概要」「授業計画」のテキストデータから科目の特徴を表すキーワードを抽出し,科目の分析を行い,ベクトル空間法を用いることで科目間の関連性を分析した.分析対象のシラバスは京都大学の教養教育科目のものを用いた.分析の結果,シラバスの内容から教養科目の特徴を把握することができた.また,その特徴を用いて科目選択支援における科目体系の可視化を提案した. Keywords: カリキュラム, 電子シラバス, 教養教育,授業選択支援,ベクトル空間法 質疑応答議事録 科目には履修関係があるので有向グラフで表現した方がよいのではないかとの質問に対し,シラバスにそのような情報が記載されている場合には活用していきたいとの回答がなされた.キーワード入力である程度のシラバスが書ければシラバスを書かない先生を支援できるのではないかとの質問に対し,シソーラスを整備して対応していきたいとの回答がなされた.誰が教えているかで講義を選択する場合があるのではないかとの質問に対し,先生の情報や先生のWebページも今後活用していきたいとの回答がなされた.講義の形式によって講義を選択する場合があるのではないかとの質問に対し,講義形式の情報もシラバス内に書かれていれば扱っており,今後講義形式別にも評価を行っていきたいとの回答がなされた.学生の利用形態に関する調査を実施したかとの質問に対し,京大の学生に対するアンケート結果を参考にしているとの回答がなされた.関連したものだけを探すのでは教養を深めることにはならないのではないか,分野間の地図があるとよいのではないかとの質問に対し,個人別の履修マップを出力し不足している部分を提示できるようにしていきたいとの回答がなされた.キーワードベクトルでは一般的なキーワードで科目が繋がってしまうのではないか,特異なキーワードで繋げた方がよいのではないかとの質問に対し,今回はtfだけで評価しているがtf-idfを利用した実験でも結果にそれ程変化はなかったとの回答がなされた.利用イメージとしてどのようなものを想定しているのかとの質問に対し,自身の専門と科目がどのように関係しているかを説明できるようにしていきたいとの回答がなされた.最後に,意識の低い学生は利用しないのではないかとの質問に対し,意識の低い学生の意識を急に上げるのは難しく,現状の科目での限界を提示し学生の意識高揚を図っていきたいとの回答がなされた.
概要 Mixi, Gree などのソーシャルネットワークでのコミュニティ内での交流などに代表されるように,オンライン上で様々な人とコミュニケーションを取る機会が増えてき た.オンライン上でのコミュニケーションは主にテキストを用いて行われ,人はテキストを読むことによってコミュニティ内の人間関係や雰囲気を知る.人間 はそれぞれ独自の喋り口調を持っており,それはテキストにも反映されることが多い.したがって,同じ内容でも人によっては非常にぶっきらぼうな表現となることもあり,その人やその周りの人間関係が実際とは異なる評価をされてしまう恐れがある.そこで本稿では,テキストの文末表現から発話意図を特定し, 発話意図の組合せから人間関係を抽出する手法を提案する.提案手法では文末表現と発話意図の対応を示すネットワークを用いて,発話意図 の特定と人間関 係の抽出を行う.メールデータを用いた発話意図抽出実験において,文末表現からの発話意図特定の再現率が5割となることを確認し,発話意図からの人間関 係を特定できる可能性を検証した. Keywords: 発話意図,文末表現,上下関係,信頼関係,オンラインコミュニティ 質疑応答議事録 助詞から関係を出すプロセスはどのようになっているのかとの質問に対し,助詞を手がかりとして疑問等の意図を確定して対応付けを行っているとの回答がなされた.偉い人がユーザコミュニティを作成しており依頼が集中する場合もあるのではないかとの質問に対し,あまりデータを入れた解析を行っていないのでそのような場合は発生していないが,そのようなコミュニティに対応するにはコミュニティ向けの評価関数を作成する必要があるとの回答がなされた.発話意図の抽出は必要ないのではないかとの質問に対し,人間関係は動的に変化していくのでその変化をみるのに発話意図が必要になると考えているとの回答がなされた.Googleはリンク関係だけでやっているが,発話意図の抽出性能が上がらないようなら異なるアプローチも検討した方がよいのではないかとの質問に対し,手法を組み合わせると良いと考えられるので今後検討したいとの回答がなされた.信頼関係に関する概念を規定した方がよいとのコメントが出された.発話意図の分類はどのようにして決めたのか,発話意図の数は現在のもので足りているのか,またどの発話意図にも含まれない場合にはどのようにしているのかとの質問に対し,助詞・助動詞で似ているものをまとめていき,20個の発話意図を決定した,現状の発話意図で不足しているかどうかは検討していないので今後検討したい,最終的には事実という発話意図に割当てているので,発話意図が割り当たらないことはないとの回答がなされた.最後に,仲間内だけで使われる表現も扱えるようにした方がよいとのコメントが出された.
概要 複数の人間が共同で作業を行うコミュニティにおいて,次に取るべき行動を決定することは重要な事項である.コミュニティにおけるリーダーは,リスクを小 さく効果を大きくするためのしかるべき次の行動を決定する必要がある.この時,取るべき行動をリーダーが単独で決定することが難しい場合には,効果の高 い次の行動は,コミュニティのメンバーや関係者を含むお互いの議論によって決定される.しかし,ただやみくもに議論を行えば良いわけではなく,限られた 時間で有効な行動を発見するためには,ポイントを抑えた系統的な議論が望まれる.また,必要に応じてさまざまな背景情報を参照しながら互いの知識を共有 し,議論の発散と収束を繰り返すことで効果的な結論を導き出せると考えられる.そこで本研究では,複数のコミュニティメンバーがお互いに議論や意見交換 をしていく中で,効果的に議論を行なうためのBBSシステムの枠組みを提案する. Keywords: 掲示板システム,議論制御,ストーリーモデル,シナリオ創発 質疑応答議事録 会場より,サブスレッドの内容を表すラベル・タイトルはどのようにつけられるのかという質問があったが,スレッドの生成時に手動で付加するとの回答であった.また,予備実験で利用した通常のテキスト文書と,掲示板の議論ではモデルが大きく異なり,その差をどのように吸収するのかという指摘があったが,掲示板においてもテキスト文書と同様のストーリー展開が存在すると思われ,提案手法の適用は可能であるとの回答であった.スレッド中のトピックの自動特定および追跡手法が必要ではないかとの質問には,ユーザが明示的にトピックの変わり目にサブスレッドを立ち上がるため,そういった手法は必要ないとの回答があった.最後に,提案手法の対象として,オープンソースソフトウェアのプロジェクト管理やメーリングリストにおける議論の支援などが適しているのではないかというコメントがあった.
概要 非同期型e-Learningにおいて教師・受講者間のビジュアルな質疑応答と対話支援による教育効果の向上を図るため,双方向コミュニケーションのためのインテリジェント掲示板システムを開発している.本システムは機械安全工学を含む安全教育をターゲットとしていることから,図上演習を可能とする図形アニメーション機能と,発言が活発な掲示板において重要発言の抽出や話題転換の検出を行うことで教師の介入や受講者の参加を助けるコミュニケーション支援機能が要求される.本稿ではこのシステムの実現手法について述べるとともに,それらの実装について提案し,実現した機能について説明する.図形アニメーション向けプログラミング環境としてSqueak eToysを利用し,これを掲出できるようSqueakプラグインを呼出すWeb掲示板をLMSと連携できるよう実装した.また,コミュニケーション支援機能には,語の類似性を判別する「概念ベース」を利用することを提案している. Keywords: eラーニング,電子掲示板,図形プログラミング,学習管理システム,機械安全,テキスト処理,概念ベース 質疑応答議事録 会場より,掲示板上にアップロードされたSqueak eToysについて各ユーザがパラメータを変更し,その情報を共有することは可能かという質問があったが,eToysをダウンロードし,パラメータを変更して再保存し,アップロードすることで目的が達成できるとの回答であった.これに対し,質問者からはパラメータ情報のみを共有する機能を掲示板側で実現できないかというコメントがあった.別の質問者からは,eToysで設計可能なのは機械であるのか人間のふるまいであるのかという質問があった.これに対し,機械安全教育とは人間がエラーを起こすという前提のもとで機械を設計するための教育であるとの回答があった.最後の質問者からは,Squeak eToys環境と概念ベースの関係について質問があり,掲示板上の議論のトピックの変遷を特定するために概念ベースを使用し,機械安全教育のコンテンツを表現するための手段としてSqueak eToys環境を使用しているとの回答があった.これに対し,時系列的に概念ベースの内容が変化するのではないかとの指摘があったが,概念ベースは議論に含まれる専門用語のシソーラスとして機能するものであり,時系列で変化するものではないと回答があった.