講演抄録/キーワード |
講演名 |
2010-03-11 15:25
記述型アンケートの内容分析補助を目的とした文章クラスタリングの検討 ○藤澤大樹・山根勇希・大木 誠(鳥取大) NC2009-171 |
抄録 |
(和) |
近年では、インターネットの普及・発展に伴い、大規模なアンケート調査が頻繁に行われている。アンケート調査の内容は、商品評価や意識調査など多岐にわたる。アンケート調査によって得られた情報を有効に利用するためには、アンケートに対する回答を集計し分析する必要がある。あらかじめ用意された選択肢の中から選んで回答させる選択形式のアンケートの場合には、集計作業は機械的に行えるため非常に容易である。しかし、質問に対する回答やキーワードに関する意見などを自由に記述させる文章記述形式の場合は、集計作業の自動化は完全には行われておらず、人の手による集計が行われているのが現状である。その結果、集計作業には多大な労力と時間を必要とする。このように文章データの意味を抽出し、集計や整理を行う分野をテキストマイニングと呼び、データマイニングの一分野を形成している。
本研究では記述型アンケートの集計補助を目的として、自己組織化マップ(Self-Organizing Map:SOM)を用いた文章内容のクラスタリングの手法を提案する。本研究では、同様の意味もしくは同様の分野に関する言明を示している文章は、同様の単語で構成されると仮定する。この仮定に基づくと、単語の包含状況によって文章の 分類が可能であると考えられる。本研究では、単語の出現状況をSOMにより分類することで同様の意味を有すると考えられる文章クラスタを抽出する手法を検討する。 |
(英) |
(Not available yet) |
キーワード |
(和) |
自己組織化マップ / Ward法 / テキストマイニング / データマイニング / / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 109, no. 461, NC2009-171, pp. 491-494, 2010年3月. |
資料番号 |
NC2009-171 |
発行日 |
2010-03-02 (NC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NC2009-171 |