講演抄録/キーワード |
講演名 |
2017-11-24 13:30
コンテキストに従ったWebコンテンツのクラスタリング ○三條知美(LIFULL)・櫻井彰人(慶大) AI2017-11 |
抄録 |
(和) |
web上の情報は非常に多様・大量になり,web から情報を入手するのが当たり前になってきた今日,一方で,web の様々なサイトで似たような内容のコンテンツを表示するようになっている.このため,一般的なユーザが検索エンジンによりwebから情報を抽出すると,類似コンテンツを持つページによって検索結果が膨大になっている.このため,キーワードの絞り込みを適正に行う必要があるなど,目的とする情報を収集するだけにも手間がかかるのが現状である.そこで我々は,ページ内に含まれる単語とユーザが検索に利用したキーワードの意味的な類似性に着目し,関連するコンテンツを提示する仕組みを提案し,その機能を組み込んだwebサイトを構築した. |
(英) |
Nowadays, it is getting popular to find some information on the Internet so that many sites turn to have similar information. Therefore if a user want to find information by searching, the user should find appropriate combination of words for searching. Otherwise the searching results are massive and messy. To solve the problem, we built a service that provides pages with similar meanings sorted in relevance order. |
キーワード |
(和) |
WEBコンテンツ / Doc2Vec / 教師有り学習 / クラスタリング / コンテキスト / LDA / / |
(英) |
web contents / Doc2Vec / supervised learning / classificatio / context / LDA / / |
文献情報 |
信学技報, vol. 117, no. 326, AI2017-11, pp. 25-30, 2017年11月. |
資料番号 |
AI2017-11 |
発行日 |
2017-11-17 (AI) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2017-11 |