講演名 | 2006-02-03 見出しの階層関係を利用したWWW検索精度の改善(WWW,テキスト情報の要約と掲示に関わる自然言語処理シンポジウム及び一般) 西口 直樹, 松本 章代, 小西 達裕, 高木 朗, 小山 照夫, 三宅 芳雄, 伊東 幸宏, |
---|---|
PDFダウンロードページ | ![]() |
抄録(和) | 我々は,Web検索エンジンの検索精度を更に向上させるため,Webページ内に現れる検索キーワード間の意味的係り受け関係の利用について検討している。本稿ではキーワード間の意味的関係を表すような構造として,「見出しの階層関係」に着目し,検索精度の向上に役立つ事を検証する。また,この方法によって検索精度が向上する事を実験的に検証する。尚,2つのキーワードを用いて検索する場合が多い事に着目し,本研究では当面2語による検索を研究対象とする。 |
抄録(英) | In This paper, we propose a method to improve precision and recall of WWW search engines. In order to improve the precision and recall, our search engine checks whether input keywords have a semantic relation in the candidate pages or not. Semantic relations between keywords are represented by using structures, such as sentence, table, headlines and so on. In this paper we deal with headlines as a structure to represent semantic relations. We focus on retrieval conditions represented by two kyewords and propose a method to detect semantic relations between them represented by the structure of headlines in candidate pages. We also show an experimental evaluation of our method. |
キーワード(和) | 情報検索 / サーチエンジン / 自然言語処理 / 係り受け関係 / 見出し / 階層関係 / WWW |
キーワード(英) | Information Retrieval / Search Engine / Natural Language / Headline / Hierarchical Structure / WWW |
資料番号 | NLC2005-114 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2006/1/27(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 見出しの階層関係を利用したWWW検索精度の改善(WWW,テキスト情報の要約と掲示に関わる自然言語処理シンポジウム及び一般) |
サブタイトル(和) | |
タイトル(英) | Improvement in precision and recall of a WWW Search Engine by using Hierarchical Structure of Headline |
サブタイトル(和) | |
キーワード(1)(和/英) | 情報検索 / Information Retrieval |
キーワード(2)(和/英) | サーチエンジン / Search Engine |
キーワード(3)(和/英) | 自然言語処理 / Natural Language |
キーワード(4)(和/英) | 係り受け関係 / Headline |
キーワード(5)(和/英) | 見出し / Hierarchical Structure |
キーワード(6)(和/英) | 階層関係 / WWW |
キーワード(7)(和/英) | WWW |
第 1 著者 氏名(和/英) | 西口 直樹 / Naoki NISHIGUCHI |
第 1 著者 所属(和/英) | 静岡大学 Shizuoka University |
第 2 著者 氏名(和/英) | 松本 章代 / Akiyo MATSUMOTO |
第 2 著者 所属(和/英) | 静岡大学 Shizuoka University |
第 3 著者 氏名(和/英) | 小西 達裕 / Tatsuhiro KONISHI |
第 3 著者 所属(和/英) | 静岡大学 Shizuoka University |
第 4 著者 氏名(和/英) | 高木 朗 / Akira TAKAGI |
第 4 著者 所属(和/英) | 株式会社CSKシステムズ CSK SYSTEMS Corporation |
第 5 著者 氏名(和/英) | 小山 照夫 / Teruo KOYAMA |
第 5 著者 所属(和/英) | 国立情報学研究所 National Institute of Informatics |
第 6 著者 氏名(和/英) | 三宅 芳雄 / Yoshio MIYAKE |
第 6 著者 所属(和/英) | 中京大学 Chukyo University |
第 7 著者 氏名(和/英) | 伊東 幸宏 / Yukihiro ITOH |
第 7 著者 所属(和/英) | 静岡大学 Shizuoka University |
発表年月日 | 2006-02-03 |
資料番号 | NLC2005-114 |
巻番号(vol) | vol.105 |
号番号(no) | 595 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |