講演名 | 2000/5/22 分野連想語を用いたパッセージ特定手法 獅々堀 正幹, 中谷 泰之, 池田 俊彦, 青江 順一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 複数の話題が混在する文書から, 各話題のまとまり部分(パッセージ)を特定し, 各パッセージの話題分野を決定する技術は, 情報検索の分野に限らず, 様々な分野で重要な役割を担う技術である.本稿では, 事前に定義された分野体系に従って構築した分野連想語を用いて, パッセージを特定する手法を提案する.分野連想語とは, 特定の分野を的確に連想できる単語のことで, 分野体系に従って分類された文書データから構築することができる.本手法では, 話題の継続性に着目し, 分野連想語の水準(連想分野の範囲)や連続出現性から算出した継続度により, パッセージのまとまりを形成する.また, 話題の転換性を考慮したアルゴリズムにより, パッセージ間の区切りを明確にし, 各パッセージの話題分野を特定する. |
抄録(英) | Pasage Retrieval is the very useful technique for various natural language processing systems, such as information retrieval systems, spoken dialogue systems and Kana-to-Kanji conversion systems. This paper propose the method to decide the passages using the field reminding words, which can be directly related to the field of a text. This method decides the range of the passage based on five association levels and positions of field reminding words which appear in the text, and the topic field of each passage is specified by the field name which these words are associated with. Moreover, the algorithm proposed in this paper can be avoid the overlap between neighboring passages. |
キーワード(和) | パッセージ検索 / パッセージ分類 / 分野連想語 / テキスト分割 / テキストタイリング |
キーワード(英) | Passage Retrieval / Passage Categorization / Field Reminding Word / Text Segmentation / Text Tailing |
資料番号 | NLC2000-2 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2000/5/22(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 分野連想語を用いたパッセージ特定手法 |
サブタイトル(和) | |
タイトル(英) | Passage Retrieval Using Field Remindng Words |
サブタイトル(和) | |
キーワード(1)(和/英) | パッセージ検索 / Passage Retrieval |
キーワード(2)(和/英) | パッセージ分類 / Passage Categorization |
キーワード(3)(和/英) | 分野連想語 / Field Reminding Word |
キーワード(4)(和/英) | テキスト分割 / Text Segmentation |
キーワード(5)(和/英) | テキストタイリング / Text Tailing |
第 1 著者 氏名(和/英) | 獅々堀 正幹 / Masami SHISHIBORI |
第 1 著者 所属(和/英) | 徳島大学工学部知能情報工学科 Department of Information Science & Inteligent Systems, Faculty of Engineering, Tokushima University |
第 2 著者 氏名(和/英) | 中谷 泰之 / Yasuyuki NAKATANI |
第 2 著者 所属(和/英) | 徳島大学工学部知能情報工学科 Department of Information Science & Inteligent Systems, Faculty of Engineering, Tokushima University |
第 3 著者 氏名(和/英) | 池田 俊彦 / Toshihiko IKEDA |
第 3 著者 所属(和/英) | 徳島大学工学部知能情報工学科 Department of Information Science & Inteligent Systems, Faculty of Engineering, Tokushima University |
第 4 著者 氏名(和/英) | 青江 順一 / Jun-ichi AOE |
第 4 著者 所属(和/英) | 徳島大学工学部知能情報工学科 Department of Information Science & Inteligent Systems, Faculty of Engineering, Tokushima University |
発表年月日 | 2000/5/22 |
資料番号 | NLC2000-2 |
巻番号(vol) | vol.100 |
号番号(no) | 100 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |