講演名 2000/5/22
分野連想語を用いたパッセージ特定手法
獅々堀 正幹, 中谷 泰之, 池田 俊彦, 青江 順一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 複数の話題が混在する文書から, 各話題のまとまり部分(パッセージ)を特定し, 各パッセージの話題分野を決定する技術は, 情報検索の分野に限らず, 様々な分野で重要な役割を担う技術である.本稿では, 事前に定義された分野体系に従って構築した分野連想語を用いて, パッセージを特定する手法を提案する.分野連想語とは, 特定の分野を的確に連想できる単語のことで, 分野体系に従って分類された文書データから構築することができる.本手法では, 話題の継続性に着目し, 分野連想語の水準(連想分野の範囲)や連続出現性から算出した継続度により, パッセージのまとまりを形成する.また, 話題の転換性を考慮したアルゴリズムにより, パッセージ間の区切りを明確にし, 各パッセージの話題分野を特定する.
抄録(英) Pasage Retrieval is the very useful technique for various natural language processing systems, such as information retrieval systems, spoken dialogue systems and Kana-to-Kanji conversion systems. This paper propose the method to decide the passages using the field reminding words, which can be directly related to the field of a text. This method decides the range of the passage based on five association levels and positions of field reminding words which appear in the text, and the topic field of each passage is specified by the field name which these words are associated with. Moreover, the algorithm proposed in this paper can be avoid the overlap between neighboring passages.
キーワード(和) パッセージ検索 / パッセージ分類 / 分野連想語 / テキスト分割 / テキストタイリング
キーワード(英) Passage Retrieval / Passage Categorization / Field Reminding Word / Text Segmentation / Text Tailing
資料番号 NLC2000-2
発行日

研究会情報
研究会 NLC
開催期間 2000/5/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 分野連想語を用いたパッセージ特定手法
サブタイトル(和)
タイトル(英) Passage Retrieval Using Field Remindng Words
サブタイトル(和)
キーワード(1)(和/英) パッセージ検索 / Passage Retrieval
キーワード(2)(和/英) パッセージ分類 / Passage Categorization
キーワード(3)(和/英) 分野連想語 / Field Reminding Word
キーワード(4)(和/英) テキスト分割 / Text Segmentation
キーワード(5)(和/英) テキストタイリング / Text Tailing
第 1 著者 氏名(和/英) 獅々堀 正幹 / Masami SHISHIBORI
第 1 著者 所属(和/英) 徳島大学工学部知能情報工学科
Department of Information Science & Inteligent Systems, Faculty of Engineering, Tokushima University
第 2 著者 氏名(和/英) 中谷 泰之 / Yasuyuki NAKATANI
第 2 著者 所属(和/英) 徳島大学工学部知能情報工学科
Department of Information Science & Inteligent Systems, Faculty of Engineering, Tokushima University
第 3 著者 氏名(和/英) 池田 俊彦 / Toshihiko IKEDA
第 3 著者 所属(和/英) 徳島大学工学部知能情報工学科
Department of Information Science & Inteligent Systems, Faculty of Engineering, Tokushima University
第 4 著者 氏名(和/英) 青江 順一 / Jun-ichi AOE
第 4 著者 所属(和/英) 徳島大学工学部知能情報工学科
Department of Information Science & Inteligent Systems, Faculty of Engineering, Tokushima University
発表年月日 2000/5/22
資料番号 NLC2000-2
巻番号(vol) vol.100
号番号(no) 100
ページ範囲 pp.-
ページ数 8
発行日