講演名 2003/9/7
文の役割を考慮したMEDLINE文書検索システム(<特集>「アクティブマイニング」及び一般)
山崎 貴宏, 新保 仁, 松本 裕治,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,試作したMEDLINEアブストラクト検索システムについて報告する.本システムの特徴は,指定した検索キーワードをアブストラクト文全体から検索できるのはもとより,検索対象をアブストラクトの一部分に限定することが可能という点にある.検索対象部分は,研究背景,実験方法,結論といった,アブストラクト中の文章構造上の役割によって指定する.この機能によって,単なる検索語の追加では不可能な,効率的な検索結果の絞り込みが可能になる. MEDLINEには,一部"構造化(structured)"アブストラクトと呼ばれる,各段落の先頭にその段落の役割(BACKGROUND,CONCLUSIONS,等)が明記されたものが含まれているものの,大多数にはそのような役割ラベルは明記されていない.これら非構造化アブストラクトの各文に対して自動的に役割ラベルを付与するため,構造化アブストラクト内の各文を用いて訓練したラベル判別器を構築した.
抄録(英) We present an experimental text retrieval system to facilitate search in the MEDLINE database. A unique feature of the system is that users can search not only through the whole abstract text for his specified keywords, but also from limited sections in the abstracts. The sections reflect the structure of abstract texts, such as BACKGROUND and CONCLUSIONS. This feature makes it easier to narrow down search results when adding extra keywords does not work, and allows for ranking search results according to users' needs. The MEDLINE database contains a small portion of "structured" abstracts, in which sections are explicitly marked by the headings. They thus require no additional processing for inferring which section each sentence belongs to. They also provide training data for constructing classifiers that section the rest of the unstructured abstracts lacking explicit section heading, which form a majority of the MEDLINE corpus.
キーワード(和) MEDLINEデータベース / 構造化アブストラクト / 情報検索 / 文書分類
キーワード(英) MEDLINE database / structured abstracts / information retrieval / text classification
資料番号 AI2003-34
発行日

研究会情報
研究会 AI
開催期間 2003/9/7(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 ENG
タイトル(和) 文の役割を考慮したMEDLINE文書検索システム(<特集>「アクティブマイニング」及び一般)
サブタイトル(和)
タイトル(英) A MEDLINE document search system using section information
サブタイトル(和)
キーワード(1)(和/英) MEDLINEデータベース / MEDLINE database
キーワード(2)(和/英) 構造化アブストラクト / structured abstracts
キーワード(3)(和/英) 情報検索 / information retrieval
キーワード(4)(和/英) 文書分類 / text classification
第 1 著者 氏名(和/英) 山崎 貴宏 / Takahiro YAMASAKI
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 新保 仁 / Masashi SHIMBO
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science Nara Institute of Science and Technology
第 3 著者 氏名(和/英) 松本 裕治 / Yuji MATSUMOTO
第 3 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science Nara Institute of Science and Technology
発表年月日 2003/9/7
資料番号 AI2003-34
巻番号(vol) vol.103
号番号(no) 304
ページ範囲 pp.-
ページ数 6
発行日