講演名 2011-10-11
ウエブからの情報抽出とその応用における課題(招待講演,自然言語処理)
菊井 玄一郎,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 筆者らはウエブ上のテキスト(主にブログ)から固有表現に関わる情報を抽出する技術の研究開発を行ってきた.この技術は,固有表現抽出,固有表現の参照先推定(グラウンディング),固有表現(の参照する事物)に関する評価情報の抽出,固有表現間の意味関係の推定などから構成される.本稿では特にここ数年の成果である,固有表現の細分類,固有表現間の意味関係の推定に力点をおいて全体の概要を紹介する.また,情報抽出およびそのサブモジュールを実タスクに適用する際の課題について述べる.
抄録(英) This paper introduces overview of our information extraction modules consisting of named entity recognition, referent identification of named entity expressions, and extraction of semantic relation between named entities. We put a focus on recent results including fine grained classification of named entity expressions and selection of linguistic expression representing semantic relation (of NEs). The paper also discusses problems we faced with when putting the above modules into practical use.
キーワード(和) 情報抽出 / ウエブ / 固有表現
キーワード(英) Information Extraction / WWW / Named Entity Recognition / Relation Extraction
資料番号 TL2011-35,NLC2011-32
発行日

研究会情報
研究会 TL
開催期間 2011/10/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Thought and Language (TL)
本文の言語 JPN
タイトル(和) ウエブからの情報抽出とその応用における課題(招待講演,自然言語処理)
サブタイトル(和)
タイトル(英) Information Extraction from the Web and Challenges in its Practical Use
サブタイトル(和)
キーワード(1)(和/英) 情報抽出 / Information Extraction
キーワード(2)(和/英) ウエブ / WWW
キーワード(3)(和/英) 固有表現 / Named Entity Recognition
第 1 著者 氏名(和/英) 菊井 玄一郎 / Genichiro KIKUI
第 1 著者 所属(和/英) 岡山県立大学情報工学部
Faculty of Computer Science and Systems Engineering, Okayama Prefectural University
発表年月日 2011-10-11
資料番号 TL2011-35,NLC2011-32
巻番号(vol) vol.111
号番号(no) 227
ページ範囲 pp.-
ページ数 6
発行日