講演名 2015-02-05
上位下位関係からのインスタンス集合の獲得(第6回テキストマイニング・シンポジウム)
山田 一郎, 宮崎 太郎, 宮崎 勝, 三浦 菊佳, 松井 淳, 田中 英輝,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 大規模のテキストから情報抽出を行う際、あるクラスに属するインスタンス集合のデータが有用となる。例えば、「病気」と「薬」のクラスに属するインスタンス集合があれば、それらの単語の文中共起を手掛かりとして特定の病気に効く薬を抽出することができる。既存のシソーラスでは十分な量のインスタンスが登録されておらず、また、WikipediaのクラスなどのWeb上のリソースをそのまま利用するとノイズが大量に含まれてしまう。本稿では、Wikipediaから抽出したノイズの含まれる上位下位関係を利用して、任意のクラスに対するインスタンス集合を大規模かつ高精度に獲得する手法を提案する。獲得したインスタンス集合を利用した単語間意味的関係獲得実験についても報告する。
抄録(英) Class-instance relation is useful for information extraction from large volume of text. For example, we can determine which medicine is effective for a sickness by co-occurrence information of instances of medicine and sickness. It is possible to acquire instances of a class from a legacy thesaurus but sufficient amount of instance is not registered in such extracted from Wikipedia and contain some error relations. We can acquire a large volume of instances with higher accuracy by using two kinds of noise reduction approaches. We report a semantic relation acquisition using automatically extracted class-instance relations.
キーワード(和) インスタンス獲得 / 上位下位関係 / 意味的関係
キーワード(英) Class-instance acquisition / hyponymy relation / semantic relation of words
資料番号 NLC2014-44
発行日

研究会情報
研究会 NLC
開催期間 2015/1/29(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 上位下位関係からのインスタンス集合の獲得(第6回テキストマイニング・シンポジウム)
サブタイトル(和)
タイトル(英) Class-Instance Acquisition using Automatically Extracted Hyponymy Relations
サブタイトル(和)
キーワード(1)(和/英) インスタンス獲得 / Class-instance acquisition
キーワード(2)(和/英) 上位下位関係 / hyponymy relation
キーワード(3)(和/英) 意味的関係 / semantic relation of words
第 1 著者 氏名(和/英) 山田 一郎 / Ichiro YAMADA
第 1 著者 所属(和/英) NHK放送技術研究所
Science and Technology Research Laboratories, Japan Broadcasting Corporation
第 2 著者 氏名(和/英) 宮崎 太郎 / Taro MIYAZAKI
第 2 著者 所属(和/英) NHK放送技術研究所
Science and Technology Research Laboratories, Japan Broadcasting Corporation
第 3 著者 氏名(和/英) 宮崎 勝 / Masaru MIYAZAKI
第 3 著者 所属(和/英) NHK放送技術研究所
Science and Technology Research Laboratories, Japan Broadcasting Corporation
第 4 著者 氏名(和/英) 三浦 菊佳 / Kikuka MIURA
第 4 著者 所属(和/英) NHK放送技術研究所
Science and Technology Research Laboratories, Japan Broadcasting Corporation
第 5 著者 氏名(和/英) 松井 淳 / Atsushi MATSUI
第 5 著者 所属(和/英) NHK放送技術研究所
Science and Technology Research Laboratories, Japan Broadcasting Corporation
第 6 著者 氏名(和/英) 田中 英輝 / Hideki TANAKA
第 6 著者 所属(和/英) NHK放送技術研究所
Science and Technology Research Laboratories, Japan Broadcasting Corporation
発表年月日 2015-02-05
資料番号 NLC2014-44
巻番号(vol) vol.114
号番号(no) 444
ページ範囲 pp.-
ページ数 6
発行日