講演名 | 2015-02-05 上位下位関係からのインスタンス集合の獲得(第6回テキストマイニング・シンポジウム) 山田 一郎, 宮崎 太郎, 宮崎 勝, 三浦 菊佳, 松井 淳, 田中 英輝, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 大規模のテキストから情報抽出を行う際、あるクラスに属するインスタンス集合のデータが有用となる。例えば、「病気」と「薬」のクラスに属するインスタンス集合があれば、それらの単語の文中共起を手掛かりとして特定の病気に効く薬を抽出することができる。既存のシソーラスでは十分な量のインスタンスが登録されておらず、また、WikipediaのクラスなどのWeb上のリソースをそのまま利用するとノイズが大量に含まれてしまう。本稿では、Wikipediaから抽出したノイズの含まれる上位下位関係を利用して、任意のクラスに対するインスタンス集合を大規模かつ高精度に獲得する手法を提案する。獲得したインスタンス集合を利用した単語間意味的関係獲得実験についても報告する。 |
抄録(英) | Class-instance relation is useful for information extraction from large volume of text. For example, we can determine which medicine is effective for a sickness by co-occurrence information of instances of medicine and sickness. It is possible to acquire instances of a class from a legacy thesaurus but sufficient amount of instance is not registered in such extracted from Wikipedia and contain some error relations. We can acquire a large volume of instances with higher accuracy by using two kinds of noise reduction approaches. We report a semantic relation acquisition using automatically extracted class-instance relations. |
キーワード(和) | インスタンス獲得 / 上位下位関係 / 意味的関係 |
キーワード(英) | Class-instance acquisition / hyponymy relation / semantic relation of words |
資料番号 | NLC2014-44 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2015/1/29(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 上位下位関係からのインスタンス集合の獲得(第6回テキストマイニング・シンポジウム) |
サブタイトル(和) | |
タイトル(英) | Class-Instance Acquisition using Automatically Extracted Hyponymy Relations |
サブタイトル(和) | |
キーワード(1)(和/英) | インスタンス獲得 / Class-instance acquisition |
キーワード(2)(和/英) | 上位下位関係 / hyponymy relation |
キーワード(3)(和/英) | 意味的関係 / semantic relation of words |
第 1 著者 氏名(和/英) | 山田 一郎 / Ichiro YAMADA |
第 1 著者 所属(和/英) | NHK放送技術研究所 Science and Technology Research Laboratories, Japan Broadcasting Corporation |
第 2 著者 氏名(和/英) | 宮崎 太郎 / Taro MIYAZAKI |
第 2 著者 所属(和/英) | NHK放送技術研究所 Science and Technology Research Laboratories, Japan Broadcasting Corporation |
第 3 著者 氏名(和/英) | 宮崎 勝 / Masaru MIYAZAKI |
第 3 著者 所属(和/英) | NHK放送技術研究所 Science and Technology Research Laboratories, Japan Broadcasting Corporation |
第 4 著者 氏名(和/英) | 三浦 菊佳 / Kikuka MIURA |
第 4 著者 所属(和/英) | NHK放送技術研究所 Science and Technology Research Laboratories, Japan Broadcasting Corporation |
第 5 著者 氏名(和/英) | 松井 淳 / Atsushi MATSUI |
第 5 著者 所属(和/英) | NHK放送技術研究所 Science and Technology Research Laboratories, Japan Broadcasting Corporation |
第 6 著者 氏名(和/英) | 田中 英輝 / Hideki TANAKA |
第 6 著者 所属(和/英) | NHK放送技術研究所 Science and Technology Research Laboratories, Japan Broadcasting Corporation |
発表年月日 | 2015-02-05 |
資料番号 | NLC2014-44 |
巻番号(vol) | vol.114 |
号番号(no) | 444 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |