講演名 2017-06-10
汎用性を志向したWikipediaエントリへの拡張固有表現付与
水木 栄(ホットリンク), 榊 剛史(ホットリンク),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,Wikipedia記事の見出し語に対して細粒度の固有表現ラベルを付与する課題に取り組む.ただし本研究では,任意の語に対する固有表現ラベルの付与を志向するため,Wikipedia記事の構造に特有ではなく,平文コーパスにおいても獲得可能な情報を利用する手法を提案する.具体的には,見出し語およびその疑似的な上位語の分散表現を特徴量として,マルチタスク学習によりマルチラベル分類を行う手法である.実験の結果,提案手法は既存研究を若干上回るF値を実現できることを確認した.また複数の擬似的な上位語を獲得して特徴量に追加することにより,分類性能が向上可能であることを示した.
抄録(英) In this research, we develop a classification method that assigns fine-grained named entity labels to entries of Wikipedia articles. An essential part of our classification method is the general-purpose orientation so that it can be applied not only Wikipedia articles but also any entity that is not listed in Wikipedia. To achieve that, we propose a method that does not utilize the features that are intrinsically specific to the structure of Wikipedia articles. Specifically, our proposed method uses the distributed representation of both article title and its pseudo hypernym. Experiment result shows that our proposed method yields a slightly better performance compared to the previous research. It also shows that performance can be improved by taking multiple pseudo hypernyms as an additional feature.
キーワード(和) 拡張固有表現 / Wikipedia / マルチタスク学習
キーワード(英) Extended Named Entity / Wikipedia / Multi-Task Learning
資料番号 TL2017-9,NLC2017-9
発行日 2017-06-02 (TL, NLC)

研究会情報
研究会 NLC / TL
開催期間 2017/6/9(から2日開催)
開催地(和) 鳥取大学
開催地(英) Tottori University
テーマ(和) 言語処理・言語分析の社会応用,および一般
テーマ(英) Application of natural language proessing and linguistic analysis, and general topic of NLP
委員長氏名(和) 金山 博(日本IBM) / 鈴木 雅実(KDDI総合研究所)
委員長氏名(英) Hiroshi Kanayama(IBM) / Masami Suzuki(KDDI Research)
副委員長氏名(和) 榊 剛史(ホットリンク) / 嶋田 和孝(九工大) / 近藤 公久(工学院大) / 久保村 千明(山野美容芸術短大)
副委員長氏名(英) Takeshi Sakaki(Hottolink) / Kazutaka Shimada(Kyushu Inst. of Tech.) / Tadahisa Kondo(Kogakuin Univ.) / Chiaki Kubomura(Yamano College of Aesthetics)
幹事氏名(和) 渡辺 靖彦(龍谷大) / 東中 竜一郎(NTT) / 森下 美和(神戸学院大) / 坪田 康(京大)
幹事氏名(英) Yasuhiko Watanabe(Ryukoku Univ.) / Ryuichiro Higashinaka(NTT) / Miwa Morishita(Kobe Gakuin Univ.) / Yasushi Tsubota(Kyoto Univ.)
幹事補佐氏名(和) 吉田 光男(豊橋技科大) / 小早川 健(NICT) / 神長 伸幸(早大) / 高田 明典(フェリス女学院大)
幹事補佐氏名(英) Mitsuo Yoshida(Toyohashi Univ. of Tech.) / Takeshi Kobayakawa(NICT) / Nobuyuki Jincho(Waseda Univ.) / Noriaki Takada(Ferris Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication / Technical Committee on Thought and Language
本文の言語 JPN
タイトル(和) 汎用性を志向したWikipediaエントリへの拡張固有表現付与
サブタイトル(和)
タイトル(英) General-Purpose Oriented Extended Named Entity Labeling of Wikipedia Entries
サブタイトル(和)
キーワード(1)(和/英) 拡張固有表現 / Extended Named Entity
キーワード(2)(和/英) Wikipedia / Wikipedia
キーワード(3)(和/英) マルチタスク学習 / Multi-Task Learning
第 1 著者 氏名(和/英) 水木 栄 / Sakae Mizuki
第 1 著者 所属(和/英) 株式会社ホットリンク(略称:ホットリンク)
Hotto Link Inc.(略称:HTL)
第 2 著者 氏名(和/英) 榊 剛史 / Takeshi Sakaki
第 2 著者 所属(和/英) 株式会社ホットリンク(略称:ホットリンク)
Hotto Link Inc.(略称:HTL)
発表年月日 2017-06-10
資料番号 TL2017-9,NLC2017-9
巻番号(vol) vol.117
号番号(no) TL-81,NLC-82
ページ範囲 pp.47-52(TL), pp.47-52(NLC),
ページ数 6
発行日 2017-06-02 (TL, NLC)