講演名 2016-02-05
病院ブログ記事からの動詞対の抽出
竹内 希史(鳥取大), 徳久 雅人(鳥取大), 木村 周平(鳥取大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,病院ブログ記事コーパスから病院内の人々の行動について時間的順序関係の認められる動詞対を自動抽出する手法について提案する.抽出手法は,(a)パターンによる抽出手法,(b)確率言語モデルに基づく抽出手法,および,(c)主語の方向性に基づく抽出手法の3通りである.手法(a),(b)では動詞対の間の表現に対して,パターン,bi-gramによる制約条件をそれぞれ与えている.手法(c)では主語が「患者」よりか「医者」よりかという方向性により動詞の特徴を見出し,同一方向性の動詞の連続およびその動詞間の時間的推移を表す表現を条件としている.コーパスから条件を満たす動詞対を抽出することで順序関係のある動詞対を収集する.実験の結果,手法(c)が最も優れており,約50,000文のコーパスから正しい397件の動詞対を適合率0.353で抽出することができた.
抄録(英) This paper proposes three methods to extract pairs of verbs that mean time sequence of behaviors of people in the hospital from a corpus of blog entries about the hospital. The methods are (a) pattern-based extraction method, (b) probabilistic-model-based extraction method, and (c) subject-orientation-based extraction method. The method (a) and (b) use constraints to expressions between verb-pairs, in patterns and in bi-gram respectively. The method (c) uses constraints of both subjective semantic orientation of verbs (i.e. tends to patiant or doctor) and conjunctive expressions that mean time transition. These methods extract time sequential verb-pairs from the corpus by those constraints. As the results of experiments, the method (c) outperforms the methods (a) and (c) with extracting 397 corretcj pairs (precision = 0.353) from about 50,000 sentences in the corpus.
キーワード(和) テキストマイニング / 行動分析 / 順序関係 / 主語の方向性
キーワード(英) text mining / behavior analysis / order relation / semantic orientation
資料番号 NLC2015-50
発行日 2016-01-28 (NLC)

研究会情報
研究会 NLC
開催期間 2016/2/4(から2日開催)
開催地(和) キャンパスプラザ京都
開催地(英) Campus Plaza Kyoto
テーマ(和) 第8回テキストマイニング・シンポジウム
テーマ(英) 8th Text Mining Symposium
委員長氏名(和) 竹内 孔一(岡山大)
委員長氏名(英) Koichi Takeuchi(Okayama Univ.)
副委員長氏名(和) 金山 博(日本IBM) / 市瀬 眞(NTTドコモ)
副委員長氏名(英) Hiroshi Kanayama(IBM) / Makoto Ichise(NTT DoCoMo)
幹事氏名(和) 榊 剛史(東大/ホットリンク) / 渡辺 靖彦(龍谷大)
幹事氏名(英) Takeshi Sakaki(Univ. of Tokyo/Hottolink) / Yasuhiko Watanabe(Ryukoku Univ.)
幹事補佐氏名(和) 嶋田 和孝(九工大) / 東中 竜一郎(NTT)
幹事補佐氏名(英) Kazutaka Shimada(Kyushu Inst. of Tech.) / Ryuichiro Higashinaka(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication
本文の言語 JPN
タイトル(和) 病院ブログ記事からの動詞対の抽出
サブタイトル(和)
タイトル(英) Extracting Pairs of Verbs from Blog Entries about Hospital
サブタイトル(和)
キーワード(1)(和/英) テキストマイニング / text mining
キーワード(2)(和/英) 行動分析 / behavior analysis
キーワード(3)(和/英) 順序関係 / order relation
キーワード(4)(和/英) 主語の方向性 / semantic orientation
第 1 著者 氏名(和/英) 竹内 希史 / Kifumi Takeuchi
第 1 著者 所属(和/英) 鳥取大学(略称:鳥取大)
Tottori University(略称:Tottori Univ.)
第 2 著者 氏名(和/英) 徳久 雅人 / Masato Tokuhisa
第 2 著者 所属(和/英) 鳥取大学(略称:鳥取大)
Tottori University(略称:Tottori Univ.)
第 3 著者 氏名(和/英) 木村 周平 / Shuhei Kimura
第 3 著者 所属(和/英) 鳥取大学(略称:鳥取大)
Tottori University(略称:Tottori Univ.)
発表年月日 2016-02-05
資料番号 NLC2015-50
巻番号(vol) vol.115
号番号(no) NLC-445
ページ範囲 pp.35-39(NLC),
ページ数 5
発行日 2016-01-28 (NLC)