大会名称
2016年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2016
発行日
2016-08-23
セッション番号
5D
セッション名
自然言語処理・応用
講演日
2016/09/08
講演場所(会議室等)
共通教育棟E棟4階E41
講演番号
E-008
タイトル
格フレームと日本語WordNetを用いた小説文中の登場人物抽出
著者名
加守田侑上野敦志田窪朋仁
キーワード
自然言語処理, 小説, 人物抽出, 格フレーム, 日本語WordNet
抄録
小説を理解する際に登場人物は重要な情報である.小説文中の人物名は小説固有の場合があるため辞書ベースで抽出することは難しい.本研究では登場人物は主語として現れると仮定する.また動詞には人物と係りやすいものがあると仮定し,その係りやすさを動詞ごとに格フレームと日本語WordNetを用いて動詞の人間関連度として算出しておく.登場人物を抽出する際には,小説に形態素解析・構文解析を行い,主語と対応する述語の動詞を取得する.主語の局所出現頻度と対応する述語の動詞の人間関連度の平均値を素性としてSVMで主語が登場人物かどうか識別する.提案手法の結果として適合率74.2%,再現率71.9%が得られた.
本文pdf
PDF download (433.5KB)