講演名 2007-01-23
単語の出現区間推定を利用した物語構造の抽出(情報抽出,特集「Web情報処理」及び一般)
藤井 崇介, 土井 晃一郎, 山本 章博,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究は単語の出現特性を利用し,物語中のいくつかの場面を取り出してストーリを表現することが目標である.物語全体を[0,1]区間とし,各単語にはそれが影響を与える区間を持つと仮定する.この区間のことを本研究では影響区間と呼び,区間推定を用いることで求める.影響区間を用いて[0,1]区間内の閉区間をクラスタリングし,各クラスタを一つの場面と推定する.クラスタリングの適切さは,クラスタ全体を人間に与えたときに物語の再生が行われることによって検証する.ここで物語の再生とは,単語リストの提示により,ユーザが物語のストーリを思い出すことを意味する.
抄録(英) The goal of this research is to extract "stories" from narratives, where we define a story as the abstract structure that each narrative has. A story consists of some scenes and we express every scene with occurrences of keywords. We assume that each word has its own interval where it influences the whole story, and we estimate the interval in a statistic method. Using the intervals, we select affective keywords and cluster them for representing scenes. We verify the clustering by showing the keywords to subjects and asking them to recall the story.
キーワード(和) キーワード抽出 / 影響区間モデル / 区間推定 / 物語構造
キーワード(英) Keyword Extraction / Influence Interval Model / Interval Estimation / Narrative Structure
資料番号 KBSE2006-62
発行日

研究会情報
研究会 KBSE
開催期間 2007/1/16(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 JPN
タイトル(和) 単語の出現区間推定を利用した物語構造の抽出(情報抽出,特集「Web情報処理」及び一般)
サブタイトル(和)
タイトル(英) Extracting Structure of Narratives by Interval Estimation
サブタイトル(和)
キーワード(1)(和/英) キーワード抽出 / Keyword Extraction
キーワード(2)(和/英) 影響区間モデル / Influence Interval Model
キーワード(3)(和/英) 区間推定 / Interval Estimation
キーワード(4)(和/英) 物語構造 / Narrative Structure
第 1 著者 氏名(和/英) 藤井 崇介 / Shusuke FUJII
第 1 著者 所属(和/英) 京都大学 大学院情報学研究科
Graduate School of Informatics, Kyoto University
第 2 著者 氏名(和/英) 土井 晃一郎 / Kouichiro DOI
第 2 著者 所属(和/英) 京都大学 大学院情報学研究科
Graduate School of Informatics, Kyoto University
第 3 著者 氏名(和/英) 山本 章博 / Akihiro YAMAMOTO
第 3 著者 所属(和/英) 京都大学 大学院情報学研究科
Graduate School of Informatics, Kyoto University
発表年月日 2007-01-23
資料番号 KBSE2006-62
巻番号(vol) vol.106
号番号(no) 473
ページ範囲 pp.-
ページ数 6
発行日