講演名 2008/7/10
メールの文章における段落間の接続の強さの推定(コミュニケーション支援(テーマセッション3))
西村 涼, 大田 康人, 渡辺 靖彦, 村田 真樹, 岡田 至弘,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) メールの文章は他の文書なら改段落しない場合でも、「見やすさ」、「読みやすさ」を重視して改段落をする場合がある。こうした過剰で不要な段落わけは、メールの機械処理にとって問題である。そこで、メールの文章における段落間の接続の強さを機械学習によって推定する方法を提案し、過剰な段落わけを検出できることを示す。
抄録(英) In order to improve the readability, we often segment mail text into smaller paragraphs than necessary. However, this oversegmentation is a problem of e-mail text processing. In this paper, we proposed an estimation method of connectivity between paragraphs in mails using machiene learning technieques, and showed that paragraphs which should be one paragraph can be found by detecting strong connectivity.
キーワード(和) メール / 情報抽出 / 不要な段落わけ
キーワード(英) mail / information extraction / oversegmentation
資料番号 NLC2008-15
発行日

研究会情報
研究会 NLC
開催期間 2008/7/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) メールの文章における段落間の接続の強さの推定(コミュニケーション支援(テーマセッション3))
サブタイトル(和)
タイトル(英) Estimation of Connectivity between Paragraphs in Mails
サブタイトル(和)
キーワード(1)(和/英) メール / mail
キーワード(2)(和/英) 情報抽出 / information extraction
キーワード(3)(和/英) 不要な段落わけ / oversegmentation
第 1 著者 氏名(和/英) 西村 涼 / Ryo NISHIMURA
第 1 著者 所属(和/英) 龍谷大学大学院理工学研究科情報メディア学専攻
Ryukoku University Department of Media Informatics
第 2 著者 氏名(和/英) 大田 康人 / Yasuhito OOTA
第 2 著者 所属(和/英) TIS株式会社
TIS Inc.
第 3 著者 氏名(和/英) 渡辺 靖彦 / Yasuhiko WATANABE
第 3 著者 所属(和/英) 龍谷大学大学院理工学研究科情報メディア学専攻
Ryukoku University Department of Media Informatics
第 4 著者 氏名(和/英) 村田 真樹 / Masaki MURATA
第 4 著者 所属(和/英) 情報通信研究機構
National Institute of Information and Communications Technology
第 5 著者 氏名(和/英) 岡田 至弘 / Yoshihiro OKADA
第 5 著者 所属(和/英) 龍谷大学大学院理工学研究科情報メディア学専攻
Ryukoku University Department of Media Informatics
発表年月日 2008/7/10
資料番号 NLC2008-15
巻番号(vol) vol.108
号番号(no) 141
ページ範囲 pp.-
ページ数 6
発行日