大会名称
2009年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2009
発行日
2009/8/20
セッション番号
4E
セッション名
検索・分類
講演日
2009/09/03
講演場所(会議室等)
E会場(9号館1F 915教室)
講演番号
E-011
タイトル
構文解析を用いた日本語論文の読みやすさ判定法
著者名
山中 翔太山崎 高弘常盤 欣一朗長谷川 哲子
キーワード
文書分類, 読みやすさ, 日本語論文, 構文解析, SVM
抄録
近年,自然言語を対象とした文書分類に関する研究が盛んに行われている.
これまで分類方法や分類対象の違い,
あるいは評価基準などにより様々な手法が提案されている.
本研究では,日本語論文を対象として文書の読みやすさを基準とした,
新たな文書分類の判定方法の提案を行う.
読みやすさの判定方法は,文書中の語句の出現度合いなどの統計情報と
文章のつながりを考慮に入れた文書構造を利用して実現する.
構文解析を用いて読みやすさを評価することで,
人間に近い分類が行うことができると考えられる.
サポートベクターマシンを用いて分類を実行し,正しく評価できることを確認した.
本文pdf
PDF download (55.8KB)