大会名称 |
---|
2017年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2017 |
発行日 |
2017-09-05 |
セッション番号 |
4D |
セッション名 |
自然言語処理・基礎 |
講演日 |
2017/09/13 |
講演場所(会議室等) |
2号館3階 231号講義室 |
講演番号 |
E-011 |
タイトル |
表記ゆれの補正と雑音除去による新聞から構築した概念ベースの精錬 |
著者名 |
山口周平, 岸本達也, 土屋誠司, 渡部広一, |
キーワード |
概念ベース, 表記ゆれ, 新聞記事 |
抄録 |
機械と人が円滑なコミュニケーションを行うためには人間が持つある語から別の語を連想する機能が必要であると考えられる.この機能を実現するためにある語を概念と定義し,属性と重みの対の集合で表現している概念ベースが存在する.しかし,この概念ベースは辞書が情報源であったため,流行語や時事用語などが含まれていなかった。一方で,新聞記事を情報源とし共起を用いて,流行語や時事用語を保持した概念ベースを構築する手法が提案されている.しかし,この手法で構築された概念ベースでは表記ゆれや雑音が考慮されていなかった.そこで,本稿では辞書を用いた表記ゆれの補正およびidfを用いた概念の属性の除去を行った. |
本文pdf |
PDF download (713KB) |