大会名称
2009年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2009
発行日
2009/8/20
セッション番号
5L
セッション名
HCI(6)
講演日
2009/09/03
講演場所(会議室等)
L会場(9号館3F 933教室)
講演番号
RJ-003
タイトル
表形式の言語資源からのメタデータの半自動生成
著者名
石松 昌展田仲 正弘石田 亨
キーワード
メタデータ抽出, 言語資源, 表
抄録
Web上に蓄積された対訳集や用語集といった表形式の言語資源をWebサービス化するために,言語資源から対訳などをメタデータとして抽出する.抽出のためには言語資源の表を解析する必要があるが,様々な形式の表に対応するために,人間によって与えられた例示に基づいて表を解析する手法を用いる.
しかしこの手法をそのまま用いるだけでは,解析の誤りや与えるべき例示の不明確さ等の問題があった.このため言語資源の持つ制約を利用して,解析の処理の改善や例示を行う際のインタラクションを実現した.
またWeb上に蓄積されている表形式の言語資源を用いて評価を行った.その結果,言語資源の制約を利用した場合,7割の表からメタデータを抽出することができた.
本文pdf
PDF download (1MB)