講演抄録/キーワード |
講演名 |
2012-08-31 14:40
クエリと説明文の関係を表す記述要素辞書の構築 ○久保木武承・山本和英(長岡技科大) NLC2012-22 |
抄録 |
(和) |
我々は以前「ある話題語について検索したとき、得られた文章が話題語についてのどのような内容を説明しているかを推定する」という問題を設定した。例えば「ローパスフィルタ」ならば「機能」「副作用」「設計方法」などの語があり得る。これらの語を記述要素と呼ぶ。本稿ではこの記述要素の辞書をIPADIC中の73006語の名詞群から人手判定し、構築した。記述要素は「話題語と文の関係を表す名詞」であり、ここでは当該名詞が満たすべき、また満たすべきでない性質を明らかにした。性質はそれぞれ話題語の性質を表す包含性、話題語の説明に文が続くかを表す文接続性、その名詞が話題語とは異なる具体的事物を示す実在性、説明が固有名詞や名詞のリストであり文にはならないことを表す固有性、話題語についての説明であれば大部分を拾ってしまう抽象性、説明文に特徴がないことを示す非安定性の6つが存在する。結果「工程」のような記述要素の核となる基本要素1664語、記述要素の後に続く説明文が特定のキーワードを持たない「影響」のような語を含む非安定要素222語、「概要」のように話題語の説明であれば大部分を含んでしまう抽象要素140語、「着衣」のような話題語と結びついて複合語として新たな話題語になってしまい関係名にならない語である具体要素47語が得られた。また副産物として、純粋に属性と呼べる語が持つべき性質を明らかにした。 |
(英) |
We present a new dictionary of relation names between theme and sentence. We call the relation name to descriptive element. We extract 1664 descriptive elements from 73006 nouns in IPADIC that is Japanese words dictionary by manually. Descriptive Elements are judged about the 6 property which are inclusion, sentence connection, substantiality, fixing, abstraction, stability. |
キーワード |
(和) |
辞書構築 / 属性抽出 / 関係抽出 / / / / / |
(英) |
Building Dictionary / Attribute Extraction / Relation Extraction / / / / / |
文献情報 |
信学技報, vol. 112, no. 196, NLC2012-22, pp. 67-72, 2012年8月. |
資料番号 |
NLC2012-22 |
発行日 |
2012-08-23 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2012-22 |