講演抄録/キーワード |
講演名 |
2018-02-17 10:30
専門分野の関連語抽出一手法 ○須永 聡・齋藤鎮成・宮尾 浩・原田山人(NTT) NLC2017-50 |
抄録 |
(和) |
さまざまな情報検索において、関連語辞書が存在すれば、
検索語の連想展開やあいまい検索などに活用できるため有効である。
しかし、関連語辞書を人手により構築し更新する作業はコストがかかる。
そこで、電子化された文書ファイルから言葉の共起を用いて自動的に関連語を
抽出することに取り組んでいる。
共起による関連語抽出では、関連性の低いまたは関連性のない言葉(不正解
関連語)が抽出される問題と抽出されない正解関連語がある、二つの問題がある。
前者の問題に対しては、不正解関連語の特色を見出しそれらの除外によって
解決を図ることができるが、後者の問題は不正解関連語を除外する以前に、
正解関連語を含むように抽出して共起語数を増やす方策が必要であり先決である。
本稿では共起語の数を増やすための一手法として同義語・類義語からの共起による
関連語候補抽出方法を提案する。
実験による本提案手法の有効性および考察として抽出される正解関連語の範囲と
同義語・類義語の意味する範囲とに同様の関係性が表れることについて述べる。 |
(英) |
In a variety of information retrieval, if a related term dictionary exists,
it is effective because it can be used for associative retrieval and fuzzy search.
However, it is costly to manually construct and update a related term dictionary.
Therefore, we are working on automatically extracting relevant words using
co-occurrence of words from document files.
In related word extraction by co-occurrence, there are two problems.
These problems are that unrelated or irrelevant words (incorrect related words)
are extracted and there are unextracted correct related words.
For the former problem, we are working on finding the features of incorrect
related words and solve them by excluding them.
However, the latter problem requires a strategy to increase the number of
cooccurrent words to be extracted so as to include correct related words
before excluding incorrect related terms.
In this paper, as a method to increase the number of co-occurring words,
we propose a method for extracting related word candidates by co-occurrence
from synonyms.
The effectiveness of the proposed method by experiment is shown.
In addition, as a consideration, we explain that similar relation appears
between the range of correct related words extracted and the range meaning
of synonyms. |
キーワード |
(和) |
全文検索 / 情報抽出 / 関連語 / 共起 / / / / |
(英) |
Full-text Search / Information Extraction / Related Terms / Co-occurrence / / / / |
文献情報 |
信学技報, vol. 117, no. 439, NLC2017-50, pp. 51-56, 2018年2月. |
資料番号 |
NLC2017-50 |
発行日 |
2018-02-09 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2017-50 |
研究会情報 |
研究会 |
NLC IPSJ-IFAT |
開催期間 |
2018-02-16 - 2018-02-17 |
開催地(和) |
ティーオージー会議室 |
開催地(英) |
T.O.G. |
テーマ(和) |
第12回 テキストアナリティクス・シンポジウム |
テーマ(英) |
The Twelveth Text Analytics Symposium |
講演論文情報の詳細 |
申込み研究会 |
NLC |
会議コード |
2018-02-NLC-IFAT |
本文の言語 |
日本語 |
タイトル(和) |
専門分野の関連語抽出一手法 |
サブタイトル(和) |
|
タイトル(英) |
A Method of Extracting Related Terms in a Specialty Area |
サブタイトル(英) |
|
キーワード(1)(和/英) |
全文検索 / Full-text Search |
キーワード(2)(和/英) |
情報抽出 / Information Extraction |
キーワード(3)(和/英) |
関連語 / Related Terms |
キーワード(4)(和/英) |
共起 / Co-occurrence |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
須永 聡 / Satoshi Sunaga / スナガ サトシ |
第1著者 所属(和/英) |
日本電信電話株式会社 (略称: NTT)
NTT Corporation (略称: NTT) |
第2著者 氏名(和/英/ヨミ) |
齋藤 鎮成 / Tsunenari Saitoh / サイトウ ツネナリ |
第2著者 所属(和/英) |
日本電信電話株式会社 (略称: NTT)
NTT Corporation (略称: NTT) |
第3著者 氏名(和/英/ヨミ) |
宮尾 浩 / Hiroshi Miyao / ミヤオ ヒロシ |
第3著者 所属(和/英) |
日本電信電話株式会社 (略称: NTT)
NTT Corporation (略称: NTT) |
第4著者 氏名(和/英/ヨミ) |
原田 山人 / Yamato Harada / ハラダ ヤマト |
第4著者 所属(和/英) |
日本電信電話株式会社 (略称: NTT)
NTT Corporation (略称: NTT) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2018-02-17 10:30:00 |
発表時間 |
25分 |
申込先研究会 |
NLC |
資料番号 |
NLC2017-50 |
巻番号(vol) |
vol.117 |
号番号(no) |
no.439 |
ページ範囲 |
pp.51-56 |
ページ数 |
6 |
発行日 |
2018-02-09 (NLC) |