お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2018-02-17 10:30
専門分野の関連語抽出一手法
須永 聡齋藤鎮成宮尾 浩原田山人NTTNLC2017-50
抄録 (和) さまざまな情報検索において、関連語辞書が存在すれば、
検索語の連想展開やあいまい検索などに活用できるため有効である。
しかし、関連語辞書を人手により構築し更新する作業はコストがかかる。
そこで、電子化された文書ファイルから言葉の共起を用いて自動的に関連語を
抽出することに取り組んでいる。
共起による関連語抽出では、関連性の低いまたは関連性のない言葉(不正解
関連語)が抽出される問題と抽出されない正解関連語がある、二つの問題がある。
前者の問題に対しては、不正解関連語の特色を見出しそれらの除外によって
解決を図ることができるが、後者の問題は不正解関連語を除外する以前に、
正解関連語を含むように抽出して共起語数を増やす方策が必要であり先決である。
本稿では共起語の数を増やすための一手法として同義語・類義語からの共起による
関連語候補抽出方法を提案する。
実験による本提案手法の有効性および考察として抽出される正解関連語の範囲と
同義語・類義語の意味する範囲とに同様の関係性が表れることについて述べる。 
(英) In a variety of information retrieval, if a related term dictionary exists,
it is effective because it can be used for associative retrieval and fuzzy search.
However, it is costly to manually construct and update a related term dictionary.
Therefore, we are working on automatically extracting relevant words using
co-occurrence of words from document files.
In related word extraction by co-occurrence, there are two problems.
These problems are that unrelated or irrelevant words (incorrect related words)
are extracted and there are unextracted correct related words.
For the former problem, we are working on finding the features of incorrect
related words and solve them by excluding them.
However, the latter problem requires a strategy to increase the number of
cooccurrent words to be extracted so as to include correct related words
before excluding incorrect related terms.
In this paper, as a method to increase the number of co-occurring words,
we propose a method for extracting related word candidates by co-occurrence
from synonyms.
The effectiveness of the proposed method by experiment is shown.
In addition, as a consideration, we explain that similar relation appears
between the range of correct related words extracted and the range meaning
of synonyms.
キーワード (和) 全文検索 / 情報抽出 / 関連語 / 共起 / / / /  
(英) Full-text Search / Information Extraction / Related Terms / Co-occurrence / / / /  
文献情報 信学技報, vol. 117, no. 439, NLC2017-50, pp. 51-56, 2018年2月.
資料番号 NLC2017-50 
発行日 2018-02-09 (NLC) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード NLC2017-50

研究会情報
研究会 NLC IPSJ-IFAT  
開催期間 2018-02-16 - 2018-02-17 
開催地(和) ティーオージー会議室 
開催地(英) T.O.G. 
テーマ(和) 第12回 テキストアナリティクス・シンポジウム 
テーマ(英) The Twelveth Text Analytics Symposium 
講演論文情報の詳細
申込み研究会 NLC 
会議コード 2018-02-NLC-IFAT 
本文の言語 日本語 
タイトル(和) 専門分野の関連語抽出一手法 
サブタイトル(和)  
タイトル(英) A Method of Extracting Related Terms in a Specialty Area 
サブタイトル(英)  
キーワード(1)(和/英) 全文検索 / Full-text Search  
キーワード(2)(和/英) 情報抽出 / Information Extraction  
キーワード(3)(和/英) 関連語 / Related Terms  
キーワード(4)(和/英) 共起 / Co-occurrence  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 須永 聡 / Satoshi Sunaga / スナガ サトシ
第1著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
NTT Corporation (略称: NTT)
第2著者 氏名(和/英/ヨミ) 齋藤 鎮成 / Tsunenari Saitoh / サイトウ ツネナリ
第2著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
NTT Corporation (略称: NTT)
第3著者 氏名(和/英/ヨミ) 宮尾 浩 / Hiroshi Miyao / ミヤオ ヒロシ
第3著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
NTT Corporation (略称: NTT)
第4著者 氏名(和/英/ヨミ) 原田 山人 / Yamato Harada / ハラダ ヤマト
第4著者 所属(和/英) 日本電信電話株式会社 (略称: NTT)
NTT Corporation (略称: NTT)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2018-02-17 10:30:00 
発表時間 25分 
申込先研究会 NLC 
資料番号 NLC2017-50 
巻番号(vol) vol.117 
号番号(no) no.439 
ページ範囲 pp.51-56 
ページ数
発行日 2018-02-09 (NLC) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会