講演抄録/キーワード |
講演名 |
2018-01-27 16:05
文の構造的指標に基づく分かりにくい文の分類方法の検討 ○大野博之(東京医療保健大)・稲積宏誠(青学大) ET2017-88 |
抄録 |
(和) |
本研究は,文章指導の観点から,個々の文を対象とし,文の構造的特徴として,何が分かりにくさに影響を与えているのかを探るものである.そのために,まず語彙の難易度を定義する.次に,教科書コーパスの文と白書コーパスの文を語彙の難易度に合わせてグループ分けし,語彙の難易度を揃えたデータを作成する.そして,文の特徴を示すいくつかの指標値を計算する.この求めた指標値を使用し,グループごとにSupport Vector Machineによって分類を行い,どの指標が影響しているかを調べ,使用する指標を取捨選択する.こうして得られた指標を基に,教科書らしい文と白書らしい文を抽出し,その特徴を検討する. |
(英) |
In this paper, we investigate the cause of the unclear sentence by the structural features of the sentence.First of all, we define difficulty level of vocabulary.Next, group "textbook corpus" and "white paper corpus" according to the degree of difficulty of vocabulary.Then, several index values indicating the characteristics of sentences are calculated.Using this index value, classify by Support Vector Machine. Then, it examines which index is affecting and chooses the index to use.Based on the indices obtained in this way, determine Unclear sentences like white paper. |
キーワード |
(和) |
推敲 / 文の構造 / 読みやすさ / コーパス / / / / |
(英) |
Polishing / Sentence Construction / Readability / Corpus / / / / |
文献情報 |
信学技報, vol. 117, no. 421, ET2017-88, pp. 45-50, 2018年1月. |
資料番号 |
ET2017-88 |
発行日 |
2018-01-20 (ET) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ET2017-88 |