講演名 2007/9/28
国語教科書コーパスを応用した日本語リーダビリティー構築のための基礎研究(言語理解のためのコーパスからの知識獲得)
柴崎 秀子, 沢井 康孝,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究は,日本語の文章のリーダビリティーを数式化することを目的とする。英語リーダビリティーでは,1文の文字数と1語の音節数のみが説明変数として使われている。本研究では,国語教科書(6学年×3種類)コーパスを作成し,学年を線形と仮定した上で,(1)1文の平均文字数,(2)1文の平均単語数,(3)1文の平均係り受け数,(4)1文の平均アイディアユニット数,(5)テキスト内の語種の割合,(6)テキスト内の文字種の割合を説明変数とし,学年を従属変数として重回帰分析を行った。その結果,(1),(2),(3)が除外され,(4),(5),(6)を説明変数とした公式が示された。
抄録(英) The aim of this research is to build a mathematical formula to measure readability of Japanese text. The length of a sentence or a word is applied as variables for English readability formula. Six factors were set as determining factors of Japanese readability in this study based on the corpus of language school textbooks : 1) average number of characters in a sentence, 2) average number of words in a sentence, 3) average number of dependency structures in a sentence, 4) average number of idea units in a sentence, 5)ratio of word types in a text, and 6) ratio of character types in a texts. After plotting an imaginary line through school grade levels based on data obtained from these methods, a linear multiple regression analysis was performed with variables 1) through 6)as the independent variables and school grade level as the dependent variable. As the result of this analysis, variables 1) through 3) were excluded and it was possible to build a formula using variables 4) through 6) to indicate how closely a given text approached the school grade level of elementary grade one through six.
キーワード(和) リーダビリティー / テキスト要因 / 国語教科書 / 文章理解
キーワード(英) Readability / Text Factors / Language School Textbooks / Reading Comprehension
資料番号 NLC2007-32
発行日

研究会情報
研究会 NLC
開催期間 2007/9/28(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 国語教科書コーパスを応用した日本語リーダビリティー構築のための基礎研究(言語理解のためのコーパスからの知識獲得)
サブタイトル(和)
タイトル(英) Study for Constructing a Readability Formula of Japanese Texts Using a Corpus of Language School Textbooks
サブタイトル(和)
キーワード(1)(和/英) リーダビリティー / Readability
キーワード(2)(和/英) テキスト要因 / Text Factors
キーワード(3)(和/英) 国語教科書 / Language School Textbooks
キーワード(4)(和/英) 文章理解 / Reading Comprehension
第 1 著者 氏名(和/英) 柴崎 秀子 / Hideko SHIBASAKI
第 1 著者 所属(和/英) 長岡技術科学大学教育開発系
General Education, Nagaoka University of Technology
第 2 著者 氏名(和/英) 沢井 康孝 / Yasutaka SAWAI
第 2 著者 所属(和/英) 長岡技術科学大学電気系
Electrical Engineering, Nagaoka University of Technology
発表年月日 2007/9/28
資料番号 NLC2007-32
巻番号(vol) vol.107
号番号(no) 246
ページ範囲 pp.-
ページ数 6
発行日