講演抄録/キーワード |
講演名 |
2010-08-05 15:35
発話前後の単語出現頻度と語順の関係 ○近藤公久(NTT)・山下裕子(ロチェスター工科大) TL2010-23 |
抄録 |
(和) |
本稿では,日本語話し言葉コーパス[国立国語研究所&情報通信研究機構,2004]中の同一話者の発話内に出現する単語の頻度を計算し,その頻度とその発話内で発声される文の語順との関係を解析した結果を報告する.対象とした文型は,場所を示す格助詞「に」を伴う節(LOC節)と,対象を示す格助詞「を」を伴う節(ACC節)の両方が出現する文であった.解析には混合効果ロジットモデルを用いた.ACC節が先に発話される確率pACCに対し,両節に含まれる単語の中で最高頻度語がどこに現れるかを指標としたところ,pACCはACC節内のいずれかの場所に最高頻度語が存在するかどうか(maxany)によって影響を受け,最高頻度語がACC節に存在する場合にpACCが有意に上昇する.しかし,ACC節の先頭が最高頻度かどうか(maxfirst)やACC節の主要名詞部が最高頻度かどうか(maxhead)によってはpACCは有意な影響を受けなかった.日本語は文法上の制約が小さいために様々な語順で発話することが許される.本結果は,頻度が高く思いつきやすい(accessible)語を含む節から発話する有意な傾向を示すだけでなく,その頻度が高く思いつきやすい語が節内のどの位置に出現するかには依存しないことを示唆する. |
(英) |
Using the Corpus of Spontaneous Japanese (CSJ), we investigated the correlation between word frequency and phrase orders in Japanese. The Locative sentences with a ni-marked Locative phrase (LOC) and an Accusative-marked argument (ACC) were extracted from the conference presentation portion of CSJ. We counted how frequently each word appeared within each speaker’s presentation. For the analyses the mixed-effects logit model was employed. The probability of ACC uttered before LOC, pACC, was used as the dependent variable. Three independent variables were used: (a) ‘maxany’, whether or not the highest frequency word in the two phrases appeared anywhere in ACC, (b) ‘maxhead’, whether or not the head noun of ACC was most frequent, and (c) ‘maxfirst’, whether or not the first content word of ACC was most frequent. Among three independent variables, only the contribution of ‘maxany’ was significant even when the length variable was used simultaneously (p < .05). The significant contribution of ‘maxany’ suggests that the phrase containing the highest frequency word is uttered ahead of other phrases in the sentence, but the word is not necessarily in a particular grammatical position such as the head or the phrase-initial word. |
キーワード |
(和) |
文産出 / 語順 / 単語頻度 / 節長 / / / / |
(英) |
Sentence Production / Word Order / Word Frequency / Phrase Length / / / / |
文献情報 |
信学技報, vol. 110, no. 163, TL2010-23, pp. 71-76, 2010年8月. |
資料番号 |
TL2010-23 |
発行日 |
2010-07-29 (TL) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
TL2010-23 |