講演抄録/キーワード |
講演名 |
2016-09-08 10:35
機械学習による万葉集・古今和歌集の識別と歌人の年代推定 ○野口和久(九大)・相場 亮(芝浦工大)・廣川佐千男(九大) NLC2016-14 |
抄録 |
(和) |
万葉集と古今和歌集は日本を代表する和歌集である。二つの和歌集は成立の背景が違うだけでなく、内容 や表現にも多くの違いがあることが文学的な研究により知られている。本稿では、各和歌に現れている単語によって、 万葉集と古今和歌集を機械的に識別可能かどうか調べた。さらに、与えられた和歌が万葉集か、古今和歌集かを識別するだけでなく、作成年代の推定を試みた。具体的には、歌人の年代をその歌人が作った和歌から推定できるか検討した。まず万葉集を正例、古今和歌集を負例として機械学習の SVM を適用してモデルを構築し、60 個の単語で 86%以上の識別性能を確認した。さらに、このモデルを各歌人が作った和歌の文書集合に適用し、その歌人の万葉らしさを数値として求めた。生年あるいは没年などの時代が分っている歌人について、その歌人の年代 y とその歌人の万葉らしさ x の相関を調べ、相関が確認でき、年代推定の y = -2.37477*x + 805.6495 という回帰式を得ることができた。 |
(英) |
Manyo-Shu and Kokinwaka-Shu are famous anthologies of Japanese poetry (Waka-Shu). They have different background and different compilation history. It is well known that they have many different features such as contents and rhetoric. This paper consider the discrimination of the two Waka-Shu by applying machine learning method SVM (support vector machine). Moreover, this paper proposes to use the predicted score (SVM score) of poetry for dating a poet. We confirmed that 60 feature words are enough to gain 86% prediction performance. We obtained a regression formula y = -2.37477 * x + 805.6495 to guess the year y of a poet whose SVM score is x. |
キーワード |
(和) |
機械学習 / SVM / 属性撰択 / 和歌 / 万葉集 / 古今和歌集 / 年代推定 / |
(英) |
Machine Learning / SVM / Feature Selection / WAKA / Mannyo-shu / Kokin-shu / Dating / |
文献情報 |
信学技報, vol. 116, no. 213, NLC2016-14, pp. 7-11, 2016年9月. |
資料番号 |
NLC2016-14 |
発行日 |
2016-09-01 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2016-14 |