講演抄録/キーワード |
講演名 |
2011-03-04 16:50
VOD講義に対する係り受けや格構造解析による短縮法 ○則本達哉・羅 毅剛・小山 登・椎名広光・北川文夫(岡山理科大) ET2010-145 |
抄録 |
(和) |
教育システムとして,e-Learningの利用が増加している.その中でもスライドと動画をVODで配信する講義や自主学習システムが利用されてきている.特に,現状のシステムではパワーポイントと映像のみを表示していることが多い. そのため,日本語を母国語としない留学生などの利用者には映像からの音だけでは話題の理解が難しいと考えられる.また,字幕を話者の話す速さで表示するシステムにおいても,同様に理解が難しいと考えられる.本研究では,字幕内の重要単語の強調法と字幕の表示量を削減手法について提案する. 重要語の算出には、TF・IDFの文書区間を字幕の前後の区間として用い、各字幕内の上位何単語を強調するべきかを評価した.一方、文短縮手法については,係り受け解析を行い、TF・IDF値から文節ごとに評価値を付け,評価値の低い文節を削除することで文短縮を行った.また,重文や複文については表層語からの文分割や格構造によりTF・IDF値の低い箇所を削除する手法を提案する. |
(英) |
Recently, a use of e-Learning system increases on Internet and Intranet.
In particular, VOD learning systems with slides and videos have been
used for self-learning and lectures.
Therefore, for foreign students who are non-native Japanese language, we consider that understanding
of topics is difficult only by slides and sounds.
In this study, we propose emphasis of important words and sentence contraction of subtitles in the VOD learning system.
In particular, for calculation of important words, we use
the documentary section of TF-IDF as the place around the subtitles,
we evaluated the number of words that it should emphasize.
On the other hand, we analyze dependency relation and evaluate every phrase by TF-IDF for sentence contraction, and we delete the low phrase of the evaluate value. In addition, we propose methods to delete a case structure with low TF-IDF value using the sentence division from the surface word and case structure to compound sentences and complex sentences. |
キーワード |
(和) |
字幕短縮 / TF・IDF / 係受け解析 / 格構造 / / / / |
(英) |
Constracted subtitles / TF・IDF / Depedency analisys / ase structure / / / / |
文献情報 |
信学技報, vol. 110, no. 453, ET2010-145, pp. 305-310, 2011年3月. |
資料番号 |
ET2010-145 |
発行日 |
2011-02-25 (ET) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ET2010-145 |