講演名 2011-05-20
距離マトリクス画像からの直線検出にもとづく電話会話ログ検索(ログ活用・情報検索,グループウェアとネットワーク,ライフログ活用技術,一般)
西 宏之, 木村 義政, 柿木 稔男, 井口 廉,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 電話は日常生活,社会生活に欠かすことができないコミュニケーションツールであるが,記録性が乏しく,テキスト情報のように検索することが困難であり,事後で発言の有無・内容が問題になるなどの問題点がある.また,従来の音声認識技術を用い,いったんすべての音声をテキスト情報に変換して蓄え,必要に応じてキーワード検索を行う方法も考えられるが,電話会話は読み上げ音声や講演音声のように言語モデルを構築することが難しく,良好な認識性能を確保することは容易でない.また,音声入力で検索を起動する場合,検索のために入力された音声をも認識する必要があり,2度の音声認識が成功する必要があるという点も不利である.本報告は,言語モデルを必要としないワードスポッティングの新しい枠組みとして提案した距離マトリクス画像からの直線検出手法を応用して,電話会話ログを検索するものである.従来法として連続DPを想定し,認識性能・処理時間を評価した.その結果,ほぼ同等の処理時間のもとで,認識性能を2%程度向上できることを示した.
抄録(英) Telephony is a necessary system for social and personal life. However, it is difficult to retrieve the conversations records, because the continuous speech recognition is not stable. Furthermore, continuous speech recognition requires the huge dictionary and the detailed language model. This report proposes a new method in order to realize telephone conversation log retrieval. The method is structured by distance matrix images(DMI) and the Hough transform of DMI. Important parameters are threshold values for binalizing of DMI and voting of Hough transfom. The merit of this method is not to need a dictionary and the detailed language model. This report shows that the recognition accuracy of the new method is 2% better than the conventinal word spotting method using continuous DTW.
キーワード(和) ライフログ / 電話 / 会話ログ / 音声認識 / ワードスポッティング
キーワード(英) life log / telephony / conversation log / speech recognition / word spotting
資料番号 LOIS2011-2
発行日

研究会情報
研究会 LOIS
開催期間 2011/5/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Life Intelligence and Office Information Systems (LOIS)
本文の言語 JPN
タイトル(和) 距離マトリクス画像からの直線検出にもとづく電話会話ログ検索(ログ活用・情報検索,グループウェアとネットワーク,ライフログ活用技術,一般)
サブタイトル(和)
タイトル(英) Telephone conversation retrieval using line detection method in distance matrix images
サブタイトル(和)
キーワード(1)(和/英) ライフログ / life log
キーワード(2)(和/英) 電話 / telephony
キーワード(3)(和/英) 会話ログ / conversation log
キーワード(4)(和/英) 音声認識 / speech recognition
キーワード(5)(和/英) ワードスポッティング / word spotting
第 1 著者 氏名(和/英) 西 宏之 / Hiroyuki Nishi
第 1 著者 所属(和/英)
Faculty of Information Sciences, Sojo University
第 2 著者 氏名(和/英) 木村 義政 / Yoshima Kimura
第 2 著者 所属(和/英)
/ /
第 3 著者 氏名(和/英) 柿木 稔男 / Toshio Kakinokiand
第 3 著者 所属(和/英)
第 4 著者 氏名(和/英) 井口 廉 / Ren Iguchi
第 4 著者 所属(和/英)
発表年月日 2011-05-20
資料番号 LOIS2011-2
巻番号(vol) vol.111
号番号(no) 50
ページ範囲 pp.-
ページ数 6
発行日