講演名 2013-12-13
HMMを用いた運筆音からの手書き数字認識(一般セッション,事象の監視・検出・解析,安全・安心社会の実現,若手からの情報発信)
北野 真示, 西野 隆典, 成瀬 央,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々の周囲には,音声や楽音など,聞いて何らかの情報を取得可能な音信号がある一方で,一般的には意味を持だない雑音として識別される音も多く存在する.しかし,打音検査による構造物診断や,足音による歩行者の推定など,雑音の発生の仕組みに依存した音響特性をもとに,その要因を探る試みが多く行われている.本報告では,文字を記述する際に発生する運筆音に着目し,この音信号を用いて,どのような文字が記述されたかを認識する検討を行った.認識対象として0から9までの手書き数字10種類を用い,隠れマルコフモデルによる認識器により認識実験を行った.被験者9名(右利き8名,左利き1名)が記述した手書き数字を用いて,利き手の違い,および認識に用いる特徴量の違いを対象として,認識率の変化を調査した.実験の結果,利き手を区別せずに認識を行った場合は,右手のみの学習・認識を行った場合よりも認識率が低く,利き手に応じた認識モデルが必要であることが示唆された.また,特徴量として用いたメル周波数ケプストラムの次数を変化させた場合,0から6次までを用いた場合が認識率が高く,高次成分を利用せずとも認識が可能であることが示された.
抄録(英) There are acoustic signals such as speech and music which have some information, and noises which are meaningless sound also exist. Many studies and technologies which use acoustical features included in the noise, for example crack detection and estimating a walker with footsteps, were proposed and examined. In this paper, we examine recognition of handwritten digits from writing sounds by using a Hidden Markov Model (HMM). These digits were written by nine subjects. We examined differences of recognition rate by changing a dominant hand and features for HMM. Since the recognition rates when writing sounds of right hand were only used are superior to the model which was trained with both hands, the recognition model for each dominant hand is needed. Moreover, the lower orders of mel frequency cepstrum coefficient is effective to improve the recognition rate.
キーワード(和) 運筆音 / 手書き数字認識 / 隠れマルコフモデル / HTK
キーワード(英) Writing sound / Handwritten digit recognition / Hidden Markov Model / HTK
資料番号 PRMU2013-88
発行日

研究会情報
研究会 PRMU
開催期間 2013/12/5(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) HMMを用いた運筆音からの手書き数字認識(一般セッション,事象の監視・検出・解析,安全・安心社会の実現,若手からの情報発信)
サブタイトル(和)
タイトル(英) Handwritten digit recognition from writing sound using HMM
サブタイトル(和)
キーワード(1)(和/英) 運筆音 / Writing sound
キーワード(2)(和/英) 手書き数字認識 / Handwritten digit recognition
キーワード(3)(和/英) 隠れマルコフモデル / Hidden Markov Model
キーワード(4)(和/英) HTK / HTK
第 1 著者 氏名(和/英) 北野 真示 / Sinji KITANO
第 1 著者 所属(和/英) 三重大学大学院工学研究科
Graduate School of Engineering, Mie University
第 2 著者 氏名(和/英) 西野 隆典 / Takanori NISHINO
第 2 著者 所属(和/英) 三重大学大学院工学研究科
Graduate School of Engineering, Mie University
第 3 著者 氏名(和/英) 成瀬 央 / Hiroshi NARUSE
第 3 著者 所属(和/英) 三重大学大学院工学研究科
Graduate School of Engineering, Mie University
発表年月日 2013-12-13
資料番号 PRMU2013-88
巻番号(vol) vol.113
号番号(no) 346
ページ範囲 pp.-
ページ数 5
発行日