講演名 2018-06-29
オフライン手書き楽譜中の音楽記号の分類と音高認識の研究
早川 優木(三重大), 若林 哲史(三重大), 三宅 康二(三重大), 大山 航(九大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 手書き楽譜の自動認識(Optical Music Recognition, OMR)を実現するための課題は,五線の上に描かれた音楽記号の切り出し,記譜者毎に異なる音楽記号の形状,手書きによる音楽記号の間隔の変動,など多岐にわたる.本研究では,オフライン手書き楽譜画像中の音楽記号の分類および音高認識の手法を提案する.提案手法では,五線が除去された手書き楽譜画像を入力とし,音楽記号の分類,音符に対する音高認識を行う.音楽記号の分類処理では,五線除去後の楽譜画像に含まれる連結成分に対して加重方向指数ヒストグラム特徴を抽出し,識別関数に疑似ベイズ識別関数(MQDF)を用いて,計18クラスの音楽記号に分類する.音楽記号の認識処理では,音符を符頭,符幹,符尾の三部位に分割し,符頭の重心位置より音高を算出する.手書き楽譜のデータベースであるCVC-MUSCIMA databaseを用いた評価実験を行った結果,音楽記号の分類において90.2%の分類成功率,音高認識において88.9%の認識成功率が示された.
抄録(英) To realize automatic recognition of handwritten music score in Optical Music Recognition (OMR), there are many problems : trimming of notation on staff, variety of notation appearance among writers, difference of distance between music symbols, to be solved. We propose classification and recognition methods for music symbols from offline handwritten music scores. We perform classification of music symbols and pitch recognition to notes with offline handwritten music score which removed staff. In classification step, we extract feature using chain code histogram from connected component in score without staff and classify each component into 18 classes using Modified Quadratic Discriminant Function. In recognition step, we divide a note into notehead, flag and stem and decide pitch from centroid’s position of notehead. As result, Accuracy of 90.2% was obtained in music symbol classification and Accuracy of 88.9% was obtained in pitch recognition, in the evaluation experiment on the CVC-MUSCIMA database.
キーワード(和) 光学的楽譜読み取り / 手書き楽譜 / 加重方向指数ヒストグラム / 疑似ベイズ識別関数
キーワード(英) Optical Music Recognition / Handwritten Music Score / Chain Code Histogram / Modified Quadratic Discriminant Function
資料番号 PRMU2018-35,SP2018-15
発行日 2018-06-21 (PRMU, SP)

研究会情報
研究会 PRMU / SP
開催期間 2018/6/28(から2日開催)
開催地(和) 信州大学
開催地(英)
テーマ(和) マルチモーダル/クロスモーダルな認識、生成
テーマ(英)
委員長氏名(和) 佐藤 真一(NII) / 山下 洋一(立命館大)
委員長氏名(英) Shinichi Sato(NII) / Yoichi Yamashita(Ritsumeikan Univ.)
副委員長氏名(和) 井尻 善久(オムロン) / 玉木 徹(広島大) / 李 晃伸(名工大)
副委員長氏名(英) Yoshihisa Ijiri(Omron) / Toru Tamaki(Hiroshima Univ.) / Akinobu Ri(Nagoya Inst. of Tech.)
幹事氏名(和) 石井 雅人(NEC) / 菅野 裕介(阪大) / 南條 浩輝(京大) / 坂野 秀樹(名城大)
幹事氏名(英) Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.) / Hiroaki Nanjo(Kyoto Univ.) / Hideki Banno(Meijo Univ.)
幹事補佐氏名(和) 入江 豪(NTT) / 牛久 祥孝(東大) / 郡山 知樹(東工大) / 小橋川 哲(NTT)
幹事補佐氏名(英) Go Irie(NTT) / Yoshitaka Ushiku(Univ. of Tokyo) / Tomoki Koriyama(Tokyo Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Speech
本文の言語 JPN
タイトル(和) オフライン手書き楽譜中の音楽記号の分類と音高認識の研究
サブタイトル(和)
タイトル(英) Symbol Classification and Pitch Recognition in Offline Handwritten Musical Score
サブタイトル(和)
キーワード(1)(和/英) 光学的楽譜読み取り / Optical Music Recognition
キーワード(2)(和/英) 手書き楽譜 / Handwritten Music Score
キーワード(3)(和/英) 加重方向指数ヒストグラム / Chain Code Histogram
キーワード(4)(和/英) 疑似ベイズ識別関数 / Modified Quadratic Discriminant Function
第 1 著者 氏名(和/英) 早川 優木 / Yuki Hayakawa
第 1 著者 所属(和/英) 三重大学(略称:三重大)
Mie University(略称:Mie Univ.)
第 2 著者 氏名(和/英) 若林 哲史 / Tetsushi Wakabayashi
第 2 著者 所属(和/英) 三重大学(略称:三重大)
Mie University(略称:Mie Univ.)
第 3 著者 氏名(和/英) 三宅 康二 / Yasuji Miyake
第 3 著者 所属(和/英) 三重大学(略称:三重大)
Mie University(略称:Mie Univ.)
第 4 著者 氏名(和/英) 大山 航 / Wataru Ohyama
第 4 著者 所属(和/英) 九州大学(略称:九大)
Kyushu University(略称:Kyushu Univ.)
発表年月日 2018-06-29
資料番号 PRMU2018-35,SP2018-15
巻番号(vol) vol.118
号番号(no) PRMU-111,SP-112
ページ範囲 pp.73-77(PRMU), pp.73-77(SP),
ページ数 5
発行日 2018-06-21 (PRMU, SP)