講演名 | 2011-11-30 6万語彙実時間連続音声認識のための40nm,144mW音声認識専用プロセッサの開発(高速デジタルLSI回路技術,デザインガイア2011-VLSI設計の新しい大地-) 菅原 隆伸, 何 光霽, 藤永 剛史, 宮本 優貴, 野口 紘希, 和泉 慎太郎, 川口 博, 吉本 雅彦, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本研究では,6万語彙の実時間連続音声認識の実現を目指すために新たなアーキテクチャを設計した.提案アーキテクチャでは,音声認識に特化したキャッシュ,言語モデルの粗密探索,閾値カットの導入,GMM演算とViterbi演算の2ステージパイプラインの導入,GMM演算の50先読み・高並列化を行った.その結果,必要メモリ帯域を97.94%削減し,70.86MB/sの低メモリ帯域を達成することが出来た.また,必要動作周波数を78%削減し126.5MHzで6万語彙実時間音声認識を行うことが出来た.尚,今回の試作では,40nmCMOSプロセスで試作を行い,ロジック部分が1.9Mトランジスタ,内部メモリが7.8Mbitとなっている.この試作チップを測定した結果,126.5MHz,1.1Vの条件下で144mWもの低消費電力で動作することが分かった. |
抄録(英) | We have developed a low power VLSI chip for 60k-word real-time continuous speech recognition based on HMM(Hidden Markov Model). Our implementation includes a cache architecture using the locality of speech recognition, beam pruning using dynamic threshold, two-stage language model searching highly parallel Gaussian Mixture Model (GMM) computation based on mixture level, Variable 50 frames look-ahead scheme and elastic pipeline operation between Viterbi transition and GMM processing. Results show that our implementation achieves 97.94% bandwidth reduction (70.86MB/s) and 78% required frequency reduction (126.5MHz) for 60k-word real-time continuous speech recognition. The test chip has been fabricated in 40nm CMOS technology and occupies 2.2mm X 2.5mm containing 1.9M transistors for logic and 7.8 Mbit on-chip memory. Measured data show 144mW power consumption at 126.5MHz and 1.1V. |
キーワード(和) | 40nm VLSI / 隠れマルコフモデル(HMM) / 大語彙連続音声認識システム(LVCSR) |
キーワード(英) | 40nm VLSI / Hidden Markov Model (HMM) / large vocabulary continuous speech recognition (LVCSR) |
資料番号 | CPM2011-164,ICD2011-96 |
発行日 |
研究会情報 | |
研究会 | CPM |
---|---|
開催期間 | 2011/11/21(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Component Parts and Materials (CPM) |
---|---|
本文の言語 | JPN |
タイトル(和) | 6万語彙実時間連続音声認識のための40nm,144mW音声認識専用プロセッサの開発(高速デジタルLSI回路技術,デザインガイア2011-VLSI設計の新しい大地-) |
サブタイトル(和) | |
タイトル(英) | A 40nm 144mW VLSI Processor for Realtime 60k Word Continuous Speech Recognition |
サブタイトル(和) | |
キーワード(1)(和/英) | 40nm VLSI / 40nm VLSI |
キーワード(2)(和/英) | 隠れマルコフモデル(HMM) / Hidden Markov Model (HMM) |
キーワード(3)(和/英) | 大語彙連続音声認識システム(LVCSR) / large vocabulary continuous speech recognition (LVCSR) |
第 1 著者 氏名(和/英) | 菅原 隆伸 / Takanobu SUGAHARA |
第 1 著者 所属(和/英) | 神戸大学大学院システム情報学研究科 Graduate School of System Informatics, Kobe University |
第 2 著者 氏名(和/英) | 何 光霽 / Guangji HE |
第 2 著者 所属(和/英) | 神戸大学大学院システム情報学研究科 Graduate School of System Informatics, Kobe University |
第 3 著者 氏名(和/英) | 藤永 剛史 / Tsuyoshi FUJINAGA |
第 3 著者 所属(和/英) | 神戸大学大学院システム情報学研究科 Graduate School of System Informatics, Kobe University |
第 4 著者 氏名(和/英) | 宮本 優貴 / Yuki MIYAMOTO |
第 4 著者 所属(和/英) | 神戸大学大学院システム情報学研究科 Graduate School of System Informatics, Kobe University |
第 5 著者 氏名(和/英) | 野口 紘希 / Hiroki NOGUCHI |
第 5 著者 所属(和/英) | 神戸大学大学院システム情報学研究科 Graduate School of System Informatics, Kobe University |
第 6 著者 氏名(和/英) | 和泉 慎太郎 / Shintaro IZUMI |
第 6 著者 所属(和/英) | 神戸大学大学院システム情報学研究科 Graduate School of System Informatics, Kobe University |
第 7 著者 氏名(和/英) | 川口 博 / Hiroshi KAWAGUCHi |
第 7 著者 所属(和/英) | 神戸大学大学院システム情報学研究科 Graduate School of System Informatics, Kobe University |
第 8 著者 氏名(和/英) | 吉本 雅彦 / Masahiko YOSHIMOTO |
第 8 著者 所属(和/英) | 神戸大学大学院システム情報学研究科 Graduate School of System Informatics, Kobe University |
発表年月日 | 2011-11-30 |
資料番号 | CPM2011-164,ICD2011-96 |
巻番号(vol) | vol.111 |
号番号(no) | 326 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |