研究室めぐり

NEC情報メディア研究所信号処理研究部

情報メディア研究所信号処理研究部長 西谷 隆夫

1.はじめに
信号処理研究部の目標は極めて明確で、「あたかもその場にいるような臨場感にあふれるコミュニケーション環境の実現」にある。このためにはいきいきとした映像およびオーディオのディジタル化が必要となる。しかし、単なるディジタル化では膨大な情報量になり、ブロードバンドISDN の世界になっても回線容量はすぐにパンクする。特に回線容量に制約のある無線回線ではこの問題は大きい。このため、信号処理研究部の重要テーマはオーディオ、ビデオの圧縮符号化とそのハードウェア(LSI)に関する研究である。昨今、圧縮符号化はマルチメディアで活用され注目されだしたが、当部のルーツを探るとPCMの圧縮伸長や1960年代の衛星通信の高価なチャンネルコスト削減を目指した活動あたりにあり、歴史と伝統のある研究部である。しかし、部の成立は研究所内に分散していた活動を4年前に纏める形で新しく成立した。このため、部員の目的意識も明確になり、若くて明るい研究部として活躍している。以下、この研究部の伝統と現在の活動分野について紹介したい。

2.アルゴリズムとハード化の研究
多くの企業の研究所や研究部と比べて、当部の特徴はアルゴリズムとLSI関連の研究開発が同一部内に存在することであろう。当部成立以前からの経験として、ハードウェアの進歩がアルゴリズムの進歩を促し、また、アルゴリズムの進歩がハードウェア化を促していると認識しているからである。この伝統の契機となったのが15年以上前の2つの活動、世界初のDSP(信号処理プロセッサ)チップの開発とそれによる32kb/s ADPCM(適応差分PCM)の世界標準化、および、世界初の動き補償テレビ会議システムである。世界初のDSPチップはモデム等の電話信号処理に使う目的で開発した。プログラムで機能が変えられることから、衛星通信分野で要求されていたビット誤りに強く品質の良い独自のADPCM方式を開発しDSP化した。その成果により国際標準化活動に招かれ、我々のアイディアを盛り込んだ方式が成立した。この方式はPHS等で今も幅広く使われている。また、画像の符号化も衛星通信分野の応用から始まった。動き補償インターフレーム画像符号器である。画像のフレーム間相関を活用するパタンマッチング動き補償方式は以前から議論されていたが、演算量の余りの多さに理想論として諦められていた。これを妥当な演算規模で実現するアルゴリズムを開発しコンパクトなシステムにした。この方式とCLI杜の高速DCTの組合せがその後の通信の国際標準およびMPEG-1/2/4の圧縮に関する基本となった。
これらの事例は先進的市場において、ハードウェア化に対する工夫が大きな社会貢献に結びつくことを示している。古いハードウェアの枠に囚われているとアルゴリズムの進歩がなく、また、ハードウェアを無視したアルゴリズムでは活用されないため社会的インパクトは少ない。この認識が当部の伝統となった。

3.現在の活動
企業の研究者にとって、自分の研究した結果が製品となって社会に貢献できていることを肌身に感じることほど励みになるものはない。以上の伝統を引き継ぎ、標準化に採用される効果的なアルゴリズムと多くのユーザーを満足させうるハード化を狙い、研究者にはそれによって充実感を味わってもらいながら将来の夢の実現に向かって進むのが部の運営方針である。以下にその活動の一端をお知らせしたい。
3.1)音声・オーディオ
音声の符号化では音声を声帯振動と声道フィルタに分けて符号化する方式がある。当部も早くからこの方式を研究している。特に、伝送速度8kb/s 以下では声帯振動信号をインパルス列にまで単純化する検討を続けており、これからが楽しみである。オーディオ符号化ではMPEG-Audioへの貢献がある。心理的に聴きやすくする1方式が当部提案方式で、バックワードマスキングという名前を頂戴した。MPEG-2の拡張符号化であるAAC(アドバンストオーディオ符号化)符号化でも量子化符号を圧縮する部分で貢献できた。この領域の試作はDSPで行うのが通常であるため、アルゴリズム屋はDSPのエキスパートでもある。
3.2)ビデオ
ビデオの符号化では先に述べた国際標準化で伝統的な動き補償と符号量制御に関してこれまでにも積極的に貢献してきた。最近話題を集めているウェーブレット変換を用いた画像コーデックにも世界で初めて挑戦し、この滑らかな変換の効率を上げるために導入したオーバーラップ動き補償は一連の国際標準の中に入れられている。MPEG-4 では新たな流れとしてCGとビデオの融合が議論されており、この分野にも積極的な貢献をするべく担当者を派遣している。MPEG-2コーデックも ATM伝送時のシステム問題を解決して早くから開発を行い、現在はATM本来の特徴を生かした可変ビットレート方式を検討している。ネットワークの性質を考慮した研究は今後益々重要になろう。 MPEG-4でも今後の研究課題は映像内のオブジェクトを抽出して符号化するもので、CG融合と同時にネットワークヘの柔軟な対応を可能にすることである。
3.3)LSIプロセッサ
DSPでは4年前に事業部と共同で音声コーデック用のSPXシリーズを開発したが、低消費電力という特徴とソフトウェアの工夫で応用範囲を携帯端末用ビデオコーデックに広げている。当社オリジナのVシリーズRlSCのマルチメディア化アーキテクチャも守備範囲である。第1弾は乗算器内臓のV830であった。ソフトMPEG-1デコーダが実時間で走る。現在第2弾を開発中である。これらのソフト開発の経験から、特殊なアーキテクチャを持つDSPやRlSCには「アーキテクチャ・ドリブン・アルゴリズム」と言うべき演算手法が必要であることを明確にした。汎用のペンティアムと言えどもMMX化すると特殊アーキテクチャとなる。今までの経験とアルゴリズムの工夫により、MMXペンティアムでMPEG-1ソフトデコーダを作ったが、その能力は米国ベンチャー企業の製品より20%程高速に動いている。専用 LSIでは4年前からMPEG-1オーディオチップ、 MPEG-1AVデコーダ、と開発し、今年はMPEG-2 エンコーダの開発が終わった。30GOPSの演算能力を持つこのチップは早くて数年先と一般に議論されていたものである。部内の英知の結集と他の部や事業部の開発部門との連携でアーキテクチャとデバイス共に新しいアイディアを満載させて作り上げた。面白いのはこのようなチップが出来上がる毎に、自発的に携帯端末として纏めてもらっていることである。シリコン・オーディオとかシリコン・ビューという名称で、PCMCIAメモリーカードに圧縮符号を格納している。モーター等の機構部品が一切ないため、軽く、コンパクトにできる。評判はいいのだが今はメモリの価格がネックである。

おわりに
「臨場感あふれるコミュニケーション環境」を実現するテーマは尽きない。アルゴリズムとハードは表裏一体である。自発的に完成度の高いプロトタイプを作るカルチャーは今後も育成して行きたい。おかげで予算管理はいつも大変ではある。