講演名 1998/10/15
SIMD型マルチメディア命令を用いた並列Radix-4FFT
撫原 恒平, 宮崎 孝, 黒田 一朗,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 4並列SIMD命令を用い, 高速な4並列複素Radix-4FFTを実装し, 性能を評価したので報告する.各段のバタフライ演算において, 連続した4個の入力データを1個のレジスタにパックし, 同一のシグナル・フローに従って演算することにより, 4並列演算を行った.最終段のバタフライ演算では, 4要素毎に4個の入力データを1個のレジスタにパックすることで4並列演算を行った.提案手法を4並列SIMD命令セットを持つV830Rプロセッサへ適用した結果, 既存の実装例に比べクロック数を35%削減できた.正負対称丸めつき積和演算命令が, 誤差の低減に有効であることも示した.
抄録(英) In this report, an implementation and evaluation of the fast radix-4 complex FFT using 4-parallel SIMD instructions are presented. Four radix-4 butterflies are calculated in parallel following the same signal flow at all stages by loading consecutive 4 elements into a register. At the last stage, every 4 elements is packed into a register and calculated in parallel. The implementation result on the V830R processor, which has a 4-parallel SIMD-type multimedia instruction set, achieves 35% less clock count than the conventional inplementation. Multiply-accumulate instructions with symmetrical rounding introduced to the V830R processor are effective to maintain FFT accuracy.
キーワード(和) SIMD命令 / FFT / 高速フーリエ変換 / 丸め処理 / 誤差
キーワード(英) SIMD Instruction / FFT / Fast Fourier Transform / Rounding / Error
資料番号 DSP98-100, ICD98-187, CPSY98-102
発行日

研究会情報
研究会 CPSY
開催期間 1998/10/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Computer Systems (CPSY)
本文の言語 JPN
タイトル(和) SIMD型マルチメディア命令を用いた並列Radix-4FFT
サブタイトル(和)
タイトル(英) Parallel Radix-4 FFT Implementation Using SIMD Multimedia Instructions
サブタイトル(和)
キーワード(1)(和/英) SIMD命令 / SIMD Instruction
キーワード(2)(和/英) FFT / FFT
キーワード(3)(和/英) 高速フーリエ変換 / Fast Fourier Transform
キーワード(4)(和/英) 丸め処理 / Rounding
キーワード(5)(和/英) 誤差 / Error
第 1 著者 氏名(和/英) 撫原 恒平 / Kouhei NADEHARA
第 1 著者 所属(和/英) NEC C&Cメディア研究所
C&C Media Research Laboratories, NEC Corporation
第 2 著者 氏名(和/英) 宮崎 孝 / Takashi MIYAZAKI
第 2 著者 所属(和/英) NEC C&Cメディア研究所
C&C Media Research Laboratories, NEC Corporation
第 3 著者 氏名(和/英) 黒田 一朗 / Ichiro KURODA
第 3 著者 所属(和/英) NEC C&Cメディア研究所
C&C Media Research Laboratories, NEC Corporation
発表年月日 1998/10/15
資料番号 DSP98-100, ICD98-187, CPSY98-102
巻番号(vol) vol.98
号番号(no) 322
ページ範囲 pp.-
ページ数 8
発行日