« SPU をベンチマーク(その2) | メイン | gcc で混合出力 »

SPU をベンチマーク(その3)

 とりあえず MFC の使い方だけ直して、約束通り 1 割改善。
 俺のテキトーな予想が当たってる。すげー。

  1. CELL 特有の処理を極力行わず、float 型を使い、最適化はコンパイラオプションに任せる。(870.21 ms)
  2. マルチコアに拡張する。(299.61 ms, 2.9 倍速くなった)
  3. いまここ→メモリフローを改善する。
  4. SIMD 化する。
  5. 大きくアンロールする。
  6. アセンブラでガリガリ。
SPU 4 個:

  SPU_4x4_C2.elf      735924440 clk,  0.69 clk/FP // 229.98 ms

 次は根本的にメモリの使い方を変える。

トラックバック

このエントリーのトラックバックURL:
http://yoffy.dyndns.org/cgi-bin/mt/mt-tb.cgi/540

コメントを投稿

About

2006年12月21日 19:05に投稿されたエントリーのページです。

ひとつ前の投稿は「SPU をベンチマーク(その2)」です。

次の投稿は「gcc で混合出力」です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。

Powered by
Movable Type 3.36