« CellSDK 1.1 の pre defined macro | メイン | PPU をベンチマーク(その2) »

PPU をベンチマーク

 PLAYSTATION3 の PPU 上で 俺ベンチ を走らせてみた。某所に公開したことのあるプログラムなので、見られたらバレバレ。
 今のところクロックは測れないので省略。

PS3Linux PPU 3.2GHz


  simple        12700.00 ms
  FPU_1x1_C      6568.00 ms
  FPU_2x2_C      9124.00 ms
  FPU_4x4_C      6384.00 ms
  VEC_1x1_C      3076.00 ms
 VEC_1x1_C2      3136.00 ms
  VEC_4x4_C       852.00 ms

 参考までに、メインマシンの Mac mini の結果も。

Mac mini PowerPC 7447A 1.25 GHz PC-3200


1 CPU, AltiVec, L1D: 32 KB, L2: 512 KB, size 1024, thread 1
  simple            76895173710 clk, 71.61 clk/FP, 15039.97 ms
  FPU_1x1_C         11274666120 clk, 10.50 clk/FP,  6254.00 ms
  FPU_2x2_C          5048608200 clk,  4.70 clk/FP,  3911.44 ms
  FPU_4x4_C          8116188600 clk,  7.56 clk/FP,  2664.54 ms
   VEC_1x1_C        10175335530 clk,  9.48 clk/FP,  2156.44 ms
  VEC_1x1_C2         3669114870 clk,  3.42 clk/FP,  2304.66 ms
   VEC_4x4_C         1920377160 clk,  1.79 clk/FP,   897.42 ms

 やってる事は 1024x1024 の単精度配列 2 つの行列積にかかる時間の計測で、いくつかのアルゴリズムを試している。
 某スレで計測してもらった限りでは Core Duo で単純に CPU の数に比例して速くなる、割と素直なベンチマーク。

 結果を見るに、Mac mini と互角という所だね。
 PLAYSTATION3 に使われている Cell プロセッサの中には PPU が 1 つと SPU が 7 つ(うち Linux から使えるのは 6 つ)入っていて、PPU は SPU を束ねるだけのおまけだからもっと遅いかと思ったら、案外そうでも無かった。
 もっともクロック数が Mac mini の倍あるので、Instructions Per Cycle は半分って事になるけど。

トラックバック

このエントリーのトラックバックURL:
http://yoffy.dyndns.org/cgi-bin/mt/mt-tb.cgi/529

コメントを投稿

About

2006年12月11日 00:40に投稿されたエントリーのページです。

ひとつ前の投稿は「CellSDK 1.1 の pre defined macro」です。

次の投稿は「PPU をベンチマーク(その2)」です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。

Powered by
Movable Type 3.37