PLAYSTATION3 の PPU 上で 俺ベンチ を走らせてみた。某所に公開したことのあるプログラムなので、見られたらバレバレ。
今のところクロックは測れないので省略。
PS3Linux PPU 3.2GHz
simple 12700.00 ms
FPU_1x1_C 6568.00 ms
FPU_2x2_C 9124.00 ms
FPU_4x4_C 6384.00 ms
VEC_1x1_C 3076.00 ms
VEC_1x1_C2 3136.00 ms
VEC_4x4_C 852.00 ms
参考までに、メインマシンの Mac mini の結果も。
Mac mini PowerPC 7447A 1.25 GHz PC-3200
1 CPU, AltiVec, L1D: 32 KB, L2: 512 KB, size 1024, thread 1
simple 76895173710 clk, 71.61 clk/FP, 15039.97 ms
FPU_1x1_C 11274666120 clk, 10.50 clk/FP, 6254.00 ms
FPU_2x2_C 5048608200 clk, 4.70 clk/FP, 3911.44 ms
FPU_4x4_C 8116188600 clk, 7.56 clk/FP, 2664.54 ms
VEC_1x1_C 10175335530 clk, 9.48 clk/FP, 2156.44 ms
VEC_1x1_C2 3669114870 clk, 3.42 clk/FP, 2304.66 ms
VEC_4x4_C 1920377160 clk, 1.79 clk/FP, 897.42 ms
やってる事は 1024x1024 の単精度配列 2 つの行列積にかかる時間の計測で、いくつかのアルゴリズムを試している。
某スレで計測してもらった限りでは Core Duo で単純に CPU の数に比例して速くなる、割と素直なベンチマーク。
結果を見るに、Mac mini と互角という所だね。
PLAYSTATION3 に使われている Cell プロセッサの中には PPU が 1 つと SPU が 7 つ(うち Linux から使えるのは 6 つ)入っていて、PPU は SPU を束ねるだけのおまけだからもっと遅いかと思ったら、案外そうでも無かった。
もっともクロック数が Mac mini の倍あるので、Instructions Per Cycle は半分って事になるけど。