Phenom X4 9850BE ベンチ
Phenom X4 9850BE ベンチ
最近いろいろとコンパイルする機会が多いのだが、マシンが遅くて仕方がないのでマシンを新調した。cpu は中古で買ったので 3 万円でおつりがきた。本当は一番速い PhenomII を買おうと思っていたのだが高いし AM3 にも対応していないのでやめておいた。
- 環境
ML115 G5
Phenom X4 9850BE @ 2.5GHz
DDR2 6400 4GB
debian lenny AMD64
- 処理内容
Debian lenny の linxu-source-2.6.26 を -jx の値を変更しつつコンパイル時間を測定した。
- 実行結果
-jなし single に対して 1.0 倍
phenom:/usr/src/linux-source-2.6.26# time make bzImage real 5m35.872s user 4m47.086s sys 0m38.734s
-j2 single に対して 2.0 倍
phenom:/usr/src/linux-source-2.6.26# time make -j2 bzImage real 2m42.724s user 4m33.233s sys 0m35.166s
-j4 single に対して 3.3 倍
phenom:/usr/src/linux-source-2.6.26# time make -j4 bzImage real 1m40.595s user 4m36.605s sys 0m35.618s
-j8 single に対して 3.8 倍
phenom:/usr/src/linux-source-2.6.26# time make -j8 bzImage real 1m28.049s user 4m38.657s sys 0m38.050s
-j12 single に対して 3.9 倍
phenom:/usr/src/linux-source-2.6.26# time make -j12 bzImage real 1m25.623s user 4m40.974s sys 0m38.370s
-j16 single に対して 3.9 倍
phenom:/usr/src/linux-source-2.6.26# time make -j16 bzImage real 1m25.207s user 4m42.166s sys 0m38.662s
- 考察
-j2 では core 数に対してリニアな性能が出ているが -j4 では期待値の 75% 程度しか性能が出ていない。-j4 を処理している場合は各 cpu 使用率が 80% 未満なので更にコンパイルプロセスを詰め込んだところ、core 数にリニアな結果が得られた。
Linux カーネルのコンパイルは明らかに SMP 向きの処理であるが、 core 数 * 3 個くらいはコンパイラを起動しないと効率が悪いようだ。必ずしも指定した数だけコンパイラが起動する訳ではないので、効率よく実行できるようにプロセス数の上限を排すような指定をすることが重要である。