Phenom X4 9850BE ベンチ

Phenom X4 9850BE ベンチ

最近いろいろとコンパイルする機会が多いのだが、マシンが遅くて仕方がないのでマシンを新調した。cpu は中古で買ったので 3 万円でおつりがきた。本当は一番速い PhenomII を買おうと思っていたのだが高いし AM3 にも対応していないのでやめておいた。

  • 環境

ML115 G5
Phenom X4 9850BE @ 2.5GHz
DDR2 6400 4GB
debian lenny AMD64

  • 処理内容

Debian lenny の linxu-source-2.6.26 を -jx の値を変更しつつコンパイル時間を測定した。

  • 実行結果

-jなし single に対して 1.0 倍

phenom:/usr/src/linux-source-2.6.26# time make bzImage
real    5m35.872s
user    4m47.086s
sys     0m38.734s

-j2 single に対して 2.0 倍

phenom:/usr/src/linux-source-2.6.26# time make -j2 bzImage
real    2m42.724s
user    4m33.233s
sys     0m35.166s

-j4 single に対して 3.3 倍

phenom:/usr/src/linux-source-2.6.26# time make -j4 bzImage
real    1m40.595s
user    4m36.605s
sys     0m35.618s

-j8 single に対して 3.8 倍

phenom:/usr/src/linux-source-2.6.26# time make -j8 bzImage
real    1m28.049s
user    4m38.657s
sys     0m38.050s

-j12 single に対して 3.9 倍

phenom:/usr/src/linux-source-2.6.26# time make -j12 bzImage
real    1m25.623s
user    4m40.974s
sys     0m38.370s

-j16 single に対して 3.9 倍

phenom:/usr/src/linux-source-2.6.26# time make -j16 bzImage
real    1m25.207s
user    4m42.166s
sys     0m38.662s
  • 考察

-j2 では core 数に対してリニアな性能が出ているが -j4 では期待値の 75% 程度しか性能が出ていない。-j4 を処理している場合は各 cpu 使用率が 80% 未満なので更にコンパイルプロセスを詰め込んだところ、core 数にリニアな結果が得られた。

Linux カーネルコンパイルは明らかに SMP 向きの処理であるが、 core 数 * 3 個くらいはコンパイラを起動しないと効率が悪いようだ。必ずしも指定した数だけコンパイラが起動する訳ではないので、効率よく実行できるようにプロセス数の上限を排すような指定をすることが重要である。