| ▼My Specs |
 |
| - .rian |
| - 2x才、男 |
| - ダメ社会人 |
| - オタ && ダメ人間 |
|
Renewal 2006.6.19
|
|
|
|
■2007年02月25日(日)
PS3 Cell SPEの性能は?つづき
|
前回の続きです。
さて前回は、SPE単体で使用するには、 > 姫野ベンチは、使用する配列が多いのでダメでしたorz と書きましたが、気づいたですよ。 問題サイズを小さくすれば、使用する配列の数も減るなと。
で、試してみたですよ。 従来のSサイズは65x65x129。で、これはコンパイルできなかった。 で、SSサイズ(33x33x65)でやってみるもダメ。 で、更に1ランクしたのを勝手に加えてみた。 サイズは17x17x33。これでもダメ。 更に減らして9x9x17。で、無事に通った。
で、動かしてみると、7534MFLOPSとか出た。 マックスハートありえなーい
ちなみに姫野ベンチは最初に、3ループさせてそのMFLOPSから、 1分位回るループ回数を算出し、MFLOPSを計測し直します。
で、3ループでは、773MFLOPSというそれっぽい値が出てます。 どこか間違えてるのは明白。
結論から言えば、SPEの時間計測に用いるSPU Decrementerの計測限界のせい。 実際にSPU Decrementerで計測できる時間は、 SPU Decrementerのレジスタが32bit、で、PS3 Cellのtimebaseは79,800,000。 つまり、4,294,967,295÷79,800,000≒53.82秒までしか計測できないですよ。
実際の動作時間は、60秒弱だからカウンタが一回りしちゃってるのね。 で、予め一回りしたていで時間を計算するとバッチリそれっぽい値。 ついでに、元々単精度な姫野ベンチを倍精度に置き換えて実行。
※括弧内はループ回数3のとき ※実行環境は前回に同じ
■SPE単体(サイズ: 9x9x17) 単精度: 773.30 (773.01) 倍精度: 376.48 (376.40)
■PPE(サイズ: 9x9x17) 単精度: 568.43 (375.00) 倍精度: 499.52 (288.81)
■PPE(サイズ: S) 単精度: 315.32 (303.73) 倍精度: 201.45 (178.30)
まず問題なのが、問題サイズ9x9x17はアリなの? PPEでの結果が、大きくズレているのですが。。。 正直、ポアッソン方程式とか言われてもわかりませんしねぇ。。。
今回の結果が正しい値とすると、PPEよりSPEのが速い結果って感じがしますね。 前回の結果とあわせると、単純な流れでただ計算させるだけなら速いけど、 複雑になると、パイプラインの深さや投機実行がなかったりで、苦手だよってことかしら。
で、できれば今回使ったソースを公開したいところだけど、 姫野ベンチのライセンスがどうなっているのかわからないので、公開は保留で。 そんな大層なものでもないし、問題サイズの値と時間計測のとこ変更するだけだから。 | | |
|
■2007年02月23日(金)
PS3 Cell SPE の性能は?
|
最近存在をすっかり忘れていましたが、PS3ネタを再開です。
これまでは、CellのPPE上でのベンチマークをやってきましたが、 そろそろ本命のSPEに対してベンチマークをやってやろうです。
まずは、SPE単体の性能がどの程度か知りたいですよね。
Cellでばんばってみたログでは、Lameのエンコード速度を公開されています。 PPEは3倍速なのに対して、SPEは8倍速。SPEが大きく勝つという結果です。
と言うわけで、俺もSPE上でベンチマークを走らせようかと。 でもSPE上では、time.hをはじめ従来の時間計測ができないという罠。
まずは、SPE上での時間計測の仕方から始めました。 SPEでの時間計測は、SPU Decrementerってのを使うようです。 それが何かというのは、↓の東芝のページをどうぞ。 https://www.cellusersgroup.com/modules/feature/co_tutorial/decrementer.php
で、プログラム例の解説には、例によってフィックスターズのページをどうぞ。 http://cell.fixstars.com/pukiwiki/index.php?lesson12
試しに作ってみたプログラム http://rian.s26.xrea.com/file/stime.c 動かし方は、 $ spu-gcc stime.c -o stime $ ./stime (Libspeの環境とElfspeがインストールされていることが条件)
さて、次に実際に移植をするわけですが、 SPE単体で動かす前提ですので、メインメモリは使えません。 256KBのローカルストアに収まるプログラムである必要があります。 収まらない場合、コンパイル時に怒られます。 姫野ベンチは、使用する配列が多いのでダメでしたorz
で、とりあえづ、Dhrystoneのコンパイルが通りました。 早速動かしてみましたよ。DMIPSの値は、
PPE: 1864.849 SPE: 1398.563
ぉ、SPEのが遅い。LameだとSPEのが速かったじゃん!! きっと自分が書いた時間計測が間違えているんだ。 そう思ったね。で、無駄な入出力を省いて、timeコマンドで実時間を計測。
PPE: 5.809[sec] SPE: 7.787[sec]
やっぱり、SPEのが遅い。。。 得意不得意な命令のせいかな。もう少し、調べてみる価値はありそう。 ちなみに、2GHzのPen4のDMIPSが1695くらい。
今回のDhrystoneの実行環境は、 Dhrystone Ver. 2.1 gcc Ver. 4.1.0 spu-gcc Ver. 4.1.1 最適化オプション -O3 ループ回数 20,000,000
で、SPU用に手を加えたDhrystoneも置いておきます。 http://rian.s26.xrea.com/file/dhryspu.tgz ライセンスは、元のDhrystoneのライセンスに依存ってことで。
動かし方は、 $ make $ ./dhry21 < input
こんなことやる暇あったら就活のためにSPIとか勉強した方が良いのかなぁ | | |
|
■2007年02月20日(火)
Microsoft Virtual PC 2007 リリース
| |
| |
|
■2007年02月17日(土)
The AMC Opera
| |
| |
|
■2007年02月15日(木)
スイッチングハブについておもったこと
|
スイッチングハブのポートが足りない。。。 そろそろ、安物じゃなくて高性能なスイッチが欲しくなってきた。 で、調べ始めると、これまではなんとなくこんな意味だろうって思い込んでた意味は正しいのかなと疑問に。 軽く調べてみたので、備忘録。
■レイヤ2スイッチ(L2スイッチ)とレイヤ3スイッチ(L3スイッチ) レイヤって何のレイヤかなと。 答えは、そのまんまOSI参照モデルのレイヤでした。 つまり、普通のスイッチはL2スイッチにあたり、 ルータ的な機能を有するとL3スイッチになるわけです。 ハード的に処理するのはL3スイッチ、ソフト的に処理するとルータと分類するらしい。
■インテリジェントスイッチとノンインテリジェントスイッチ 様々な付加機能を有して、LANやシリアルからリモート管理できるものがインテリジェント。 この時のプロトコルは、SNMP、TELNET、SSHが主。
■1000BASE-BX10 通信速度が1000Mbpsのメタルケーブルが1000BASE-Tや対応製品を見たことが無い1000BASE-CX。 光ケーブルだと1000BASE-SXや1000BASE-LX。 てことまでは知ってたけど、BXって普段見ない規格だなぁと。 1000BASE-BX10は、光ケーブルで動作距離が10kmなのだとか。 Cisco独自規格の1000BASE-ZXと同じようにWAN向けの規格かなと。
動作距離の比較については、↓のCiscoのページの表1をどうぞ。 http://www.cisco.com/jp/product/hs/ifmodule/sfps/prodlit/csffpgic_ds.shtml
で、やっぱりCiscoのが欲しくなるわけで、1000BASE-Tが10個前後は欲しい。 となると、Cisco Catalyst Express 500G-12TC(WS-CE500G-12TC)あたりがマッチ。 でも、定価262,500円だってさ。実売価格も20万弱。参考(1,2) ・・・手がでねぇorz
参考 通信用語の基礎知識 http://www.wdic.org/ Wikipedia http://ja.wikipedia.org/ | | |
|
■2007年02月12日(月)
昨日はサンクリに参加
|
 | PCの上に座ってご飯食べるようになりました。 部屋がゴチャゴチャし過ぎで困ってます、片付ける暇がありません。
最近は、就活とかサンクリ参加とかで地味に忙しいです。。。 で、サンクリでは、ペンギン娘のスク水iPodケースをゲトー
サンクリ後、池袋とらのあな、アキバのとらのあなとメロンブックス寄って来たけど、どこもペンギン娘の単行本品切れだった。スゴイね。 | | |
|
■2007年02月05日(月)
気になった更新 1
| |
| |
|
■2007年02月04日(日)
FDD変えました
|
 | メインマシンのFDDを変えました。
元々は↓の3モードFDD(玄人志向FDD-YE)を使ってました。

当初は、3モードFDDが必要でそのFDDを選らんだわけですが、 アイボリーって色がケースに合わないってのと、 今はもうPC-98のFDDを読むことがなくなったってのと、 カードリーダも内臓させたいといった理由からこの度載せ変えました。
ちなみに、3モードって言うのはですね、 通常のFDDは2モードと呼ばれる2HD(1.4MB)と2DD(720KB)ってフロッピに対応してますが、 更にPC-98のフロッピにも対応したのが3モードと呼ばれています、日本では。 海外では、2HD、2DDそして2EDに対応したものが3モードと呼ばれるそうです。 2EDの容量は2.88MBだったけども、日本で流行らなかったそうです。
で、FDDとカードリーダを備えた、3.5インチのドライブを探したわけです。 条件は、色は黒かシルバー、 FDDはUSB接続でなくFDD用のATAみたいな接続なヤツ、 カードはSDやMSはもちろんのことxDにも対応してること。
以上よりアキバで探すと、3000円くらいでOwltech FA404MXを見つけました。
xDのTypeHや、SDHC(限定的だけども)に対応と満足ゆく対応状況。 とゆーわけで、現在満足して使ってます。無事に好調です。 でも、フロッピの取り出しボタンを押すと、勢いよくフロッピが飛んでくwww | | |
|
■2007年02月01日(木)
wizpy 発売日決定
|
ターボリナックスから発売される、手のひらサイズのパソコンwizpy。 発売日が2月23日に決まり、予約受付も開始になりました。
手のひらサイズのパソコンと銘打っているけども、 実際は多機能なマルチメディアプレイヤって感じかな。
マルチメディアプレイヤとしては、 ・動画再生(DivXもいける) ・音声再生(OGG、MP3、WMA) ・音声録音(MP3録音) ・FMラジオ ・静止画、テキスト表示 といった機能を搭載。OGGとWMA再生できるのはデカイね。
で、もう一つの主な機能として、 TurboLinuxを搭載してるってこと。 wizpyをUSB接続したPC上で、wizpyに格納されてるLinuxを起動できるとのこと。 ライヴCDみたいなことができるってことだと思う。 特徴は、そのLinuxの環境をいじれるってことらしい。
さて、2月23日に発売されるのは、初回限定版のホワイト。 通常版のブラックは、3月9日から発売されるそうです。
とゆーわけで、俺は黒出たら買おうかなって思ってます。 つか、今月は金なくって。。。
オフィシャルページ http://www.turbolinux.co.jp/products/wizpy/ | | |
|
|