GPGPU

CUDAコンパイラのバグその2

SDKをCUDA 3.0にしたら動かなくなったのでなんでかなーと思った結果。C++のnamespace中でtextureを宣言すると、カーネル起動やメモリ操作関連APIで"unspecified driver error"が発生する模様。Ref. http://forums.nvidia.com/index.php?showtopic=163545&pid…

Instruction throughputの意味

まだまだ続くCUDAねた。CUDAにはCUDA Visual Profilerという便利なものがありまして、メモリの使用帯域とか各カーネルごとの実行時間をお手軽に測定することができます。 で、こいつで測定できる項目の一つにinstruction throughputというのがあります。 直…

いろんなGeForceのdeviceQuery結果

手元にあるGeForceのdeviceQuery結果のメモ。 NVIDIA GeForce GT 240 ボードはhttp://www.palit.biz/main/vgapro.php?id=1284 Device 0: "GeForce GT 240" CUDA Driver Version: 3.0 CUDA Runtime Version: 2.30 CUDA Capability Major revision number: 1 C…

Texture Memoryとテンプレート

あけましておめでとうございます。またまたCUDAネタです。Texture Memoryは型変換や補間などけっこう便利なのですが、同一ファイル内でグローバル変数として宣言しなければならないなど、使用が非常に面倒です。 そして、どうにかして楽に使う方法はないかと…

Constant Memory

またまたCUDAの話です。CUDAには Host Memory Normal/Pinned/Mapped Device Memory Shared Memory Local Memory Texture Memory Constant Memory Registers と、メモリ階層がたくさんあります。このうちConstant MemoryはGPUからは読み出し専用ですがキャッ…

CUDAコンパイラの最適化バグ?

狙ってやっているわけではないのですが、四半期ぶりの日記です。ここ半年ばかりGPGPUを使った研究に取り組んでいて、なかなかすばらしい性能を出してくれています。 ところが、ある日コードを書いていると突然コンパイラが落ちるようになりました。 2>Compil…