Vista(x64)でCuda2.0Betaがなかなか動かない

コンパイルするとエラーになる。
基本、SDK,TOOLKIT,CUDA対応ドライバーをインストールして環境変数をせっとすればコンパイルできるようになるのだが
WinXPマシンに入れて、エミュレートではコンパイルできたのだが、
肝心のGeForceを入れているVista(x64)マシンでうまく行かん。
ネットのサンプルや解説ブログのほとんどは、XPで32bit版で、CUDA1.1あたりだと思われるんで、あまり情報がない。
もうVistaをやめてWinXPをインストールした方が早いかもしれない。

C:\misaki2>nvcc cudatest.cu
cudatest.cu
cudatest.cu(7) : warning C4003: マクロ 'CUT_DEVICE_INIT' に指定された実引数の数
が少なすぎます。
cudatest.cu(7): error: expected an expression

cudatest.cu(7): error: type name is not allowed

cudatest.cu(7): error: expected an expression

3 errors detected in the compilation of "C:\Users\user\AppData\Local\Temp/tmpxft
_00000b60_00000000-6_cudatest.cpp1.ii".


ちなみにサンプル

C:\misaki2>type cudatest.cu
//cudatest.cu
#include <iostream>
#include <cutil.h>
int main( int argc, char** argv)
{
    //デバイスの初期化
    CUT_DEVICE_INIT();
    //デバイス(通常はビデオカードの数)を取得
    int numofdev;
    CUDA_SAFE_CALL(cudaGetDeviceCount(&numofdev));

    //デバイスの数だけループを回してプロパティを取得
    for (int n = 0; n < numofdev; n++)
    {
        //プロパティを格納する構造体
        cudaDeviceProp devprop;
        //n番目のデバイスのプロパティを取得
        CUDA_SAFE_CALL(cudaGetDeviceProperties(&devprop, n));
        //n番目のデバイスの表示
        cout<<n+1<<"番目のデバイスのプロパティ"<<endl;
        cout<<"デバイス名:"<<devprop.name<<endl;
        cout<<"グローバルメモリの合計値:"<<devprop.totalGlobalMem/1024/1024<<" M
B"<<endl;
        cout<<"各ブロックに割り当てられる最大シェアードメモリ:"<<devprop.sharedM
emPerBlock/1024<<" KB"<<endl;
        cout<<"各ブロックのレジスタ数:"<<devprop.regsPerBlock<<endl;
        cout<<"ワープサイズ:"<<devprop.warpSize<<endl;
        cout<<"メモリピッチ:"<<devprop.memPitch<<endl;
        cout<<"1ブロックあたりの最大スレッド数:"<<devprop.maxThreadsPerBlock<<en
dl;
        cout<<"ブロックの最大次元:("<<devprop.maxThreadsDim[0]<<","<<devprop.max
ThreadsDim[1]<<","<<devprop.maxThreadsDim[2]<<")"<<endl;
        cout<<"グリッドの最大次元:("<<devprop.maxGridSize[0]<<","<<devprop.maxGr
idSize[1]<<","<<devprop.maxGridSize[2]<<")"<<endl;
        cout<<"最大コンスタントメモリ:"<<devprop.totalConstMem/1024<<" KB"<<endl
;
        cout<<"バージョン:"<<devprop.major<<"."<<devprop.minor<<endl;
        cout<<"クロック周波数:"<<devprop.clockRate/1000<<"MHz"<<endl;
        cout<<"デバイス名:"<<devprop.textureAlignment<<endl;
    }
    //終了処理
    CUT_EXIT(argc, argv);
}