1. 准备

  • windows 10系统、3.6GHz cpu、16G 内存
  • visual studio 2017 or 2015
  • 下载安装git
  • 下载安装cmake
  • 下载安装swigwin 如果不需要python bindings,可以跳过
  • clone tensorflow
  • 切换tensorflow到要进行编译的git tag
  • 修改tensorflow/contrib/cmake/CMakeLists.txt
    if (tensorflow_OPTIMIZE_FOR_NATIVE_ARCH)
      include(CheckCXXCompilerFlag)
      CHECK_CXX_COMPILER_FLAG("-march=native" COMPILER_OPT_ARCH_NATIVE_SUPPORTED)
      if (COMPILER_OPT_ARCH_NATIVE_SUPPORTED)
        set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -march=native")
    # 添加下面这部分
      else()
        CHECK_CXX_COMPILER_FLAG("/arch:AVX" COMPILER_OPT_ARCH_AVX_SUPPORTED)
        if (COMPILER_OPT_ARCH_AVX_SUPPORTED)
          set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} /arch:AVX")
        endif()
    # end of 添加下面这部分
      endif()
    endif()

     

2. 步骤

  1. cmd 运行vcvarsall.bat amd64设置指定环境参数
  2. cd目录:tensorflow\contrib\cmake
  3. 创建build目录,cd build
  4. cmake命令

    1. cmake .. -G "Visual Studio 15 2017 Win64" -T host=x64 -DCMAKE_BUILD_TYPE=Release ^
    2. -Dtensorflow_VERBOSE=ON ^
    3. -Dtensorflow_ENABLE_GRPC_SUPPORT=OFF ^
    4. -Dtensorflow_BUILD_PYTHON_BINDINGS=OFF ^
    5. -Dtensorflow_BUILD_CC_EXAMPLE=OFF ^
    6. -Dtensorflow_BUILD_SHARED_LIB=ON ^
    7. -Dtensorflow_WIN_CPU_SIMD_OPTIONS=/arch:AVX
    8. #-DSWIG_EXECUTABLE=swig.exe的路径
    9. #-DPYTHON_EXECUTABLE=python.exe的路径(anaconda3路径/python.exe)
    10. #-DPYTHON_LIBRARIES=python35.lib的路径(anaconda3路径/libs/python35.lib)

    上面的命令说明: 
    -G 指定生成目标版本。命令行输入cmake -G,可以查看可选的版本列表。 
    -T host=64 是网上很多教程忽略的一点,我之前也用VS2017编译过,因为没有指定-T host=64,导致使用了32位的编译器,出现fatal error C1060: "编译器的堆空间不足"的错误。 
    tensorflow_VERBOSE 编译时输出具体信息,设为ON些许降低编译速度。 
    tensorflow_ENABLE_GRPC_SUPPORT GRPC支持,如果你有服务器/客户端的业务需求,或者跨语言GRPC使用需求的话,选择ON。 
    tensorflow_BUILD_PYTHON_BINDINGS 需要编译python包的话选择ON。 
    tensorflow_BUILD_CC_EXAMPLE 编译测试代码。 
    tensorflow_BUILD_SHARED_LIB 编译共享库。 
    tensorflow_WIN_CPU_SIMD_OPTIONS=/arch:AVX2 选择AVX还是AVX2,取决于你的CPU是否支持该指令集。 
    tensorflow_ENABLE_GPU 编译是否使用GPU。 
    tensorflow_OPTIMIZE_FOR_NATIVE_ARCH可设为OFF也可以不设置,会自动判断。 
    其他可选参数在 tensorflow\tensorflow\contrib\cmake\CMakeLists.txt 中可查看,对于你拿不准的参数,保持其默认即可。

  5. 编译 
    MSBuild /p:Configuration=Release /p:Platform=x64 /verbosity:detailed tensorflow.vcxproj
    这里强调一点,Configuration定义的要与cmake时DCMAKE_BUILD_TYPE定义相同

  6. 运行测试

相关文章:

  • 2021-10-06
  • 2021-11-12
  • 2021-09-02
  • 2021-10-29
  • 2021-05-29
  • 2021-11-25
  • 2022-01-17
  • 2022-12-23
猜你喜欢
  • 2021-05-30
  • 2022-12-23
  • 2022-01-02
  • 2021-06-22
  • 2022-02-02
  • 2021-04-06
  • 2022-12-23
相关资源
相似解决方案