ubuntu14.04安装TensorFlow-gpu1.0.1
官网指南:https://www.tensorflow.org/install/install_linux(被墙)
中文翻译:http://wiki.jikexueyuan.com/project/tensorflow-zh/get_started/os_setup.html(安装顺序有点乱)
step1:检测GPU版本
通过“lspci | grep -i nvidia”命令查看nvidia芯片版本,前往nvidia官网核对其GPU是否支持CUDA以及其查看其计算能力(http://developer.nvidia.com/cuda-gpus),TensorFlow要求GPU的计算能力大于3.0,否则弃坑装CPU版本吧。
注:在安装的时候就需注意其对SSE4.1、SSE4.2、AVX等协议的支持,有助于提升cpu计算速率
step2:根据CUDA官网指南安装CUDA8.0(http://docs.nvidia.com/cuda/cuda-installation-guide-linux/#axzz4VZnqTJ2A)
注1:先检查nvidia驱动版本,如果版本较低,注意一定千万必须要卸载驱动,以避免后面各种奇怪的兼容性问题
注2:安装完成后,需要将cuda路径添加到环境变量,而sudo gedit /etc/profile比sudo gedit /etc/environment好使
注3:可通过“nvcc -V”验证cuda是否安装成功
step3:下载cuDNN并安装
下载地址:https://developer.nvidia.com/rdp/cudnn-download
安装步骤:
$sudo apt-get update
$tar xvzf cudnn-8.0-linux-x64-v5.1.tgz
$sudo cp cudnn-8.0-linux-x64-v5.1/cudnn.h /usr/local/cuda/include
$suda cp cudnn-8.0-linux-x64-v5.1/libcudnn* /usr/local/cuda/lib64
$sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
注:验证cuDNN是否安装成功的方法
$tar -zxvf cudnn-sample-v2.tgz
$cd cudnn-sample-v2
$make
$./mnistCUDNN
显示GCC等信息则说明cuDNN安装成功
step4:安装TensorFlow
如果python的py_unicode_size=4(验证方法:在Python里import sys——>print sys.maxunicode,若结果为1114111则说明ucs=4)且可以翻墙,那么可以选择二进制安装。我采用的是源码安装方式。
step4.1:安装bazel
下载地址:https://github.com/bazelbuild/bazel/releases
注:虽然bazel已经更新到了0.4.5版本,但是我选择了bazel-0.4.2-installer-linux-x86_64.sh,因为安装0.4.5版本(我选择了源码编译)需要安装protoc,尝试之后弃坑。
安装步骤:
$chomd +X bazel-0.4.2-installer-linux-x86_64.sh
$./bazel-0.4.2-installer-linux-x86_64.sh --user
注1:安装完成之后,用户权限为当前用户
注2:和cuda一样,需要将其路径添加到环境变量
step4.2:安装其他依赖库
$sudo apt-get install python-numpy swig python-dev python-wheel
$sudo apt-get update
注:因为曾经尝试二进制安装,而二进制安装TensorFlow要求numpy版本大于或等于1.11,所以我的numpy版本已经更新为最新的1.12.1版本,但是该版本无法通过apt-get或者pip直接安装,需手动安装。尚不明确源码安装对于numpy版本的要求,但需要注意一下。
step4.3:安装TensorFlow
注:根据官网指示会安装最新的TensorFlow版本,但该版本尚不稳定,并未安装成功,此处选择的TensorFlow1.0.1版本是GitHub中提交更改RELEASE.md的版本。(如何在GitHub上选择合适的版本是门技术活,之前选择了另一版的TensorFlow,但是因为代码中莫名其妙更改了环境变量,所以一直没能安装成功)
下载地址:https://github.com/tensorflow/tensorflow/commit/4e67919cb6f53fb4d66ccfdae4705d6789c03c4a
安装步骤:
进入TensorFlow源码的根路径
$./configure
注1:如果不需要,则选择无需支持openCL,否则后面的ComputeCPP for SYCL1.2会让人头疼。其他选项同理。
注2:每更改一次环境变量,则需重新运行./configure
$bazel build -c opt --copt=-mavx --copt=-msse4.1 --copt=-msse4.2 --config=cuda -k //tensorflow/cc:tutorials_example_trainer
$bazel-bin/tensorflow/cc/tutorial_example_trainer --usr_gpu
$bazel build -c opt --copt=-mavx --copt=-msse4.1 --copt=-msse4.2 --config=cuda -k //tensorflow/tools/pip_package:build_pip_package
$bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg
$pip install /tmp/tensorflow_pkg/tensorflow-1.0.1-cp27-none-linux_x86_64.whl
$python
$import tensorflow
测试通过即可。
注1:第一次bazel编译的只是测试用例,第二次bazel编译的时候一定也要记得加上配置信息
注2:--copt=-m?一定得是你自己电脑已内置的协议,无需跟这里一样,否则测试不通过
更多推荐
所有评论(0)