一、环境概述
- 系统环境:ubuntu 14.04 4cores+8gmemory
- 语言环境:python 2.7.6 python-dev python-pip
二、前期准备
安装python:
这里不做赘述,因为一般linux操作系统都默认安装了python。-
安装python-dev python-pip
sudo apt-get install python-dev python-pip
如果提示找不到包,熟悉linux的兄弟们都知道啦:sudo apt-get update然后再重新安装。
三、安装tensorflow
pip install
sudo pip install --upgrade
https://storage.googleapis.com/tensorflow/linux
/cpu/tensorflow-1.0.0-cp27-none-linux_x86_64.whl测试安装
启动python解释器。
import tensorflow as tf
a=tf.constant(10)
b=tf.constatn(20)
sess=tf.Session()
print(sess.run(a*b))
四、测试
这里是网上的一个测试代码可以拿去用
测试代码
ps节点执行
python distribute.py --ps_hosts=10.15.21.177:2222他会等待worker节点运行
--worker_hosts=10.15.21.178:2224,10.15.21.179:2225
--job_name=ps --task_index=0-
worker节点分别执行
python distribute.py --ps_hosts=10.15.21.177:2222
--worker_hosts=10.15.21.178:2224,10.15.21.179:2225
--job_name=worker --task_index=0python distribute.py --ps_hosts=10.15.21.177:2222
--worker_hosts=10.15.21.178:2224,10.15.21.179:2225
--job_name=worker --task_index=1
当两台都起来之后看到在worker上运行结果:
worker2上运行结果五、错误
InvalidArgumentError (see above for traceback): Unsuccessful TensorSliceReader constructor: Failed
to get matching files on ./checkpoint/model.ckpt-65113: Not found: ./checkpoint
删除当前目录下的checkpoint:rm -rf ./checkpoint