神经网络参数与TensorFlow变量
通过TensorFlow训练神经网络
完整神经网络样例程序
#模拟数据集上训练神经网络 解决一个二分类问题
import tensorflow as tf
#Numpy是一个科学计算的工具包 这里通过NumPy 工具包生成模拟数据集
from numpy.random import RandomState
#定义训练数据batch的大小
batch_size=8
#定义神经网络的参数
w1=tf.Variable(tf.random_normal([2,3],stddev=1,seed=1),name="w1")
w2=tf.Variable(tf.random_normal([3,1],stddev=1,seed=1),namw="w2")
#在shape的一个维度上使用None可以方便使用不同的batch大小。
#在训练时需要把数据分成比较小的batch,但是在测试集比较大时 将大量数据放入一个batch 可能会导致内存溢出(即内存不足)
x=tf.placeholder(tf.float32,shape=(None,2),name="x-input")
y_=tf.placeholder(tf.float32,shape=(None,1),name="y-input")
#定义神经网络前向传播的过程
a=tf.matmul(x,w1)
y=tf.matmul(a,w2)
#定义损失函数和反向传播的算法
cross_entropy=-tf.reduce_mean(
y_*tf.log(tf.clip_by_value(y,1e-10,1.0)))
train_step=\
tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)
#通过随机数生成一个模拟数据集
rdm = RandomState(1)
dataset_size=128
X=rdm.rand(dataset_size,2)
# 定义规则来给出一个样本的标签。在这里所有x1+x2<1的样例都被认为是正样本(比如零件合格)
#而其他为负样本(比如零件不合格)
#这里使用0来表示负样本 1来表示负样本 大部分解决分类问题的神经网络都会采用0 和 1 的表示的方法
Y=[[int(x1+x2<1)for(x1,x2)in X]]
#创建一个会话来运行Tensorflow程序
with tf.Session() as sess:
int_op=tf.initialize_all_variables()
#初始化变量
sess.run(int_op)
print sess.run(w1)
print sess.run(w2)
"""
输出:略
"""
#设定训练的轮数
STEPS=50000
for i in range(STEPS):
#每次选取batch_size个样本进行训练。
start = (i*batch_size)*dataset_size
end=min(start+batch_size,dataset_size)
#通过选取的样本训练神经网络并更新参数
sess.run(train_step,
feed_dict={x:X[start:end],y_:Y[start;end]})
if i%1000==0:
#每隔一段时间计算在所有数据上的交叉熵并输出。
total_cross_entropy=sess.run(
cross_entropy,feed_dict={x:X,y_:Y})
print("After %d training step(s),cross entropy on all data is %g"%(i,total_crosss_entropy))
"""
输出:略
过程:通过结果可以发现随着训练的进行 交叉熵是逐渐变小的 交叉熵越小说明预测结果和真实的结果差距越小
"""
#可以查看训练之后的参数
print sess.run(w1)
print sess.run(w2)
"""
输出:略
结论:可以发现这两个参数的取值已经发生变化,这个变化就是训练的结果
它使得这个神经网络更好的拟合提供的训练数据
"""
注:想要源文件的联系我就好 我不知道怎么传文件