【发布时间】:2018-04-25 06:33:38
【问题描述】:
我想我正在遵循与帖子中提到的相同的在线教程: How to convert deep learning gradient descent equation into python
我知道我们必须计算成本和分贝,但我的问题是他们为什么将axis=0 放在两个方程中?换句话说,我不明白axis=0,它在这个计算中是用来做什么的。如果不使用axis=0进行计算会是什么结果
import numpy as np
cost = -1*((np.sum(np.dot(Y,np.log(A))+np.dot((1-Y),(np.log(1-A))),axis=0))/m)
db = np.sum((A-Y),axis=0)/m
【问题讨论】:
-
在链接问题的答案之一中,我看到使用了
axis=1。Y的形状为(1, N),因此应在第二个轴上进行求和。 -
你好@MPA你是对的,它必须是axis = 1但我仍然不明白为什么添加axis = 1而不仅仅是:cost = -1 *((np。 sum(np.dot(Y,np.log(A))+np.dot((1-Y),(np.log(1-A)))))/m) 你能举个例子解释一下区别吗在计算中?
标签: python deep-learning