【问题标题】:Neural networks fails to approximate simple multiplication and division神经网络无法逼近简单的乘法和除法
【发布时间】:2019-09-10 11:53:28
【问题描述】:

我正在尝试在简单数据上拟合简单的前馈神经网络,我的目标是近似 (abc)/d

max_a=2
max_b = 3000
max_c=10
max_d=1

def generate_data(no_elements=10000):
    a = np.random.uniform(0,max_a,no_elements)
    b = np.random.uniform(1,max_b,no_elements)
    c=np.random.uniform(0.001,max_c,no_elements)
    d=np.random.uniform(0.00001,max_d,no_elements)
    df=pd.DataFrame({"a":a,"b":b,"c":c,"d":d})

    e=(df.a*df.b*df.c)/df.d
    df["e"]=e
    return(df)

这就是我生成数据的方式

然后我做了数据规范化

df = generate_data(5000)
np_df=df.iloc[:,:4]
means=np.mean(np_df,axis=0,keepdims=True)
stds=np.std(np_df,axis=0,keepdims=True)
x_train = (np_df-means)/stds
y_train = np_df[:,4]

我已经为回归构建了一个简单的 pytorch 网络,因此它必须预测 'e'

class network_Regression(nn.Module):
    def __init__(self,layers):
        super(network_Regression, self).__init__()
        self.linear = nn.ModuleList()
        self.relu = nn.ModuleList()
        self.layers = layers
        for i in range(len(layers)-1):
            self.linear.append(nn.Linear(layers[i],layers[i+1]))
            if i+1 !=  len(layers)-1:
                self.relu.append(nn.ReLU())

    def forward(self,out):
        for i in range(len(self.relu)):
            out = self.linear[i](out)
            out = self.relu[i](out)
        out = self.linear[-1](out)
        return out


model = network_Regression([4,10,10,1])
criterion= nn.MSELoss()
optimizer=optim.Adam(model.parameters())

但是当我尝试训练这些网络时,尝试了从 [1000 到 0.5M] 的时期

仍然找不到简单的公式((abc)/d)=e

我尝试更改各种隐藏层级别,但损失约为 9 位数

model.train()
num_epochs = 1000
loss_list=[]
for epoch in range(num_epochs):
    for batch_idx, (data, target) in enumerate(data_loader):
    #print(batch_idx)
        data, target = Variable(data), Variable(target)
        optimizer.zero_grad()
        output = model(data.float())
        loss = criterion(output, target.float())
        #print(batch_idx, loss.data[0])
        loss.backward()
        optimizer.step()
        if epoch >2:
            if batch_idx % 200 == 0:
                loss_list.append(loss.data.item())
        if batch_idx % 400 == 0:
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
            epoch, batch_idx * len(data), len(data_loader.dataset),
            100. * batch_idx / len(data_loader), loss.data.item()))

【问题讨论】:

  • 看起来不像重复输出包含各种值,但问题是 MSE,它是非常高的数组([[104036.31]、[143887.]、[121395.36]、...、[238713.61]、 [114323.66], [153722.58]], dtype=float32)

标签: python neural-network regression pytorch


【解决方案1】:

看起来神经网络不擅长乘法和除法。

查看this了解详情。

所以基本上我必须记录转换我的数据,在上述情况下近似 ((abc)/d)=e 神经网络必须弄清楚简单的加法和减法。根据这个问题,复杂的乘法和除法变为 ln(a) + ln(b)+ln(c)-ln(d) =ln(e) 并且在取逆之后log of ln(e) 这个想法很有效。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2010-12-06
    • 2018-09-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-04-09
    • 2012-12-03
    • 1970-01-01
    相关资源
    最近更新 更多