【发布时间】:2019-11-10 10:53:49
【问题描述】:
我正在学习深度学习,并在 kaggle 上实现了巨大的挑战。
在预处理中,我删除了 Pid、姓名、机票和客舱列。我通过添加相应的方法替换了 Fare 和 Age 列中的空值。我有一个热门编码性别,Pclass(乘客类)和登船港口。添加了一个单独的列来确定乘客是否单独旅行(从兄弟姐妹和父母计算)。最后我使用了 scikit 的 MinMaxScalar。
这是使用的 keras 模型。
model = Sequential()
model.add(Dense(32, input_dim=13, activation="relu"))
model.add(Dense(64, activation="relu"))
model.add(Dense(128, activation="relu"))
model.add(Dense(256, activation="relu"))
model.add(Dropout(0.3))
model.add(Dense(512, activation="relu"))
model.add(Dense(1024, activation="relu"))
model.add(Dense(512, activation="relu"))
model.add(Dropout(0.3))
model.add(Dense(1024, activation="relu"))
model.add(Dense(2048, activation="relu"))
model.add(Dense(1024, activation="relu"))
model.add(Dropout(0.3))
model.add(Dense(512, activation="relu"))
model.add(Dense(1024, activation="relu"))
model.add(Dense(512, activation="relu"))
model.add(Dropout(0.3))
model.add(Dense(256, activation="relu"))
model.add(Dense(128, activation="relu"))
model.add(Dense(64, activation="relu"))
model.add(Dense(32, activation="relu"))
model.add(Dropout(0.3))
model.add(Dense(1, activation="sigmoid"))
model.compile(optimizer="Adam", loss='binary_crossentropy', metrics=["binary_accuracy"])
val_binary_accuracy 在整个过程中是一个常数 0.6425
【问题讨论】:
-
这个模型方式对于 Titanic 数据集来说太复杂了,试着只使用几层。另外,请出示您的
model.fit
标签: python tensorflow keras deep-learning