【发布时间】:2017-11-11 15:17:01
【问题描述】:
假设我想制作一个可以做某事的模型。现在,当我在 Google 或 YouTube 上搜索该主题时,我会发现很多相关的教程,似乎某个聪明的程序员已经使用深度学习实现了该模型。
但是他们怎么知道他们需要使用什么类型的层、什么类型的激活函数、损失函数、优化器、单元数量等来解决这个问题。
是否有任何技巧可以知道这一点,还是只是理解和经验的问题?另外,如果有人可以向我指出一些回答我问题的视频或文章,那将非常有帮助。
【问题讨论】:
-
这个问题不属于 SO。它与编程本身无关。你可以在stats.stackexchange.com 上问这个问题,但不是在这里
-
这是一个积极研究的领域。谷歌做了一些努力使架构变得可学习。一般来说,我建议从已知的良好配置开始,例如 VGG 网络,直到您了解每个组件以及它们是如何应用的。通过阅读深度学习书(在线和印刷版),您将了解更多有关架构选择的信息。这个问题没有灵丹妙药的答案。至少在 2017 年不会。
标签: tensorflow deep-learning keras tflearn