【发布时间】:2019-07-02 01:27:13
【问题描述】:
我正在设计一个神经网络来尝试生成音乐。神经网络将是一个 2 层 LSTM(长短期记忆)。 我希望将音乐编码为许多热门格式以进行训练,即,如果该音符正在播放,则为 1,如果该音符未播放,则为 0。 以下是这些数据的摘录:
0000000000000000000000000000000000000000000000000001000100100001000000000000000000000000
0000000000000000000000000000000000000000000000000001000100100001000000000000000000000000
0000000000000000000000000000000000000000000000000001000100100001000000000000000000000000
0000000000000000000000000000000000000000000000000001000100100001000000000000000000000000
0000000000000000000000000000000000000000000000000001000100100001000000000000000000000000
0000000000000000000000000000000000000000000000000011010100100001010000000000000000000000
有 88 列代表 88 个音符,现在每个代表一个新节拍。输出将是字符级别的。
我只是想知道,既然词汇表中只有 2 个字符,那么下一个总是出现 0 的概率会高于下一个出现 1 的概率吗? 我知道词汇量很大,需要很大的训练集,但我只有很小的词汇量。我有 229 个文件,对应于大约 50,000 行文本。这足以防止输出全为 0 吗?
另外,最好有 88 个节点,每个音符 1 个节点,还是一个字符一次只有一个节点?
提前致谢
【问题讨论】:
标签: machine-learning neural-network lstm recurrent-neural-network one-hot-encoding