ppg_decode_spec_5ms_sch代码和训练

0. 项目描述

ppg_decode_spec_5ms_sch是从ppg到spec的NN版本映射，期望他能修复FindA中找到的中ppgs不连贯问题，产出连贯的specs

主要基于实验室的服务器和开源代码+LJSpeech等

1.1.1 提取的代码项目

1.1.2 服务器

脚本路径：/datapool/home/hujk17/linears_decoder_5ms_sch_mel_linear/LJSpeech

ppg_decode_spec_5ms_sch代码和训练

1.1.3 处理得到的数据

路径：/datapool/home/hujk17/chenxueyuan/LJSpeech-1.1

ppg_decode_spec_5ms_sch代码和训练

其中meta_good.txt是提取特征成功的文件名字list，有些ppg的nparray文件，因为服务器变动损坏了，不过问题不大（反正之后要重新做10ms版本）

meta_small.txt是meta_good.txt的一小部分，便于测试;meta.txt是完整的13100句list；注意这两个有文本，meta_good没文本

基本上和LJSpeech差不多，是对称的；大多数区别是读list清单的代码区别

也老老实实列出来吧，以后找路径啥的好找

1.2.1 提取的代码项目

1.1.2 服务器

脚本路径：/datapool/home/hujk17/linears_decoder_5ms_sch_mel_linear/DataBaker_Bilingual_CN

ppg_decode_spec_5ms_sch代码和训练

1.1.3 处理得到的数据

路径：/datapool/home/hujk17/chenxueyuan/DataBaker_Bilingual_CN

ppg_decode_spec_5ms_sch代码和训练

其中meta_good.txt是提取特征成功的文件名字list，有些ppg的nparray文件，因为服务器变动损坏了，不过问题不大（反正之后要重新做10ms版本）

meta_small.txt是meta_good.txt的一小部分，便于测试;meta.txt是完整的10000句list；注意这两个是双行，meta_good只是最简单的一行一个文件名字

interval是类似于开源标贝数据集东西，可能对于衡量PPG有用，先留着吧

使用DCBHG，而不是DLSTM，原因是sch已经跑通了，效果也不错，代码也用的人家的，复现可预期性更高~

服务器路径：/datapool/home/hujk17/linears_decoder_5ms_sch_mel_linear

ppg_decode_spec_5ms_sch代码和训练

为了方便，单独复制出来三个独立项目，分别是：LJSpeech的，Baker的，Multi-speaker的

服务器路径：/datapool/home/hujk17/ppg_decode_spec_5ms_sch_LJSpeech

2.2.1. dataload_ljspeech

修改路径，用绝对路径
先用meta_small.txt测试
设定最长长度，目前先2000，后来再调；以后也不能这么padding，临时先用着吧，padding的代码没细看，总之__getitem__得到了固定的长度，有些奇怪。先用着吧，之后看看lh版本的
最长长度的设置反倒方便了调节batch size适应内存

2.2.2. train_cbhg_ljspeech