诗歌生成比分类问题要稍微麻烦一些,而且第一次使用RNN做文本方面的问题,还是有很多概念性的东西~~~
数据下载:
链接:https://pan.baidu.com/s/1uCDup7U5rGuIlIb-lnZgjQ
提取码:f436
data.py——数据处理
1 import numpy as np 2 import os 3 4 def get_data(conf): 5 ''' 6 生成数据 7 :param conf: 配置选项,Config对象 8 :return: word2ix: 每个字符对应的索引id,如u'月'->100 9 :return: ix2word: 每个字符对应的索引id,如100->u'月' 10 :return: data: 每一行是一首诗对应的字的索引id 11 ''' 12 if os.path.exists(conf.pickle_path): 13 14 datas = np.load(conf.pickle_path) #np数据文件 15 data = datas['data'] 16 ix2word = datas['ix2word'].item() 17 word2ix = datas['word2ix'].item() 18 return data, word2ix, ix2word