我们知道,RNN(循环神经网络)模型是基于当前的状态和当前的输入来对下一时刻做出预判。而LSTM(长短时记忆网络)模型则可以记忆距离当前位置较远的上下文信息。
在此,我们根据上述预判模型来进行 古诗词的生成模型训练。
首先,我们需要准备好古诗词的数据集:全唐诗共34646首,我把数据文件上传到了我的csdn中,又需要的可以下载
http://download.csdn.net/download/qq_34470213/10150761

训练模型

1、获取字典

  • 我们首先需要读取诗集,把诗集的每首诗都分离出来存入列表,根据列表的长度 就可以得出共有多少首古诗。

首先需要把每首诗读出来,故可以使用open函数。

由于在数据文件中每首诗的格式都是( 题目:内容 ),所以可以先使用strip函数去掉空格,再使用split(“:”)来分割题目和内容,由于我们在这里只需要使用诗的内容,所以只保存内容即可。

得到了诗点的内容,需要注意的是有些诗句的题目中也会含有“:”符号,我们需要把这样的句子省略掉,因为它不是诗词内容。
得到了所有的诗词内容。

为了标记诗词的开始和结尾,我们在开头加上字符“[”,末尾加上字符“]”,在训练的时候程序也会根据该符号来作为训练的始末状态。
把所有的唐诗内容都加入到列表中,列表长度即为唐诗的总数。

代码实现:

poetrys = []
with open(poetry_file, "r", encoding='utf-8', ) as f:for line in f:try:title, content = line.strip().split(':')content = content.replace(' ', '')if '_' in content or '(' in content or '(' in content or '《' in content or '[' in content:continueif len(content) < 5 or len(content) > 79:continuecontent = '[' + content + ']'poetrys.append(content)except Exception as e:passpoetrys = sorted(poetrys, key=lambda line: len(line))
print('唐诗总数: ', len(poetrys))
  • 得到所有唐诗内容以后,就可以对每个字进行编码了,由此得到所有诗的编码形式,把编码放入神经网络进行训练。

则需要把所有的诗词中所有出现过的字都进行统计,统计其出现过的次数,使用collection.Counter对一个列表中的每个元素都进行遍历统计,返回值为一个元素和出现次数相对应的字典。

我们取有训练必要的数据进行编码,首先根据字典中的出现次数以由高到低的顺序进行排序,可以使用sorted函数,key表示排序方法,k=lambda x:x[1],表示根据 第二个参数(即出现次数)的大小从大到小排序,设置为-x[1]排序后则是从大到小。

取出需要编码的字,按照从0开始的编码格式,对每个字进行编码,排序后我们得到了具有每个字和其出现次数的元组,我们只需要拿到每个字即可。
zip([1,2],[3,4],[5,6])
-- 》 [1,3,5],[2,4,6]
zip(*[(1,2),(3,4),(5,6)])
--》[1,3,5], [2,4,6]

选择出现次数多的字进行编码,作为编码字典。把每个字与从0到len的数字编码字典
dict(d):创建一个字典。d 必须是一个序列 (key,value)元组
最后得到每个字与从0开始的字符组成的字典

把每首诗的每个字都进行编码处理,即从字典中找到每个字对应的号码
dict.get(key, default=None)
key -- 字典中要查找的键。
default -- 如果指定键的值不存在时,返回该默认值。

代码实现

all_words = []
for poetry in poetrys:all_words += [word for word in poetry]
counter = collections.Counter(all_words)count_pairs = sorted(counter.items(), key=lambda x: -x[1])
words, _ = zip(*count_pairs)
leng = int(len(words)*0.9)
words = words[:leng]+(' ',)word_num_map = dict(zip(words, range(len(words))))
to_num = lambda word: word_num_map.get(word, len(words))poetrys_vector = [list(map(to_num, poetry)) for poetry in poetrys]
  • 训练数据

训练时每次取64首诗进行训练,即每次在列表内取64个数据,然后对其进行输出数据x,输出数据y进行赋值,y为正确的结果,用于训练。(需注意的是,由于模型的作用是对下一个字进行预测,所以y只是x的数据向前移动一个字)
定义一个RNN模型,然后把数据代入进行训练,使用RNN进行训练的过程大约分为:
1、定义模型和结构。
2、0初始化当前状态。
3、输入数据进行ID到单词向量的转化。
4、输入数据和初始化状态代入模型进行训练,得到训练结果。
5、对训练结果加入一个全连接层得到最终输出。
多次训练,得到最终的状态和最终的损失。在本例中,共规定了50次训练,每次训练都对每个batche数据进行训练,由于共有34646首诗,每个batche的大小为64,所以共有541个batche

 for epoch in range(50):for batche in range(541):train(epoch, batche)

由于最后的输出数据是下一个字,所以输出格式的大小为该字可能对应的编码,输出大小为len。

为了防止中断,及时保存。

生成古诗:
使用以上训练好的网络模型来生成新的古诗,生成古诗的主要方法有:
读取模板文件,对每个字的出现个数都进行统计,根据统计结果取出数据来进行编码,得到每个字和相应的编码字典。用于字和编码之间的转化。
生成RNN模型网络,应用于根据输入信息得到相应的输出信息。与训练模型的编写方法相同。
读取已保存的网络模型,根据已经训练好的模型来进行新的数据预测。
使用循环语句进行编码和字之间的转化,直到一首诗做完后退出。

训练数据的总代码:

import collections
import numpy as np
from tensorflow.contrib.legacy_seq2seq.python.ops.seq2seq import sequence_loss_by_example
import tensorflow as tf
import osMODEL_SAVE_PATH = "./save/"
MODEL_NAME = "poetry.module"# -------------------------------数据预处理---------------------------#poetry_file = 'poetry.txt'# 诗集
poetrys = []
with open(poetry_file, "r", encoding='utf-8', ) as f:for line in f:try:title, content = line.strip().split(':')content = content.replace(' ', '')if '_' in content or '(' in content or '(' in content or '《' in content or '[' in content:continueif len(content) < 5 or len(content) > 79:continuecontent = '[' + content + ']'poetrys.append(content)except Exception as e:passpoetrys = sorted(poetrys, key=lambda line: len(line))
print('唐诗总数: ', len(poetrys))all_words = []
for poetry in poetrys:all_words += [word for word in poetry]
counter = collections.Counter(all_words)
print(counter)
count_pairs = sorted(counter.items(), key=lambda x: -x[1])
print(count_pairs)
words, _ = zip(*count_pairs)
print(words)
print(len(words))
leng = int(len(words)*0.9)words = words[:leng]+(' ',)
print(words)word_num_map = dict(zip(words, range(len(words))))to_num = lambda word: word_num_map.get(word, len(words))
poetrys_vector = [list(map(to_num, poetry)) for poetry in poetrys]
# [[314, 3199, 367, 1556, 26, 179, 680, 0, 3199, 41, 506, 40, 151, 4, 98, 1],
# [339, 3, 133, 31, 302, 653, 512, 0, 37, 148, 294, 25, 54, 833, 3, 1, 965, 1315, 377, 1700, 562, 21, 37, 0, 2, 1253, 21, 36, 264, 877, 809, 1]
# ....]# 每次取64首诗进行训练
batch_size = 64
n_chunk = len(poetrys_vector) // batch_size
x_batches = []
y_batches = []for i in range(n_chunk):start_index = i * batch_sizeend_index = start_index + batch_sizebatches = poetrys_vector[start_index:end_index]length = max(map(len, batches))xdata = np.full((batch_size, length), word_num_map[' '], np.int32)for row in range(batch_size):xdata[row, :len(batches[row])] = batches[row]ydata = np.copy(xdata)ydata[:, :-1] = xdata[:, 1:]"""xdata             ydata[6,2,4,6,9]       [2,4,6,9,9][1,4,2,8,5]       [4,2,8,5,5]"""x_batches.append(xdata)y_batches.append(ydata)# ---------------------------------------RNN--------------------------------------#input_data = tf.placeholder(tf.int32, [batch_size, None])
output_targets = tf.placeholder(tf.int32, [batch_size, None])# 定义RNN
def neural_network(model='lstm', rnn_size=128, num_layers=2):if model == 'rnn':cell_fun = tf.nn.rnn_cell.BasicRNNCellelif model == 'gru':cell_fun = tf.nn.rnn_cell.GRUCellelif model == 'lstm':cell_fun = tf.nn.rnn_cell.BasicLSTMCellcell = cell_fun(rnn_size, state_is_tuple=True)cell = tf.nn.rnn_cell.MultiRNNCell([cell] * num_layers, state_is_tuple=True)initial_state = cell.zero_state(batch_size, tf.float32)with tf.variable_scope('rnnlm'):softmax_w = tf.get_variable("softmax_w", [rnn_size, len(words) + 1])softmax_b = tf.get_variable("softmax_b", [len(words) + 1])with tf.device("/cpu:0"):embedding = tf.get_variable("embedding", [len(words) + 1, rnn_size])inputs = tf.nn.embedding_lookup(embedding, input_data)outputs, last_state = tf.nn.dynamic_rnn(cell, inputs, initial_state=initial_state, scope='rnnlm')output = tf.reshape(outputs, [-1, rnn_size])logits = tf.matmul(output, softmax_w) + softmax_bprobs = tf.nn.softmax(logits)return logits, last_state, probs, cell, initial_state# 训练
def train_neural_network():logits, last_state, _, _, _ = neural_network()targets = tf.reshape(output_targets, [-1])loss = sequence_loss_by_example([logits], [targets], [tf.ones_like(targets, dtype=tf.float32)], len(words))cost = tf.reduce_mean(loss)learning_rate = tf.Variable(0.0, trainable=False)tvars = tf.trainable_variables()grads, _ = tf.clip_by_global_norm(tf.gradients(cost, tvars), 5)optimizer = tf.train.AdamOptimizer(learning_rate)train_op = optimizer.apply_gradients(zip(grads, tvars))with tf.Session() as sess:sess.run(tf.initialize_all_variables())# saver = tf.train.Saver()for epoch in range(50):sess.run(tf.assign(learning_rate, 0.002 * (0.97 ** epoch)))n = 0for batche in range(n_chunk):train_loss, _, _ = sess.run([cost, last_state, train_op],feed_dict={input_data: x_batches[n], output_targets: y_batches[n]})n += 1print(epoch, batche, train_loss)if epoch % 7 == 0:saver.save(sess, os.path.join(MODEL_SAVE_PATH, MODEL_NAME), global_step=epoch)train_neural_network()

训练结束后得到储存神经网络模型的文件:

我的笔记本上训练了十个多小时,如果不想训练,可以直接下载我训练好的文件来使用,可以得到同样的效果。
我把训练的最后结果放到了这里,链接:https://pan.baidu.com/s/1bIibbo 密码:ojs3

使用模型生成诗句

使用模型时首先应该加载出该模型使我们方便使用。
已知一首诗的开始标志字为"[",设其初始状态为0,由此开始载入模型,迭代可以求得整首古诗,古诗的结束标志为"]",出现了此输出结果表示古诗生成完毕,退出循环,打印结果。

import collections
import numpy as np
import tensorflow as tf#-------------------------------数据预处理---------------------------#poetry_file ='poetry.txt'# 诗集
poetrys = []
with open(poetry_file, "r", encoding='utf-8',) as f:for line in f:try:title, content = line.strip().split(':')content = content.replace(' ','')if '_' in content or '(' in content or '(' in content or '《' in content or '[' in content:continueif len(content) < 5 or len(content) > 79:continuecontent = '[' + content + ']'poetrys.append(content)except Exception as e:passpoetrys = sorted(poetrys,key=lambda line: len(line))
print('唐诗总数: ', len(poetrys))all_words = []
for poetry in poetrys:all_words += [word for word in poetry]
counter = collections.Counter(all_words)
count_pairs = sorted(counter.items(), key=lambda x: -x[1])
words, _ = zip(*count_pairs)words = words[:len(words)] + (' ',)
word_num_map = dict(zip(words, range(len(words))))
to_num = lambda word: word_num_map.get(word, len(words))
poetrys_vector = [ list(map(to_num, poetry)) for poetry in poetrys]
#[[314, 3199, 367, 1556, 26, 179, 680, 0, 3199, 41, 506, 40, 151, 4, 98, 1],
#[339, 3, 133, 31, 302, 653, 512, 0, 37, 148, 294, 25, 54, 833, 3, 1, 965, 1315, 377, 1700, 562, 21, 37, 0, 2, 1253, 21, 36, 264, 877, 809, 1]
#....]batch_size = 1
n_chunk = len(poetrys_vector) // batch_size
x_batches = []
y_batches = []
for i in range(n_chunk):start_index = i * batch_sizeend_index = start_index + batch_sizebatches = poetrys_vector[start_index:end_index]length = max(map(len,batches))xdata = np.full((batch_size,length), word_num_map[' '], np.int32)for row in range(batch_size):xdata[row,:len(batches[row])] = batches[row]ydata = np.copy(xdata)ydata[:,:-1] = xdata[:,1:]"""xdata             ydata[6,2,4,6,9]       [2,4,6,9,9][1,4,2,8,5]       [4,2,8,5,5]"""x_batches.append(xdata)y_batches.append(ydata)#---------------------------------------RNN--------------------------------------#input_data = tf.placeholder(tf.int32, [batch_size, None])
output_targets = tf.placeholder(tf.int32, [batch_size, None])
# 定义RNN
def neural_network(model='lstm', rnn_size=128, num_layers=2):if model == 'rnn':cell_fun = tf.nn.rnn_cell.BasicRNNCellelif model == 'gru':cell_fun = tf.nn.rnn_cell.GRUCellelif model == 'lstm':cell_fun = tf.nn.rnn_cell.BasicLSTMCellcell = cell_fun(rnn_size, state_is_tuple=True)cell = tf.nn.rnn_cell.MultiRNNCell([cell] * num_layers, state_is_tuple=True)initial_state = cell.zero_state(batch_size, tf.float32)with tf.variable_scope('rnnlm'):softmax_w = tf.get_variable("softmax_w", [rnn_size, len(words)+1])softmax_b = tf.get_variable("softmax_b", [len(words)+1])with tf.device("/cpu:0"):embedding = tf.get_variable("embedding", [len(words)+1, rnn_size])inputs = tf.nn.embedding_lookup(embedding, input_data)outputs, last_state = tf.nn.dynamic_rnn(cell, inputs, initial_state=initial_state, scope='rnnlm')output = tf.reshape(outputs,[-1, rnn_size])logits = tf.matmul(output, softmax_w) + softmax_bprobs = tf.nn.softmax(logits)return logits, last_state, probs, cell, initial_state#-------------------------------生成古诗---------------------------------#
# 使用训练完成的模型def gen_poetry():def to_word(weights):t = np.cumsum(weights)s = np.sum(weights)sample = int(np.searchsorted(t, np.random.rand(1)*s))return words[sample]_, last_state, probs, cell, initial_state = neural_network()with tf.Session() as sess:sess.run(tf.initialize_all_variables())saver = tf.train.Saver(tf.all_variables())saver.restore(sess, './save/poetry.module-49')state_ = sess.run(cell.zero_state(1, tf.float32))x = np.array([list(map(word_num_map.get, '['))])[probs_, state_] = sess.run([probs, last_state], feed_dict={input_data: x, initial_state: state_})word = to_word(probs_)poem = ''word_biao = wordwhile word != ']':poem += word_biaox = np.zeros((1,1))x[0,0] = word_num_map[word][probs_, state_] = sess.run([probs, last_state], feed_dict={input_data: x, initial_state: state_})word = to_word(probs_)word_biao =wordif word_biao == '。':word_biao = '。\n'print(word_biao)return poemprint(gen_poetry())

输出结果:

藏头诗的写作

藏头诗与自由作诗的区别在于,需要指定每句话的头一个字,所以初始状态便需要重新设定为给定的字,我们设置一个for循环来取出藏头句子的每
一个单字,对该单字进行训练。
我们把第一个字设置为"[",求出状态state_,然后将该状态代入该单字中求下一个字的解。即,已知当前输入为"word",当前状态是“[”的状态state_,求输出和下一步状态。
输出作为当前输入,下一步状态作为当前状态,再求下一个字。
直到诗句满足字数状态或结束,则退出循环,处理下一个单字。

def gen_poetry_with_head_and_type(head, type):if type != 5 and type != 7:print('The second para has to be 5 or 7!')returndef to_word(weights):t = np.cumsum(weights)s = np.sum(weights)sample = int(np.searchsorted(t, np.random.rand(1)*s))return words[sample]_, last_state, probs, cell, initial_state = neural_network()with tf.Session() as sess:sess.run(tf.initialize_all_variables())saver = tf.train.Saver()saver.restore(sess, './save/poetry.module-35')poem = ''i = 0for the_word in head:flag = Truewhile flag:state_ = sess.run(cell.zero_state(1, tf.float32))x = np.array([list(map(word_num_map.get, '['))])[probs_, state_] = sess.run([probs, last_state], feed_dict={input_data: x, initial_state: state_})sentence = the_wordx = np.zeros((1, 1))x[0, 0] = word_num_map[sentence][probs_, state_] = sess.run([probs, last_state], feed_dict={input_data: x, initial_state: state_})word = to_word(probs_)sentence += wordwhile word!='。':x = np.zeros((1, 1))x[0, 0] = word_num_map[word][probs_, state_] = sess.run([probs, last_state], feed_dict={input_data: x, initial_state: state_})word = to_word(probs_)sentence += wordif len(sentence) == 2 + 2 * type:sentence += '\n'poem += sentenceflag = Falsereturn poemprint(gen_poetry_with_head_and_type("碧影江白", 7))

经过处理后输出诗句:

基于RNN实现古诗词生成模型相关推荐

  1. 设计并实现古诗词生成模型,实现古诗词的自动生成。

    好的,设计并实现古诗词生成模型的步骤如下: 收集古诗词数据集:需要收集大量的古诗词数据,以便训练模型.可以从网络上搜索并收集古诗词数据,也可以从书籍或其他来源获取古诗词数据. 数据预处理:在收集完古诗 ...

  2. NeuIPS | 蛋白设计新方法?基于图的蛋白生成模型

    今天给大家介绍的是麻省理工大学计算机科学和人工智能实验室在NeuIPS 2019会议上发表的一篇文章.在文中,作者提出了一种基于图结构的蛋白质序列生成模型,通过聚焦三维空间上相邻的蛋白质区域,在基于神 ...

  3. 基于流的(Flow-based)生成模型简介

    基于流的(Flow-based)生成模型简介 生成任务 我们先回顾一下所谓的生成任务,究竟是做什么事情.我们认为,世界上所有的图片,是符合某种分布 pdata(x)p_{data}(x)pdata​( ...

  4. 基于RNN的文本生成算法的代码运转

    目录(?)[+] "什么时候能自动生成博客?" 前言 跳过废话,直接看正文 RNN相对于传统的神经网络来说对于把握上下文之间的关系更为擅长,因此现在被大量用在自然语言处理的相关任务 ...

  5. 【模型复现】基于RNN优化的并行计算模型-SRU的快速复现「极链AI云 」

    [模型复现 ]基于RNN优化的并行计算模型-SRU的快速复现「极链AI云 」 极链AI云 注册链接 关注极链AI云公众号,学习更多知识! 文章目录 [模型复现 ]基于RNN优化的并行计算模型-SRU的 ...

  6. JCIM| 基于双向RNN的分子生成模型

    今天给大家介绍的是被誉为"欧陆第一名校"苏黎世联邦理工学院(ETH Zurich)化学与应用生物科学系博士生Francesca Grisoni和制药行业顾问Gisbert Schn ...

  7. 基于流的深度生成模型

    1 引言  到目前为止,两种生成模型GAN\mathrm{GAN}GAN和VAE\mathrm{VAE}VAE并不能准确地从真实数据x∈D{\bf{x}}\in \mathcal{D}x∈D中学习出概 ...

  8. 朱俊彦团队推出首个基于内容的深度生成模型搜索算法!

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入-> CV 微信技术交流群 作者 | 李梅 转载自:AI科技评论  编辑 :陈彩娴 最近的生成 ...

  9. 基于GAN的图像生成模型

    文章目录 定义一些参数 数据加载类 创建dataset和dataloader 模型权重的初始化函数 定义生成器 验证生成器是否正确 定义判别器 验证判别器是否正确 定义损失函数 训练 输入一个随机值查 ...

最新文章

  1. seaborn使用Catplot函数可视化水平小提琴图(Make Horizontal Violin Plot with Catplot in Seaborn)
  2. 100个必会的python脚本-学会这个Python库,至少能减少100行代码
  3. Python深浅拷贝教程-面试必问内容
  4. 技术干货 | 阿里云数据库PostgreSQL 13大版本揭秘
  5. 1044. 火星数字(20)
  6. 存储过程实现可扩展灵活接口
  7. tidb 配置mysql数据源_安装tidb数据库
  8. NSACE|网络信息安全技术,你不能忽视的存在
  9. GD32移植FATFS文件系统
  10. java实现excel、word在线预览
  11. oracle 12c pdb数据库全库备份
  12. Unable to modify the parent container element before the child element is closed
  13. 矩阵的求逆:inv( )
  14. 【转载】CSDI2018广州关于《Nginx》的分享(附文字速录与PPT)
  15. 《ZigBee开发笔记》第五部分 外设篇 - 协议栈实验 第4章 CC2530热释电红外传感器
  16. 简要介绍一下Dos/Windows格式文件和Unix/Linux格式文件(剪不断理还乱的\r\n和\n)
  17. 利用discord创建一个自己的discord bot机器人
  18. Red Hat 镜像下载
  19. koa--更富有表现力、更健壮的 Web 框架
  20. 转载:QQ自动强制加好友代码html

热门文章

  1. 盛大文学发布电子书战略 建立“云中图书馆”
  2. gazebo仿真环境中添加robotiq 2f 140的gripper_controller控制器
  3. Sql Server数据库中创建视图
  4. MacBook作为无线路由器
  5. 《STM32从零开始学习历程》——DMA直接存储区访问实验例程
  6. 革命路-互联网女皇看好的革命性创业公司
  7. CentOS7下部署敏捷项目管理软件JIAR-7.13.18
  8. 初读《偷影子的人》观后感
  9. An App ID with Identifier 'com.FE.BMH' is not available. Please enter a different string.
  10. 用Python绘制个人足迹地图!你去过哪些地方它比你清楚!