KerasSeq2seqGeneration:基于seq2seq模型的文本生成任务项目
项目的由来
1、分类、抽取、序列标注、生成任务是自然语言处理的四大经典任务,其中,分类、抽取任务,可以使用规则进行快速实现。而对于生成而言,则与统计深度学习关系较为密切。
2、当前,GPT系列,自动文本生成、文本图像生成,图像文本生成等魔幻主义大作频频上演。
3、目前开源的seq2seq模型项目晦涩难度,不利于阅读与入门。
受此三个现实背景,也正好在接触生成这个任务,特做此项目。
项目链接:
https://github.com/liuhuanyong/KerasSeq2seqGeneration
项目的构成
项目场景:该项目以自动对诗为使用场景,即用户给定上一句,要求模型给出下一句,是个较理想的生成例子。
项目代码结构:
data.txt:为训练数据,此处使用的是对联诗句数据
seq2seq_predict.py:使用seq2seq模型进行下一句生成的脚本
seq2seq_train.py:使用seq2seq模型进行生成的脚本
model/:
config.txt:预训练时形成的一些关键参数,如最大长度等,字数等。
input_vocab.pkl:输入语句的字符索引
output_vovab.pkl:输出语句的字符索引,此处将输入和输出进行区分成两个vocab,可以用于不同语种翻译等场景,如果不需要也可以合成一个。
s2s_model.h5:模型名称
image:
lstm_seq2seq_model.png:序列生成模型网路结构图
项目的思想:
采用character字级别,通过搭建lstm-encoder和lstm-decoder进行seq2seq生成任务。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BufA3fET-1610005013745)(https://github.com/liuhuanyong/KerasSeq2seqGeneration/blob/master/image/lstm_seq2seq_model.png)]
项目的使用:
1、python seq2seq_train.py,进行模型训练。
2、python seq2seq_predict.py,进行模型测试。
项目的总结:
1,本项目完成了一个基于keras实现的自动对诗文本生成功能。
2,这是一个较为简单的入门级项目,欢迎补充。
关于作者:
如有自然语言处理、知识图谱、事理图谱、社会计算、语言资源建设等问题或合作,可联系我:
1、我的自然语言处理开源项目:https://liuhuanyong.github.io
2、我的csdn技术博客:https://blog.csdn.net/lhy2014
3、我的联系方式: 刘焕勇,中国科学院软件研究所,lhy_in_blcu@126.com.
4、我的共享知识库项目:刘焕勇,事理类知识库数据集,http://www.openkg.cn/organization/datahorizon.
5、我的工业项目:刘焕勇,以事理为核心的金融情报探索:https://datahorizon.cn.
KerasSeq2seqGeneration:基于seq2seq模型的文本生成任务项目相关推荐
- tensorflow2.0 基于LSTM模型的文本生成
春水碧于天,画船听雨眠 基于LSTM模型的唐诗文本生成 实验基本要求 实验背景 实验数据下载 LSTM模型分析 实验过程 文本预处理 编解码模型 LSTM模型设置 实验代码 实验结果 总结 致谢 实验 ...
- 大模型系统和应用——基于大模型的文本理解与生成
引言 最近在公众号中了解到了刘知远团队退出的视频课程<大模型交叉研讨课>,看了目录觉得不错,因此拜读一下. 观看地址: https://www.bilibili.com/video/BV1 ...
- NLPCDA —— 基于SimBERT的相似文本生成
NLPCDA -- 基于SimBERT的相似文本生成 感谢苏神开源的SimBERT,笔者先前简单尝试了SimBERT在相似文本生成的应用.同时结合nlpcda作者开源的代码,所以才有了博客中的demo ...
- 基于层次过滤的文本生成
©PaperWeekly 原创 · 作者|邓云天 学校|哈佛大学计算机系博士生 研究方向|自然语言处理 论文标题:Cascaded Decoding with Markov Transformers ...
- 从DDPM到GLIDE:基于扩散模型的图像生成算法进展
前几天,OpenAI在Arxiv上挂出来了他们最新最强的文本-图像生成GLIDE [1],如头图所示,GLIDE能生成非常真实的结果.GLIDE并非基于对抗生成网络或是VQ-VAE类模型所设计,而是采 ...
- 基于扩散模型的文本引导图像生成算法
©作者 | 微风 单位 | 中山大学+IDEA研究院 研究方向 | 多模态表征学习.多模态生成 DALL·E 2 之所以能够生成十分惊艳的图像,扩散模型功不可没,相比 GAN,该模型可以生成更多样,更 ...
- 论文领读|基于 VQVAE 的长文本生成
欢迎关注「澜舟论文领读」专栏!关注"澜舟科技"公众号探索更多 NLP 前沿论文! 本期分享者:杨二光 北京交通大学自然语言处理实验室四年级博士生,导师为张玉洁教授,研究方向为可控 ...
- seq2seq模型_对话生成:seq2seq模型原理及优化
更多干货内容敬请关注「平安寿险PAI」(公众号ID:PAL-AI),文末有本期分享内容资料获取方式. 人机对话作为人机交互系统的核心功能之一,发挥着十分重要的作用.目前,生成式的人机对话存在内容把控性 ...
- 基于RNN-LSTM模型的诗词生成/TensorFlow
1 研究任务一介绍 1.1 研究任务 给定诗词数据集poems,采用基于循环神经网络(RNN)的LSTM模型实现古诗词自动生成,调整参数实现五言诗.七言诗.五言藏头诗.七言藏头诗和词的自动生成. 1. ...
最新文章
- 操作系统原理之磁盘调度
- linux vim 字体大小,Linux学习—vim大全
- putty php环境搭建,centos7(linux)系统下php搭建环境和创建laravel项目
- 工厂方法模式与抽象工厂模式
- PAFF 和MBAFF
- 区别和联系_动机与主题的区别与联系
- LeetCode 1708. 长度为 K 的最大子数组
- 利用 VBA 和 HTML自制兼容 WPS及 EXCEL(32位/64位)的颜色选择器
- pip修改下载源为国内源 linux系统
- 小米MIX4不会采用四曲面屏:结果未必是坏事
- MEF程序设计指南(转)
- Eset易视Smart灵巧护卫Security
- listView/GridView getChild获取不到的解决方法
- 常见python基础面试题_常:汉字常的意思/解释/字义/来源 - 新华字典
- 如何检测显卡类型和OpenGL版本
- 红米手机开启开发者模式方法
- 在线会议中人脸面部轮廓图像提取(三)——Dlib库人脸面部轮廓图像特征提取
- Gradle打包报错:Failed to calculate the value of task ‘:unityLibrary:compileReleaseJavaWithJavac‘
- 据说币圈炒币亏钱的人,大多都是因为这6个原因!
- 商城应用类app该怎么制作
热门文章
- 项目实战|100个蓝牙接收器发货了
- 父母悄悄给自己买房,我很生气,要怎么调整心态?
- 超全!嵌入式必懂的CAN总线一文讲通了
- 每日一题(24)—— const
- redis分布式锁java代码_基于redis实现分布式锁
- C++与Java中的static成员总结
- 图象关于y轴对称是什么意思_数学概念丨“图象”与“图像”是有区别的 ,你知道吗?...
- python长沙_长沙python
- pwn和逆向的区别_Pwn之简单patch
- LeetCode 664. 奇怪的打印机(区间DP)