项目的由来

1、分类、抽取、序列标注、生成任务是自然语言处理的四大经典任务,其中,分类、抽取任务,可以使用规则进行快速实现。而对于生成而言,则与统计深度学习关系较为密切。
2、当前,GPT系列,自动文本生成、文本图像生成,图像文本生成等魔幻主义大作频频上演。
3、目前开源的seq2seq模型项目晦涩难度,不利于阅读与入门。
受此三个现实背景,也正好在接触生成这个任务,特做此项目。

项目链接:
https://github.com/liuhuanyong/KerasSeq2seqGeneration

项目的构成

项目场景:该项目以自动对诗为使用场景,即用户给定上一句,要求模型给出下一句,是个较理想的生成例子。
项目代码结构:
data.txt:为训练数据,此处使用的是对联诗句数据
seq2seq_predict.py:使用seq2seq模型进行下一句生成的脚本
seq2seq_train.py:使用seq2seq模型进行生成的脚本
model/:
config.txt:预训练时形成的一些关键参数,如最大长度等,字数等。
input_vocab.pkl:输入语句的字符索引
output_vovab.pkl:输出语句的字符索引,此处将输入和输出进行区分成两个vocab,可以用于不同语种翻译等场景,如果不需要也可以合成一个。
s2s_model.h5:模型名称
image:
lstm_seq2seq_model.png:序列生成模型网路结构图

项目的思想:

采用character字级别,通过搭建lstm-encoder和lstm-decoder进行seq2seq生成任务。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BufA3fET-1610005013745)(https://github.com/liuhuanyong/KerasSeq2seqGeneration/blob/master/image/lstm_seq2seq_model.png)]

项目的使用:

1、python seq2seq_train.py,进行模型训练。
2、python seq2seq_predict.py,进行模型测试。

项目的总结:

1,本项目完成了一个基于keras实现的自动对诗文本生成功能。
2,这是一个较为简单的入门级项目,欢迎补充。

关于作者:

如有自然语言处理、知识图谱、事理图谱、社会计算、语言资源建设等问题或合作,可联系我:
1、我的自然语言处理开源项目:https://liuhuanyong.github.io
2、我的csdn技术博客:https://blog.csdn.net/lhy2014
3、我的联系方式: 刘焕勇,中国科学院软件研究所,lhy_in_blcu@126.com.
4、我的共享知识库项目:刘焕勇,事理类知识库数据集,http://www.openkg.cn/organization/datahorizon.
5、我的工业项目:刘焕勇,以事理为核心的金融情报探索:https://datahorizon.cn.

KerasSeq2seqGeneration:基于seq2seq模型的文本生成任务项目相关推荐

  1. tensorflow2.0 基于LSTM模型的文本生成

    春水碧于天,画船听雨眠 基于LSTM模型的唐诗文本生成 实验基本要求 实验背景 实验数据下载 LSTM模型分析 实验过程 文本预处理 编解码模型 LSTM模型设置 实验代码 实验结果 总结 致谢 实验 ...

  2. 大模型系统和应用——基于大模型的文本理解与生成

    引言 最近在公众号中了解到了刘知远团队退出的视频课程<大模型交叉研讨课>,看了目录觉得不错,因此拜读一下. 观看地址: https://www.bilibili.com/video/BV1 ...

  3. NLPCDA —— 基于SimBERT的相似文本生成

    NLPCDA -- 基于SimBERT的相似文本生成 感谢苏神开源的SimBERT,笔者先前简单尝试了SimBERT在相似文本生成的应用.同时结合nlpcda作者开源的代码,所以才有了博客中的demo ...

  4. 基于层次过滤的文本生成

    ©PaperWeekly 原创 · 作者|邓云天 学校|哈佛大学计算机系博士生 研究方向|自然语言处理 论文标题:Cascaded Decoding with Markov Transformers ...

  5. 从DDPM到GLIDE:基于扩散模型的图像生成算法进展

    前几天,OpenAI在Arxiv上挂出来了他们最新最强的文本-图像生成GLIDE [1],如头图所示,GLIDE能生成非常真实的结果.GLIDE并非基于对抗生成网络或是VQ-VAE类模型所设计,而是采 ...

  6. 基于扩散模型的文本引导图像生成算法

    ©作者 | 微风 单位 | 中山大学+IDEA研究院 研究方向 | 多模态表征学习.多模态生成 DALL·E 2 之所以能够生成十分惊艳的图像,扩散模型功不可没,相比 GAN,该模型可以生成更多样,更 ...

  7. 论文领读|基于 VQVAE 的长文本生成

    ​欢迎关注「澜舟论文领读」专栏!关注"澜舟科技"公众号探索更多 NLP 前沿论文! 本期分享者:杨二光 北京交通大学自然语言处理实验室四年级博士生,导师为张玉洁教授,研究方向为可控 ...

  8. seq2seq模型_对话生成:seq2seq模型原理及优化

    更多干货内容敬请关注「平安寿险PAI」(公众号ID:PAL-AI),文末有本期分享内容资料获取方式. 人机对话作为人机交互系统的核心功能之一,发挥着十分重要的作用.目前,生成式的人机对话存在内容把控性 ...

  9. 基于RNN-LSTM模型的诗词生成/TensorFlow

    1 研究任务一介绍 1.1 研究任务 给定诗词数据集poems,采用基于循环神经网络(RNN)的LSTM模型实现古诗词自动生成,调整参数实现五言诗.七言诗.五言藏头诗.七言藏头诗和词的自动生成. 1. ...

最新文章

  1. 操作系统原理之磁盘调度
  2. linux vim 字体大小,Linux学习—vim大全
  3. putty php环境搭建,centos7(linux)系统下php搭建环境和创建laravel项目
  4. 工厂方法模式与抽象工厂模式
  5. PAFF 和MBAFF
  6. 区别和联系_动机与主题的区别与联系
  7. LeetCode 1708. 长度为 K 的最大子数组
  8. 利用 VBA 和 HTML自制兼容 WPS及 EXCEL(32位/64位)的颜色选择器
  9. pip修改下载源为国内源 linux系统
  10. 小米MIX4不会采用四曲面屏:结果未必是坏事
  11. MEF程序设计指南(转)
  12. Eset易视Smart灵巧护卫Security
  13. listView/GridView getChild获取不到的解决方法
  14. 常见python基础面试题_常:汉字常的意思/解释/字义/来源 - 新华字典
  15. 如何检测显卡类型和OpenGL版本
  16. 红米手机开启开发者模式方法
  17. 在线会议中人脸面部轮廓图像提取(三)——Dlib库人脸面部轮廓图像特征提取
  18. Gradle打包报错:Failed to calculate the value of task ‘:unityLibrary:compileReleaseJavaWithJavac‘
  19. 据说币圈炒币亏钱的人,大多都是因为这6个原因!
  20. 商城应用类app该怎么制作

热门文章

  1. 项目实战|100个蓝牙接收器发货了
  2. 父母悄悄给自己买房,我很生气,要怎么调整心态?
  3. 超全!嵌入式必懂的CAN总线一文讲通了
  4. 每日一题(24)—— const
  5. redis分布式锁java代码_基于redis实现分布式锁
  6. C++与Java中的static成员总结
  7. 图象关于y轴对称是什么意思_数学概念丨“图象”与“图像”是有区别的 ,你知道吗?...
  8. python长沙_长沙python
  9. pwn和逆向的区别_Pwn之简单patch
  10. LeetCode 664. 奇怪的打印机(区间DP)