作者 | 神经小兮

来源 | HyperAI超神经

春节已经过完,你是否还沉浸在年味里?

到腊月二十九、三十,家家户户贴上了 红红的春联,春节就正式拉开了序幕。

春联也称为「对联」、「门对」、「楹联」,是汉语所独有的一种艺术形式,有着悠久的历史。2005 年,中国国务院把楹联习俗,列为第一批国家非物质文化遗产名录。

对联对联,讲究的就是「成对」,要对仗工整,平仄协调。不过现代人的对对联技能,已经远不如古代的文人墨客,甚至有时候可能连上下联都傻傻分不清楚。而聪明的 AI 已经学会自己写对联了。

70 万条对联数据,教会 AI 对对子

在现有公开的对联数据集中,以冯重朴_梨味斋散叶_的博客所发布的 couplet-dataset 数据最为庞大、使用也最为广泛。

左右滑动查看数据集节选内容

前两张分别为训练集的上联和下联

后两张分别为测试集的上联和下联

这份数据集共包含 70 余万条对联数据,按字切分。

数据集分为训练集、测试集以及词汇表。

其中,如上图节选内容所示,训练集分输入、输出两部分,分别为对联的上联与下联,按次序一一对应,测试集同理。

数据集详细信息如下:

couplet-dataset 

对联数据集

数据来源:冯重朴_梨味斋散叶

包含数量:70 万条对联

数据格式:.txt

数据大小:59.7 MB(压缩文件 27.4 MB)

地址:https://hyper.ai/datasets/14547

这个数据集已经成为对联数据中的「团宠」,被众多 AI 工程师、团队用来作为写对联模型的训练数据集,华为的乐府春联亦是用该数据集训练而来,可通过以上地址或点击阅读原文,下载该数据集。不过有一个小小的遗憾是,这一数据集中没有横批,还需要各位自己发挥。

AI:没有我对不出来的对联

一位名叫王斌的程序员,爬取和使用该对联数据集,用 GTX 1080 Ti 训练了 4 天,得到了一个自动对对联模型。效果如何?我们来测试一下。

左右滑动查看更多

测试地址:https://ai.binwang.me/couplet/

这位程序员还将该项目在 GitHub 开源:

https://github.com/wb14123/couplet-dataset

另外一位工程师,则基于 GPT2-Chinese 和该对联数据集,训练了一份对联领域的 GPT-2 模型,可自动生成对联。

它将其 server 版本对接到微信公众号 AINLP 后台,可以直接在对话框进行测试。

输入关键词「写对联」,可触发对联自动生成,例如输入「写对联金牛」,对联模型会基于「金牛」进行自动续写,给出以「金牛」开头的 3 个对联:

左右滑动查看更多

输入「对对联 + 一组上联」,可得到三组对联,比如:

左右滑动查看更多

目前看来,对于一些经典对联,AI 能做到对仗比较工整,且想象力丰富,对于同一上联,可对出多个不同下联;而对于一些不常在对联中出现的字词,AI 表现有些随意牵强。当然,让 AI 对「人工智能」什么的,也的确是有些为难人家了。

华为团队开发的 AI 对联,也是以 Couplet-dataset 对联数据集作为训练数据。该模型可以根据给定主题,生成对联。以下分别是输入「新春快乐」、「平安健康」、「一夜暴富」主题的生成结果,可滑动查看:

左右滑动查看不同主题的 AI 对联

明年,你要不要也训练一个自己的 AI 写春联模型,为家人写副对联呢?

更多精彩推荐
☞Ant Design 遭删库!☞每年节省170万美元的文档预览费用,借助机器学习的DropBox有多强?☞英超引入 AI 球探,寻找下一个足球巨星
☞三年投 1000 亿,达摩院何以仗剑走天涯?
点分享点收藏点点赞点在看

明年,我要用 AI 给全村写对联相关推荐

  1. 把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

    明敏 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 高考刚过去不久,就有AI来"挑事"了. 这不,有个AI读完了毛选和鲁迅全集后,大笔一挥,写下好几篇高考作文. 结果 ...

  2. 告别写笔记,AI 实时转写黑科技来了!

    作者 | 伍杏玲 出品 | CSDN(ID:CSDNnews) 前两天是教师节,大家在感恩老师们的培养之余,你是否怀念起青春学生时代,想起写得密密麻麻的课堂笔记?可现在的学生,已告别手抄笔记了! 据北 ...

  3. 标贝科技| AI裁判、写手、保姆…站在人性和技术的十字路口

    ​人工智能(AI)已经成为科技界最热门的话题,没有之一,这个行业之所以奇妙而具有前景,正在于其无限的应用场景,但凡能和智能,特别是低智商活动沾上点关系的工作都能交给人工智能去做,比如正在如火如荼进行的 ...

  4. Paddle2.0 + CPM-LM:让AI帮你写文章吧

    引入 之前的两个项目分别介绍了GPT-2模型的构建,和如何使用GPT-2加载CPM模型实现问答机器人 由于之前项目所使用的解码方式为Greedy_Search,生成的文本固定且单一,并不适合与写作类型 ...

  5. 15个借助AI,ChatGPT自动写代码工具

    整理了15个借助AI和ChatGPT辅助我们自动写代码的工具,整理到 15个借助AI,ChatGPT自动写代码工具http://www.webhub123.com/#/home/detail?proj ...

  6. 把毛选和鲁迅全集喂给AI后,写出来的作文太对味了

    本文转载自量子位 高考刚过去不久,就有AI来"挑事"了. 这不,有个AI读完了毛选和鲁迅全集后,大笔一挥,写下好几篇高考作文. 结果--竟然还可以? 我们直接看文章: 看看这字里行 ...

  7. 鼠年春节,用 GPT-2 自动写对联和对对联

    鼠年春节临近,来试试新的基于 GPT2-Chinese 自动对联系统:自动写对联(输入开头进行对联自动生成)和自动对对联(输入上联自动写下联).老的自动对联功能是去年基于深度学习机器翻译模型上线的一个 ...

  8. 输入关键字生成对联_教你一秒变大师,亲手提笔写对联

    会写对联,是一件很有意思的事. 以前春节求对联,是考验人际关系的时候. 十里八乡谁字写的好,到了春节前,他家肯定纸满为患,全是亲朋好友送来要写对联的. 到了现在,工厂里.小区里,到了春节也会组织人摆摊 ...

  9. 教你用人工智能写文章写歌词写对联

    最近一直在研究人工智能智能,从gpt2.transformers.bert.... 最后发现,其实对小白来说,人工智能并没有那么高大上,看代码像看天书.... 其实你只要会安装python,懂pip是 ...

最新文章

  1. [PKUWC2018]随机算法
  2. python画彩色城墙_Python绘制城堡-(有惊喜!!!)
  3. valgrind 的使用简介
  4. python程序设计典型例题-python 大题 典型
  5. 成员缩写_青春有你2snh48成员都有谁 10名SNH48女团成员介绍
  6. oracle的SCN和Checkpoint_Change#的关系
  7. 前端学习(1874)vue之电商管理系统电商系统之修改element-ui组件的按需导入
  8. 分块编码(Transfer-Encoding: chunked)
  9. 浏览器 cookie 和 session 的认识
  10. 【GitHub Desktop】(GitHub Windows桌面版) 中文汉化,(GitHub客户端汉化,非网页端插件)
  11. LCD12864图片字模生成
  12. 使用Flvplayer.swf播放器播放 .flv 格式的视频
  13. win10系统重装教程
  14. 处理器排行_2019年度PC处理器性能排行榜:AMD反超Intel
  15. K8S教程(7)使用探针对容器进行健康检查
  16. 基于PANDA做DTI分析
  17. GLES2.0中文API-glBindAttribLocation
  18. 活字印刷引入简单工厂模式
  19. java 安全警告 关闭_关闭安全警告的两种方法
  20. Sharding-JDBC + SpringBoot

热门文章

  1. esxi4.1使用IDE格式磁盘
  2. 深度学习与计算机视觉系列(9)_串一串神经网络之动手实现小例子
  3. MySQL的log_bin和sql_log_bin 到底有什么区别?
  4. try finally 中的return
  5. fgets()用法笔记
  6. Windows 2008 R2 SP1部署Lync2010企业版(四)
  7. 底盘智能化的关键技术探讨
  8. #pragma once与#ifndef
  9. linux文本处理常用命令
  10. MySQL的information_schema