明年,我要用 AI 给全村写对联
作者 | 神经小兮
来源 | HyperAI超神经
春节已经过完,你是否还沉浸在年味里?
到腊月二十九、三十,家家户户贴上了 红红的春联,春节就正式拉开了序幕。
春联也称为「对联」、「门对」、「楹联」,是汉语所独有的一种艺术形式,有着悠久的历史。2005 年,中国国务院把楹联习俗,列为第一批国家非物质文化遗产名录。
对联对联,讲究的就是「成对」,要对仗工整,平仄协调。不过现代人的对对联技能,已经远不如古代的文人墨客,甚至有时候可能连上下联都傻傻分不清楚。而聪明的 AI 已经学会自己写对联了。
70 万条对联数据,教会 AI 对对子
在现有公开的对联数据集中,以冯重朴_梨味斋散叶_的博客所发布的 couplet-dataset 数据最为庞大、使用也最为广泛。
左右滑动查看数据集节选内容
前两张分别为训练集的上联和下联
后两张分别为测试集的上联和下联
这份数据集共包含 70 余万条对联数据,按字切分。
数据集分为训练集、测试集以及词汇表。
其中,如上图节选内容所示,训练集分输入、输出两部分,分别为对联的上联与下联,按次序一一对应,测试集同理。
数据集详细信息如下:
couplet-dataset
对联数据集
数据来源:冯重朴_梨味斋散叶
包含数量:70 万条对联
数据格式:.txt
数据大小:59.7 MB(压缩文件 27.4 MB)
地址:https://hyper.ai/datasets/14547
这个数据集已经成为对联数据中的「团宠」,被众多 AI 工程师、团队用来作为写对联模型的训练数据集,华为的乐府春联亦是用该数据集训练而来,可通过以上地址或点击阅读原文,下载该数据集。不过有一个小小的遗憾是,这一数据集中没有横批,还需要各位自己发挥。
AI:没有我对不出来的对联
一位名叫王斌的程序员,爬取和使用该对联数据集,用 GTX 1080 Ti 训练了 4 天,得到了一个自动对对联模型。效果如何?我们来测试一下。
左右滑动查看更多
测试地址:https://ai.binwang.me/couplet/
这位程序员还将该项目在 GitHub 开源:
https://github.com/wb14123/couplet-dataset
另外一位工程师,则基于 GPT2-Chinese 和该对联数据集,训练了一份对联领域的 GPT-2 模型,可自动生成对联。
它将其 server 版本对接到微信公众号 AINLP 后台,可以直接在对话框进行测试。
输入关键词「写对联」,可触发对联自动生成,例如输入「写对联金牛」,对联模型会基于「金牛」进行自动续写,给出以「金牛」开头的 3 个对联:
左右滑动查看更多
输入「对对联 + 一组上联」,可得到三组对联,比如:
左右滑动查看更多
目前看来,对于一些经典对联,AI 能做到对仗比较工整,且想象力丰富,对于同一上联,可对出多个不同下联;而对于一些不常在对联中出现的字词,AI 表现有些随意牵强。当然,让 AI 对「人工智能」什么的,也的确是有些为难人家了。
华为团队开发的 AI 对联,也是以 Couplet-dataset 对联数据集作为训练数据。该模型可以根据给定主题,生成对联。以下分别是输入「新春快乐」、「平安健康」、「一夜暴富」主题的生成结果,可滑动查看:
左右滑动查看不同主题的 AI 对联
明年,你要不要也训练一个自己的 AI 写春联模型,为家人写副对联呢?
更多精彩推荐
☞Ant Design 遭删库!☞每年节省170万美元的文档预览费用,借助机器学习的DropBox有多强?☞英超引入 AI 球探,寻找下一个足球巨星
☞三年投 1000 亿,达摩院何以仗剑走天涯?
点分享点收藏点点赞点在看
明年,我要用 AI 给全村写对联相关推荐
- 把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了
明敏 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 高考刚过去不久,就有AI来"挑事"了. 这不,有个AI读完了毛选和鲁迅全集后,大笔一挥,写下好几篇高考作文. 结果 ...
- 告别写笔记,AI 实时转写黑科技来了!
作者 | 伍杏玲 出品 | CSDN(ID:CSDNnews) 前两天是教师节,大家在感恩老师们的培养之余,你是否怀念起青春学生时代,想起写得密密麻麻的课堂笔记?可现在的学生,已告别手抄笔记了! 据北 ...
- 标贝科技| AI裁判、写手、保姆…站在人性和技术的十字路口
人工智能(AI)已经成为科技界最热门的话题,没有之一,这个行业之所以奇妙而具有前景,正在于其无限的应用场景,但凡能和智能,特别是低智商活动沾上点关系的工作都能交给人工智能去做,比如正在如火如荼进行的 ...
- Paddle2.0 + CPM-LM:让AI帮你写文章吧
引入 之前的两个项目分别介绍了GPT-2模型的构建,和如何使用GPT-2加载CPM模型实现问答机器人 由于之前项目所使用的解码方式为Greedy_Search,生成的文本固定且单一,并不适合与写作类型 ...
- 15个借助AI,ChatGPT自动写代码工具
整理了15个借助AI和ChatGPT辅助我们自动写代码的工具,整理到 15个借助AI,ChatGPT自动写代码工具http://www.webhub123.com/#/home/detail?proj ...
- 把毛选和鲁迅全集喂给AI后,写出来的作文太对味了
本文转载自量子位 高考刚过去不久,就有AI来"挑事"了. 这不,有个AI读完了毛选和鲁迅全集后,大笔一挥,写下好几篇高考作文. 结果--竟然还可以? 我们直接看文章: 看看这字里行 ...
- 鼠年春节,用 GPT-2 自动写对联和对对联
鼠年春节临近,来试试新的基于 GPT2-Chinese 自动对联系统:自动写对联(输入开头进行对联自动生成)和自动对对联(输入上联自动写下联).老的自动对联功能是去年基于深度学习机器翻译模型上线的一个 ...
- 输入关键字生成对联_教你一秒变大师,亲手提笔写对联
会写对联,是一件很有意思的事. 以前春节求对联,是考验人际关系的时候. 十里八乡谁字写的好,到了春节前,他家肯定纸满为患,全是亲朋好友送来要写对联的. 到了现在,工厂里.小区里,到了春节也会组织人摆摊 ...
- 教你用人工智能写文章写歌词写对联
最近一直在研究人工智能智能,从gpt2.transformers.bert.... 最后发现,其实对小白来说,人工智能并没有那么高大上,看代码像看天书.... 其实你只要会安装python,懂pip是 ...
最新文章
- [PKUWC2018]随机算法
- python画彩色城墙_Python绘制城堡-(有惊喜!!!)
- valgrind 的使用简介
- python程序设计典型例题-python 大题 典型
- 成员缩写_青春有你2snh48成员都有谁 10名SNH48女团成员介绍
- oracle的SCN和Checkpoint_Change#的关系
- 前端学习(1874)vue之电商管理系统电商系统之修改element-ui组件的按需导入
- 分块编码(Transfer-Encoding: chunked)
- 浏览器 cookie 和 session 的认识
- 【GitHub Desktop】(GitHub Windows桌面版) 中文汉化,(GitHub客户端汉化,非网页端插件)
- LCD12864图片字模生成
- 使用Flvplayer.swf播放器播放 .flv 格式的视频
- win10系统重装教程
- 处理器排行_2019年度PC处理器性能排行榜:AMD反超Intel
- K8S教程(7)使用探针对容器进行健康检查
- 基于PANDA做DTI分析
- GLES2.0中文API-glBindAttribLocation
- 活字印刷引入简单工厂模式
- java 安全警告 关闭_关闭安全警告的两种方法
- Sharding-JDBC + SpringBoot
热门文章
- esxi4.1使用IDE格式磁盘
- 深度学习与计算机视觉系列(9)_串一串神经网络之动手实现小例子
- MySQL的log_bin和sql_log_bin 到底有什么区别?
- try finally 中的return
- fgets()用法笔记
- Windows 2008 R2 SP1部署Lync2010企业版(四)
- 底盘智能化的关键技术探讨
- #pragma once与#ifndef
- linux文本处理常用命令
- MySQL的information_schema