ChatGPT 速通手册——模仿唐诗宋词,和模仿莎士比亚十四行诗的中英文差距
模仿唐诗宋词,和模仿莎士比亚十四行诗的中英文差距
根据前文介绍的三大反例特性,我们可以尝试给出几个典型的反例。比如诗词创作,尤其是长短句约束更加严格的词牌,对照反例特性:
- 有明确且唯一可行的标准定义——一个固定词牌的格律,不可能超出《钦定词谱》的定义外随意创作。
- 即使稍微犯错也会造成较大影响,故而不可接受——由于《钦定词谱》本身已经是古人根据数以万计的作品总结出来的格律,其中大量都是脍炙人口的经典作品,中国人可谓从小学到大,倒背如流。尤其是诸如《青玉案·元夕》、《念奴娇·赤壁怀古》、《水调歌头·明月几时有》、《满江红·怒发冲冠》、《沁园春·雪》这些长短句,填类似词牌,增减一个字,都会被视为"大逆不道"。
- 错误不是很容易发现或证实,至少相对当前使用者的知识水平来说很难——虽然知名词牌的字数大家都熟,但进一步讲究押韵、平仄,又大大超出普通人的知识范畴,很难判读。
青玉案词牌
可见,填词是一个非常符合 ChatGPT 反例的场景。时值元宵节前后,正好让我们试一试,看看 ChatGPT 能写出和《青玉案·元夕》差距有多大的作品来。
我们先试试直接让 ChatGPT 任意发挥,填词一首:
看来 ChatGPT 不但不懂什么是青玉案,也不懂什么是填词。倒是给我们出了一道完形填空题!不过没关系,ChatGPT 的多轮对话能力我们早有耳闻,试试直接教它,我们直接输入著名的《青玉案·元夕》,要求 ChatGPT 进行模仿:
看起来 ChatGPT 并不理解啥叫平仄……所以我们退而求其次吧,只要能拼个字数看起来像回事的就行。
ChatGPT 非常顽固,每次都拒绝修改,给出一模一样的作品。这也就罢了,字数和句数也完全数的不对。17,15,13,12 完全暴露了 ChatGPT 是个文本生成模型,没有任何实际逻辑的本质。
不过没关系,我们还可以降低难度,一句一句来:
依然失败,ChatGPT 在精确要求字数的时候,完全不可能遵守要求。最后努力一次吧,或许是中文训练集较少,我们改成阿拉伯数字试试?
没有区别,说明 ChatGPT 并不是对中英文数字含义本身有不同的理解力,而是真的就做不到"精确"的控制字数。
十四行诗
和中国格律诗词相对应,英文世界中也有类似的文学形式,那就是十四行诗(sonnet)。十四行诗是欧洲 13 世纪形成的一种定型诗。最著名的是英国大文豪莎士比亚创作的英式十四行诗,莎士比亚对语言的影响直接影响了现代英语的形成。NLP 领域中,很多入门数据集直接就是莎士比亚著作。
和中国当代依然有大批诗词爱好者一样,西方也一直延续有十四行诗创作的爱好者。我们来试试,类似主题下,我们改用英文提问,ChatGPT 的十四行诗创作水平如何。
考虑到中国对莎士比亚的了解多集中在其剧作成就,这里我们单独提供一下十四行诗的结构要求。下面这段话摘录自维基百科"十四行诗"中文词条:
意大利十四行诗分为两段,先八后六。前八句韵脚是 a-b-b-a, a-b-b-a。后六句有两种,c-d-e-c-d-e,或者 c-d-c-c-d-c。第九句不只改韵脚,很多时候题目或感觉也不一样。 英国类分为3段四句加最后两句。最后的两句通常与前面的差异很大,比意大利类第九句改变更多。一般英国十四行诗的韵脚是"a-b-a-b, c-d-c-d, e-f-e-f, g-g", 或者"a-b-a-b, b-c-b-c, c-d-c-d, e-e"。
完全符合"a-b-a-b, c-d-c-d, e-f-e-f, g-g"的韵脚和行数要求。
不过如果想换成意大利式的十四行诗,ChatGPT 却并不能生成三段式"a-b-b-a, a-b-b-a, c-d-e-c-d-e"韵脚。可见,我们在谈论 ChatGPT 时,通常忽略的数据集问题,实际影响多么巨大!
本节最后额外可以提一句,世界上还有第三种定型诗,是日本的俳句。有兴趣的读者,也可以再尝试看看 ChatGPT 的日文水平如何。
ChatGPT 速通手册——模仿唐诗宋词,和模仿莎士比亚十四行诗的中英文差距相关推荐
- ChatGPT 速通手册——开源社区的进展
开源社区的进展 在 ChatGPT 以外,谷歌.脸书等互联网巨头,也都发布过千亿级参数的大语言模型,但在交谈问答方面表现相对 ChatGPT 来说都显得一般.根据科学人员推测,很重要的一部分原因是缺失 ...
- 深度学习实战:tensorflow训练循环神经网络让AI创作出模仿莎士比亚风格的作品
AI创作莎士比亚风格的作品 训练一个循环神经网络模仿莎士比亚 FLORIZEL: Should she kneel be? In shall not weep received; unleased m ...
- 基于tflearn的RNN模仿莎士比亚写作
生成类似莎士比亚写作的文章 1.安装准备: 安装tflearn,是一个封装高的TensorFlow高层框架 pip install -I tflearn 2.实现过程 第一步:下载莎士比亚写作文本 i ...
- 自然语言处理--模仿莎士比亚风格自动生成诗歌
导入需要的工具包 诗词句子很短,每个of等词都有意义,不需要过滤词汇,所以预处理过程比较简短. import tensorflow as tf from tensorflow.keras.prepro ...
- 【花雕学AI】深度挖掘ChatGPT角色扮演的一个案例—CHARACTER play : 莎士比亚
CHARACTER play : 莎士比亚 : 52岁,男性,剧作家,诗人,喜欢文学,戏剧,爱情 : 1.问他为什么写<罗密欧与朱丽叶> AI: 你好,我是莎士比亚,一位英国的剧作家和诗人 ...
- 《Linux命令速查手册》笔记
写在前面:我看过很多技术相关的书籍,但是很少有全部看完的.大部分都是看了一小半,甚至是一大半.但是印象中,没有哪一本是全部读完的,哪怕的通读. 不过这本<Linux命令速查手册>,我倒是很 ...
- 唐诗宋词 v2.0 v2.1 v2.2 软件下载 诗词库更新时间20090427 唐诗宋词三百首
增加了:搜索等功能,点展开键可以展开这一章的所有诗词, 改正了:点击上一页时可以正常显示上一页的诗词:下拉菜单在修改模式可以垂直scroll选择了 下载地址 2.1版本下载:下载地址 增加了以下内容 ...
- MATLAB函数速查手册(修订版) - 电子书下载(高清版PDF格式+EPUB格式)
MATLAB函数速查手册(修订版)-邓薇 在线阅读 百度网盘下载(a8m9) 书名:MATLAB函数速查手册(修订版) 作者:邓薇 格式:EPUB, HTMLZ, ...
- Linux命令行命令速查手册(整理)
Linux命令行命令速查手册 [作者原创]Jan [ls] 2017-02-09 ls命令会列出当前所在目录的内容 2017-02-09 ls music 注 想要看看music目录中有什么内容,那么 ...
最新文章
- PLSQL Developer 12 注册码
- php 学习笔记 数组2
- 使用MONGODB 集群的OPLOG 日志进行数据恢复
- ccs安装多版本编译器离线_windows 安装mysql多版本 主从复制
- hadoop:could only be replicated to 0 nodes, instead of 1
- php中http有哪些状态码,http状态码是什么意思?http常用状态码有哪些
- java copy-on-write_[Java并发-18-并发设计模式] COW模式:Copy-on-Write模式的应用领域
- Spring RCE 漏洞 CVE-2022-22965 的终极解决方案
- vue使用国密(sm2)
- C++程序设计基础(5)sizeof的使用
- Ubuntu上,如何成功的安装pygrib
- 阶段5 3.微服务项目【学成在线】_day02 CMS前端开发_04-vuejs研究-vuejs基础-v-model指令...
- CPU卡密钥管理系统
- 原生android系统换主题字体,Android 自定义字体,更换系统默认显示的字体使用自定义字体...
- 拼多多商家无货源,如何批量铺货?
- iOS面试前的准备计划(2022)
- 共享文件 麒麟系统_银河麒麟操作系统上共享文件目录的方法实践
- asp.net976-校园论坛系统的设计与实现#毕业设计
- Dmc雷赛板卡仿写(三):创建类
- The requested URL was not found on the server. If you entered the URL manually please check your spe