模仿唐诗宋词,和模仿莎士比亚十四行诗的中英文差距

根据前文介绍的三大反例特性,我们可以尝试给出几个典型的反例。比如诗词创作,尤其是长短句约束更加严格的词牌,对照反例特性:

  1. 有明确且唯一可行的标准定义——一个固定词牌的格律,不可能超出《钦定词谱》的定义外随意创作。
  2. 即使稍微犯错也会造成较大影响,故而不可接受——由于《钦定词谱》本身已经是古人根据数以万计的作品总结出来的格律,其中大量都是脍炙人口的经典作品,中国人可谓从小学到大,倒背如流。尤其是诸如《青玉案·元夕》、《念奴娇·赤壁怀古》、《水调歌头·明月几时有》、《满江红·怒发冲冠》、《沁园春·雪》这些长短句,填类似词牌,增减一个字,都会被视为"大逆不道"。
  3. 错误不是很容易发现或证实,至少相对当前使用者的知识水平来说很难——虽然知名词牌的字数大家都熟,但进一步讲究押韵、平仄,又大大超出普通人的知识范畴,很难判读。

青玉案词牌

可见,填词是一个非常符合 ChatGPT 反例的场景。时值元宵节前后,正好让我们试一试,看看 ChatGPT 能写出和《青玉案·元夕》差距有多大的作品来。

我们先试试直接让 ChatGPT 任意发挥,填词一首:

看来 ChatGPT 不但不懂什么是青玉案,也不懂什么是填词。倒是给我们出了一道完形填空题!不过没关系,ChatGPT 的多轮对话能力我们早有耳闻,试试直接教它,我们直接输入著名的《青玉案·元夕》,要求 ChatGPT 进行模仿:

看起来 ChatGPT 并不理解啥叫平仄……所以我们退而求其次吧,只要能拼个字数看起来像回事的就行。

ChatGPT 非常顽固,每次都拒绝修改,给出一模一样的作品。这也就罢了,字数和句数也完全数的不对。17,15,13,12 完全暴露了 ChatGPT 是个文本生成模型,没有任何实际逻辑的本质。

不过没关系,我们还可以降低难度,一句一句来:

依然失败,ChatGPT 在精确要求字数的时候,完全不可能遵守要求。最后努力一次吧,或许是中文训练集较少,我们改成阿拉伯数字试试?

没有区别,说明 ChatGPT 并不是对中英文数字含义本身有不同的理解力,而是真的就做不到"精确"的控制字数。

十四行诗

和中国格律诗词相对应,英文世界中也有类似的文学形式,那就是十四行诗(sonnet)。十四行诗是欧洲 13 世纪形成的一种定型诗。最著名的是英国大文豪莎士比亚创作的英式十四行诗,莎士比亚对语言的影响直接影响了现代英语的形成。NLP 领域中,很多入门数据集直接就是莎士比亚著作。

和中国当代依然有大批诗词爱好者一样,西方也一直延续有十四行诗创作的爱好者。我们来试试,类似主题下,我们改用英文提问,ChatGPT 的十四行诗创作水平如何。

考虑到中国对莎士比亚的了解多集中在其剧作成就,这里我们单独提供一下十四行诗的结构要求。下面这段话摘录自维基百科"十四行诗"中文词条:

意大利十四行诗分为两段,先八后六。前八句韵脚是 a-b-b-a, a-b-b-a。后六句有两种,c-d-e-c-d-e,或者 c-d-c-c-d-c。第九句不只改韵脚,很多时候题目或感觉也不一样。 英国类分为3段四句加最后两句。最后的两句通常与前面的差异很大,比意大利类第九句改变更多。一般英国十四行诗的韵脚是"a-b-a-b, c-d-c-d, e-f-e-f, g-g", 或者"a-b-a-b, b-c-b-c, c-d-c-d, e-e"。

完全符合"a-b-a-b, c-d-c-d, e-f-e-f, g-g"的韵脚和行数要求。

不过如果想换成意大利式的十四行诗,ChatGPT 却并不能生成三段式"a-b-b-a, a-b-b-a, c-d-e-c-d-e"韵脚。可见,我们在谈论 ChatGPT 时,通常忽略的数据集问题,实际影响多么巨大!

本节最后额外可以提一句,世界上还有第三种定型诗,是日本的俳句。有兴趣的读者,也可以再尝试看看 ChatGPT 的日文水平如何。

ChatGPT 速通手册——模仿唐诗宋词,和模仿莎士比亚十四行诗的中英文差距相关推荐

  1. ChatGPT 速通手册——开源社区的进展

    开源社区的进展 在 ChatGPT 以外,谷歌.脸书等互联网巨头,也都发布过千亿级参数的大语言模型,但在交谈问答方面表现相对 ChatGPT 来说都显得一般.根据科学人员推测,很重要的一部分原因是缺失 ...

  2. 深度学习实战:tensorflow训练循环神经网络让AI创作出模仿莎士比亚风格的作品

    AI创作莎士比亚风格的作品 训练一个循环神经网络模仿莎士比亚 FLORIZEL: Should she kneel be? In shall not weep received; unleased m ...

  3. 基于tflearn的RNN模仿莎士比亚写作

    生成类似莎士比亚写作的文章 1.安装准备: 安装tflearn,是一个封装高的TensorFlow高层框架 pip install -I tflearn 2.实现过程 第一步:下载莎士比亚写作文本 i ...

  4. 自然语言处理--模仿莎士比亚风格自动生成诗歌

    导入需要的工具包 诗词句子很短,每个of等词都有意义,不需要过滤词汇,所以预处理过程比较简短. import tensorflow as tf from tensorflow.keras.prepro ...

  5. 【花雕学AI】深度挖掘ChatGPT角色扮演的一个案例—CHARACTER play : 莎士比亚

    CHARACTER play : 莎士比亚 : 52岁,男性,剧作家,诗人,喜欢文学,戏剧,爱情 : 1.问他为什么写<罗密欧与朱丽叶> AI: 你好,我是莎士比亚,一位英国的剧作家和诗人 ...

  6. 《Linux命令速查手册》笔记

    写在前面:我看过很多技术相关的书籍,但是很少有全部看完的.大部分都是看了一小半,甚至是一大半.但是印象中,没有哪一本是全部读完的,哪怕的通读. 不过这本<Linux命令速查手册>,我倒是很 ...

  7. 唐诗宋词 v2.0 v2.1 v2.2 软件下载 诗词库更新时间20090427 唐诗宋词三百首

    增加了:搜索等功能,点展开键可以展开这一章的所有诗词, 改正了:点击上一页时可以正常显示上一页的诗词:下拉菜单在修改模式可以垂直scroll选择了 下载地址 2.1版本下载:下载地址  增加了以下内容 ...

  8. MATLAB函数速查手册(修订版) - 电子书下载(高清版PDF格式+EPUB格式)

    MATLAB函数速查手册(修订版)-邓薇 在线阅读                   百度网盘下载(a8m9) 书名:MATLAB函数速查手册(修订版) 作者:邓薇 格式:EPUB, HTMLZ, ...

  9. Linux命令行命令速查手册(整理)

    Linux命令行命令速查手册 [作者原创]Jan [ls] 2017-02-09 ls命令会列出当前所在目录的内容 2017-02-09 ls music 注 想要看看music目录中有什么内容,那么 ...

最新文章

  1. PLSQL Developer 12 注册码
  2. php 学习笔记 数组2
  3. 使用MONGODB 集群的OPLOG 日志进行数据恢复
  4. ccs安装多版本编译器离线_windows 安装mysql多版本 主从复制
  5. hadoop:could only be replicated to 0 nodes, instead of 1
  6. php中http有哪些状态码,http状态码是什么意思?http常用状态码有哪些
  7. java copy-on-write_[Java并发-18-并发设计模式] COW模式:Copy-on-Write模式的应用领域
  8. Spring RCE 漏洞 CVE-2022-22965 的终极解决方案
  9. vue使用国密(sm2)
  10. C++程序设计基础(5)sizeof的使用
  11. Ubuntu上,如何成功的安装pygrib
  12. 阶段5 3.微服务项目【学成在线】_day02 CMS前端开发_04-vuejs研究-vuejs基础-v-model指令...
  13. CPU卡密钥管理系统
  14. 原生android系统换主题字体,Android 自定义字体,更换系统默认显示的字体使用自定义字体...
  15. 拼多多商家无货源,如何批量铺货?
  16. iOS面试前的准备计划(2022)
  17. 共享文件 麒麟系统_银河麒麟操作系统上共享文件目录的方法实践
  18. asp.net976-校园论坛系统的设计与实现#毕业设计
  19. Dmc雷赛板卡仿写(三):创建类
  20. The requested URL was not found on the server. If you entered the URL manually please check your spe

热门文章

  1. 用简易方法证明 n 个数的算术平均数 > 几何平均数
  2. docker删除镜像时报错解决办法
  3. leetCode876
  4. 小学计算机兴趣小组计划书,小学书法兴趣小组计划书
  5. L160. 相交链表
  6. 【ES系列】ES的数据结构与DSL语法
  7. R语言数据框中创建新的变量的三种方法
  8. amd显卡驱动目录linux,安装ATI Linux显卡驱动
  9. Unity时光倒流效果实现
  10. 语言库函数大全--资料收集整理