作者 | 马超

责编 | 伍杏玲

出品 | CSDN(ID:CSDNnews)

今日,浙江高考满分作文《生活在树上》突然火爆全网,由于这篇文章晦涩难懂,最初评分的老师先给出 39分,但经阅卷组复评和终审,最终给《生活在树上》以满分的成绩。

为了节约篇幅,这里只将这篇作文的前几段贴出来,不知道各位读者是否读懂了,笔者在看完《生活在树上》后,开始怀疑自己学习的到底是不是中文:

阅卷组指出这篇作文是值得肯定,但并不是说鼓励大家都去写这样的作文,而是鼓励大家按照自己的兴趣、个性,写出有个性化的,不是千篇一律的作文。以笔者对于AI自然语言处理的发展趋势的了解,阅卷组的这说法值得肯定,因为像上述文章风格如此鲜明,角度剑走偏峰的文章,将是AI的优势领域。AI不仅能写文章,还能通过口述写代码呢!

在程序员饭碗不保了?GPT-3 最强应用发布,动动手指就自动写代码的神器来了,笔者介绍过基于 OpenAI 在六月份发布的最新NLP模型 GPT-3 ,而来的debuid.co网站,可通过口述英文需求,自动出现代码,颇有10倍程序员的风范。

GPT-3 到底是什么黑科技?

强大的 GPT-3

去年,微软为了提升在AI 上的储备,花 10 亿美元投资 OpenAI,为了让OpenAI推出高质量的训练模型,微软配置了由28.5万个CPU核心、1万个英伟达GPU核心的超级计算机,目前这台超算在全球算力榜上排名前五。其中GPT-3容量达到了45TB,参数个数有1750亿的超级怪物,恰恰是由微软提供的超算训练而成。

为了发挥GPT-3的最大价值,OpenAI开放了对GPT-3的内测申请资格,有兴趣的读者可以到https://openai.com/blog/openai-api/申请。

OpenAI不像大多数人工智能系统只针对单一场景提供服务,他们的API提供了一个通用的“文本输入,文本输出”功能,所以从这个角度上讲OpenAI已经从某种程度上提供了通用人工智能的服务了。比如OpenAI的API就完全支持用“人话”控制计算机了,而且还能根据人的指示对于指行的命令进行修订。

能听懂人话的服务器出世,这对于运维工程师来说真的不是什么好消息。OpenAI提供的API还完全可以替代很多文秘的工作,比如填写表格时,AI可以给你建议的标题,还能自动根据给定标签填写好相应内容。

按照目前的趋势发展下去,OpenAI提供的能力几乎等同于全栈脑力劳动者,对于笔者这种以码字和码代码为生的来说,对于来自于AI的王之蔑视,有“不祥预感”。现在OpenAI仅提供英文的自然语言处理能力,英文和中文在语料组织上还是有区别的。

中文NLP

从本质上,中文中的字和英文中的Word并不是同一个概念,比如中文语境下“没钱买华为”到底是“华为太贵,因此买不起”还是“没钱的人会选择买华为的手机”是模糊的,中文没有时态的变化以对语义进行进一步的提示,因此一般最新的NLP模型都需要一定的移植工作才能在中文语境下发挥出高水平。

中文文本生成已不是难事了,比如基于TransfermerXL(https://github.com/GaoPeng97/transformer-xl-chinese)的项目,在以中文诗词进行训练后(https://github.com/chinese-poetry/chinese-poetry),拿来写诗的效果就不错。

GPT-3没有专门针对中文优化之前,笔者认为在中文领域效果最好的NLP模型是百度的 ERNIE 2.0(https://arxiv.org/pdf/1904.09223v1.pdf),这个模型试图从 3 个层面去更好的理解训练语料中蕴含的信息:

Word-aware Tasks: 词汇 (lexical) 级别信息的学习

Structure-aware Tasks: 语法 (syntactic) 级别信息的学习

Semantic-aware Tasks: 语义 (semantic) 级别信息的学习

其解读如下:

一、词汇理解方式

知识增强蒙板策略:相较于BERT使用的mask策略, 该策略可以更好的捕捉输入样本局部和全局的语义信息。这点可以说是ERNIE的最大创新。

举个例子说明:

BERT的mask策略 :哈 [mask] 滨是 [mask] 龙江的省会,[mask] 际冰 [mask] 文化名城。

ERNIE的mask策略:[mask] [mask] [mask] 是黑龙江的省会,国际 [mask] [mask] 文化名城。

ERNIE是一个增强型的针对整个语义进行mask的训练方式。

首字母大写预测:针对英文首字母大写词汇(如 Apple)所包含的特殊语义信息,在英文预训练中构造了一个分类任务去学习该词汇是否为大写,这个是在其它模型中没有看到的训练方法。

相关词汇出现预测:针对一个 段中出现的词汇,去预测该词汇是否也在原文档的其他 段中出现。

二、语句理解方式

乱序预测训练:针对一个 paragraph (包含 M 个 segments),我们随机打乱 segments 的顺序,通过一个分类任务去预测打乱的顺序类别。

语句距离训练:通过一个 3 分类任务,去判断句对 (sentence pairs) 位置关系 (包含邻近句子、文档内非邻近句子、非同文档内句子 3 种类别),更好的建模语义相关性。

三、语法理解方式

通过判断句对间的修辞关系更好地学习句间语义。

正如笔者前文所说Open AI提供的服务能力相当于一个全栈的脑力工作者,其执行力之强远超人们之前的认知,趋势不可阻挡,未来已来,与其在角落瑟瑟发抖,不如赶快拥抱AI,成为AI背后的程序员。

更多精彩推荐
☞停滞数年后,ElasticJob 携首个 Apache 版本 3.0.0-alpha 回归!
☞雷军:小米MIX α量产难度太大已放弃;iPhone 12系列将支持北斗导航;TypeScript 4.0 RC发布|极客头条
☞互联网不相信学渣
☞收藏!美国博士明确给出Python的高效学习技巧
☞垃圾回收策略和算法,看这篇就够了
☞2020 以太坊技术及应用大会·中国圆满落幕,大咖们的演讲精华都在这里了!
点分享点点赞点在看

写不出满分作文怎么办,GPT-3 来帮你相关推荐

  1. ChatGPT写全国甲卷,光问一遍怎么可能写出好作文,一文教你高效提问AI ~

    作者 | 乐意奥AI 点个关注呀 版本 | v2306.0 人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人. 这句引人深思的话来自今年的全国甲卷. 各位读者肯定在各大自媒体平台都看到了各 ...

  2. 计算机科学论文生成器,高考满分作文生成器来了!分分钟批量完成「生活在XX上」...

    原标题:高考满分作文生成器来了!分分钟批量完成「生活在XX上」 金磊 贾浩楠 发自 凹非寺量子位 报道 | 大众号 QbitAI如何才能写出一篇浙江省高考满分作文?就在最近,浙江省作文阅卷大组组长钦点 ...

  3. 高考满分作文生成器来了!分分钟批量完成「生活在XX上」,哲学文学物理各种领域任选...

    金磊 贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 如何才能写出一篇浙江省高考满分作文? 就在最近,浙江省作文阅卷大组组长钦点的满分作文火了: 但也备受争议--嚆矢.滥觞.祓魅.婞直. ...

  4. 高考满分作文生成器来了!分分钟批量完成「生活在XX上」,哲学文学物理各种领域任选......

    点击上方"五分钟学算法",选择"星标"公众号 重磅干货,第一时间送达 来自:量子位 如何才能写出一篇浙江省高考满分作文? 就在最近,浙江省作文阅卷大组组长钦点的 ...

  5. 说句心里话python怎么写_说句心里话小升初满分作文

    导读:小编根据大家的需要整理了一份关于<说句心里话小升初满分作文>的内容,具体内容: 相信每个人都有自己的心里话,我也有.下面是小编为大家精心整理的关于,希望能够帮助到你们. 说句心里话 ...

  6. c语言程序解决生活中的问题作文,生活中烦恼的事五年级满分作文

    在我们人生的道路上,总会遇到这样那样的烦恼,困难与挫折,但在那时候,我们更不能惊慌,要静下心来沉住气,认真的去想解决的方法.勇敢地去面对,这是人生的一道坎儿.下面是小编为大家整理的关于生活中烦恼的事五 ...

  7. 期末小作品图片_三年级语文期末满分作文《我想变成什么》,老师:你真懂事...

    郑重声明:原创作品,欢迎转发或分享,抄袭必究! 临近期末,一年一度的期末摸底考试开始了,三年级家长们格外关注孩子的语文期末成绩,因为随着知识点的增加以及难度的加深,很多三年级孩子第一学期语文期末成绩都 ...

  8. 以学生使用计算机写一篇英语作文,学英语的感受作文200:《学习心得》英语作文100字...

    学英语的感受作文200:<学习心得>英语作文100字 时间:2020-07-08 03:41:41 来源: <学习心得>英语作文100字words,grammars and s ...

  9. GRE 满分作文解析 + 实例 + 模板

    Table of Contents Issue Essay Argument Essay Issue:准备提纲 Issue要求考生根据所给的题目,完成一篇表明立场的逻辑立论文.Issue题库涉及社会. ...

最新文章

  1. [BUUCTF-pwn]——pwnable_orw
  2. 下载不了java应用程序_Java 7u45 - java webstart不会下载我的jar并执行应用程序,除非我显示java控制台...
  3. 数字系统设计学习之QuartusII9的安装
  4. MySQL 的 IFNULL()、ISNULL() 、 NULLIF()、IF() 函数
  5. 《CSS揭秘》:菱形图片
  6. 理解Towards Understanding Ensemble, Knowledge Distillation and Self-Distillation in Deep Learning
  7. 如何做跟进客户关系维护PPT课件?
  8. win10默认壁纸_仅4M!微软出品的壁纸软件,让桌面每天都不一样!
  9. 生物光子学 19节 加州大学戴维斯分校
  10. Linux性能调优,从优化思路说起
  11. 安焦删除贴 牛人纷纷出现(1)
  12. STM32F103ZE单片机FSMC接口读取NAND Flash芯片K9F1G08U0E的数据时出现数据丢失的解决办法
  13. org.jasypt.exceptions.EncryptionOperationNotPossibleException: null
  14. 理解围绕软件技术标准的上层动机和力量
  15. 维度灾难 维数灾难 暂记
  16. dataframe两个表合并_Spark DataFrame 不是真正的 DataFrame
  17. 一位对抗苹果的“勇士”:公开 iOS 未修复漏洞后,再写《恶意软件进 App Store 指南》
  18. ubuntu 删除搜狗 繁简切换快捷键
  19. CDA Day 7-8 Excel 数组学习总结2
  20. 精通正则表达式学习记录 第一章 正则表达式入门

热门文章

  1. [转]程序员应打破牢笼,展望更高层次的世界
  2. String类中的常用方法
  3. HTMO DOM部分---小练习;列表之间移动、日期选择、好友选中、滑动效果、滚动条效果、飞入飞出效果。...
  4. 优先队列详解priority_queue .RP
  5. docker 实战---使用oracle xe作为开发数据库(六)
  6. 恢复删除了数据文件的表MyISAM
  7. 转:技术宅逆天了!如何从按键音中听出周鸿祎的手机号码
  8. 查看MySQL以及SQL Server 实际存储类型
  9. html换浏览器div的位置固定不变,浏览器窗口更改时,HTML div不在适当的位置
  10. leetcode python3 简单题69. Sqrt(x)