note

ChatGPT的诞生,源于研究者「暴力美学」的手段。

如果大胆预测,ChatGPT能火几年,我猜可能是2到3年的时间,到2025年大概又要更新换代了。

工业界相较于学术界拥有巨大优势。这种「AI 的马太效应」会造成胜者通吃的局面。更加危急的是,任务、甚至研究领域之间的壁垒被打破了,所有的问题都可以转化为一个「Seq2Seq」问题,计算机视觉等领域的研究者也会逐渐涌入该领域。

与搜索引擎时代类似,如果将 OpenAI 比作当年的 Google,国内也一定会出现 ChatGPT 时代的「百度」。在这之前,许多机构和企业都有机会放手一搏,做出自己的大模型。相较于其它领域的研究者,NLPer 的真正优势可能在于更加了解语言。

文章目录

  • note
  • 一、从NLPer视角大胆预测:ChatGPT还能火多久
  • 二、ChatGPT的核心技术
  • 三、NLP学术界如何应对ChatGPT的挑战

一、从NLPer视角大胆预测:ChatGPT还能火多久

自然语言处理领域的发展历史大致可以分为四个阶段:
基于规则的小规模专家知识(1950-1990)
浅层机器学习算法(1990-2010)
深度学习算法(2010-2017)
大规模预训练模型(2018-2023)

ChatGPT正是遵循着这样一条路,时间线上有一个有趣的预测,每一个阶段的发展的时间,大概是上一个阶段发展时间的一半,基于规则发展了40年,浅层学习做了20年,之后深度学习做了10年,所以预测大规模训练模型发展的时间是5年,恰好到2022年底2023年初,产生了ChatGPT,以及GPT-4即将发布,标志着一个时代的结束。如果大胆预测,ChatGPT能火几年,我猜可能是2到3年的时间,到2025年大概又要更新换代了。当然这是半开玩笑的说法。


大规模预训练模型依赖于大模型,大数据、大算力。以 GPT-3 为例,该模型在没有经受过任何特定任务训练的情况下,可以通过样例学习完成十余种文本生成任务。

然而,相较于 ChatGPT,OpenAI 两年前发布的GPT-3 并没有引起如此之大的关注度。究其原因,其中之一可能是该模型缺乏知识推理能力,可解释性也欠佳。该模型的原始论文指出,该模型在「故事结尾选择」任务上的能力比哈工大丁效老师等人所提出的具有知识推理能力的模型性能低 4.1%。GPT-3 此类预训练语言模型在深层次语义理解能力上与人类认知水平还有很大差距。

为了解决该问题,一些研究者考虑向模型中引入知识;另一些研究者则采取「暴力美学」的手段,并发展出了如今的 ChatGPT。


如上图所示,ChatGPT 的效果惊艳,不仅能够给出正确的答案,还具有一定的可解释性。


ChatGPT 的成功本质上反映了人们对知识的表示和调用方式产生了重大变革。

在关系型数据库时代,符号化的知识表示精度很高,但是需要使用 SQL 语句调用,较为复杂且不自然,代表性的应用为 DBMS,代表公司为Oracle和微软。

在互联网时代,知识以文字、图像、音频、视频等形式存在,我们通过输入查询关键词来调用知识,代表性的应用为搜索引擎,这个阶段代表公司有谷歌和微软。

在大模型时代,知识表示为大模型及其参数,大模型相当于一个知识库,其知识表示精度较低。在 GPT-3 刚出现时,尽管蕴含大量的知识,但是其调用方式并不自然(构建 Prompt)。ChatGPT 则实现了使用自然语言指令调用知识,这种知识的表示和调用方式是一种根本性的变革。代表公司为OpenAI,微软谷歌以及百度等国内公司也在陆续发力。

二、ChatGPT的核心技术


细数语言技术的四个阶段,以 Bert 为代表的预训练语言模型主要解决了语义匹配的问题;ChatGPT 相对较好地解决了推理任务;下一阶段,自然语言处理算法需要考虑语用问题,对于同样的语言输入,模型需要理解不同语气、表情、语音、语调所蕴含的不同意义。

具体技术进展方面,ChatGPT 的核心技术主要包含以下四点:

  • 大规模预训练模型:涌现出推理能力;
  • Prompt/Instruction Tuning:通过 Prompt 统一各种任务,在众多类型任务的标注数据上精调语言模型,处理未见任务;
  • 在代码上进行继续预训练:涌现出逐步推理能力,代码分步骤、分模块解决问题,代码语言模型需要更长的上下文;
  • 基于人类反馈的强化学习 RLHF:结果更符合人类预期,利用真实用户的反馈。这些技术的融合形成了惊艳的效果。

三、NLP学术界如何应对ChatGPT的挑战

在 ChatGPT 时代,自然语言处理领域的发展趋势与早年间的信息检索领域类似。随着搜索引擎的出现,这种系统级别的研究为学术界带来了巨大的危机,学术界可做的研究越来越少。信息检索领域的顶会 SIGIR 相较于其它 AI 顶级会议的论文发表数量要少得多。与此同时,工业界由于掌握了大量的计算资源、用户数据、用户反馈,相较于学术界拥有巨大的优势。这种「AI 的马太效应」会造成胜者通吃的局面。更加危急的是,任务、甚至研究领域之间的壁垒被打破了,所有的问题都可以转化为一个「Seq2Seq」问题,计算机视觉等领域的研究者也会逐渐涌入该领域。

为了应对当前的挑战,自然语言领域的研究者可以借鉴信息检索研究者的经验。首先,学术界可能不再进行系统级别的研究,主要集中在相对边缘的研究方向上;其次,使用工业界巨头提供的数据进行实验,并不一定能得出可靠的结论,由于存在隐私问题,数据的真实性存疑;通过调用公司提供的 API 进行研究,一旦模型被调整,其结论有可能也会改变。

与搜索引擎时代类似,如果将 OpenAI 比作当年的 Google,国内也一定会出现 ChatGPT 时代的「百度」。在这之前,许多机构和企业都有机会放手一搏,做出自己的大模型。相较于其它领域的研究者,NLPer 的真正优势可能在于更加了解语言。

本文整理自「青源Workshop(第20期)|LLM and Chatbot: Endgame, Worse is Better, How to Win Big 」闭门研讨会的引导报告环节,哈尔滨工业大学教授车万翔介绍了ChatGPT效果惊艳的原因,以及ChatGPT时代NLP研究者面临的机遇与挑战。

哈工大车万翔:ChatGPT时代,NLPer 的危与机相关推荐

  1. 车万翔:ChatGPT时代,NLPer 的危与机

    来自:智源社区 要点速览: ChatGPT的诞生,源于研究者「暴力美学」的手段. 如果大胆预测,ChatGPT能火几年,我猜可能是2到3年的时间,到2025年大概又要更新换代了. 工业界相较于学术界拥 ...

  2. 哈工大中文信息处理_【NLP】哈工大车万翔教授 自然语言处理NLPer的核心竞争力是什么?19页ppt...

    点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要4分钟 跟随小博主,每天进步一丢丢 整理:专知 导读 自然语言处理是当前人工智能研究的重要方向之一.那么从事NLP的人员如何能够不断升级,构建核 ...

  3. 哈工大车万翔:自然语言处理范式正在变迁

    Datawhale干货 作者:车万翔,哈工大教授,编辑:李rumor 最近几天被OpenAI推出的ChatGPT[1]刷屏了,其影响已经不仅局限于自然语言处理(NLP)圈,就连投资圈也开始蠢蠢欲动了, ...

  4. 车万翔:ChatGPT只是“搬运工”而不是“创造者”,但NLP学术界确实非常危急!...

    省时查报告-专业.及时.全面的行研报告库 省时查方案-专业.及时.全面的营销策划方案库 [免费下载]2023年1月份热门报告合集 ChatGPT的发展历程.原理.技术架构及未来方向 <ChatG ...

  5. 哈工大教授车万翔:自然语言处理中的伪数据

    导语:自然语言处理被誉为"人工智能皇冠上的明珠".对语言的理解需要广义的"知识",即狭义知识,算法和数据的约束.目前的预训练+微调的范式充分利用了数据类&quo ...

  6. 危与机并存的动力电池行业,谁能成为下一个宁德时代?

    出乎很多人意料的是,曾经不被看好的新能源汽车在几年时间里交出了一张优秀答卷. 虽受疫情寒冬冲击,但从产销数据和消费者认知来看,新能源汽车行业依然保持着高速而稳定的增长. 2021年,全球售出新能源汽车 ...

  7. 【哈士奇赠书活动 - 22期】-〖ChatGPT时代:ChatGPT全能应用一本通〗

    文章目录 ⭐️ 赠书 - <ChatGPT时代:ChatGPT全能应用一本通> ⭐️ 内容简介 ⭐️ 作者简介 ⭐️ 赠书活动 → 获奖名单 ⭐️ 赠书 - <ChatGPT时代:C ...

  8. 网约车2.0时代,首汽约车让AI实时“听懂”打车服务

    导读:今后打首汽约车,出现司乘纠纷不用愁,AI帮你做主. "我们现在还处在网约车1.0时代,解决的是连接的效率问题.如何做到走心的服务,这个取决于平台背后的智能化能力,我们认为那才是网约车的 ...

  9. ChatGPT时代,我的新书《智慧共生》上市了

    告诉你一个好消息,我在人民邮电出版社的第二本书<智慧共生:ChatGPT 与 AIGC 生产力工具实践>刚刚上市,你现在就可以在 京东 和 当当买到了. 有人把 2022 年称作 AIGC ...

最新文章

  1. 更新版vimrc(java自动补全)
  2. feedback from waic
  3. c ++查找字符串_C ++数组| 查找输出程序| 套装5
  4. 年薪50-80万 | 海南省崖州湾种子实验室海外优青招聘公告
  5. 很久很久以前,我国有一批电脑高手
  6. linux终端下载vscode,如何在Ubuntu18上安装VScode
  7. 如何在单例模式下禁止init
  8. 科大讯飞半年报:营收和净利润双提升,AI市场仍有机会
  9. SpringBoot整合RabbitMQ测试代码
  10. ECG的滤波和检波资源汇总
  11. 《统计学习方法》读书笔记
  12. 关于vue自定义事件中,传递参数的一点理解
  13. java冒泡排序及面向对象基本概念
  14. 遗传算法原理及算法步骤(学习篇·上)
  15. 第三章 集合的基本概念和运算
  16. 服务器远程一直显示欢迎界面,windows server 2008R2 卡在欢迎界面
  17. svn基础学习之常用知识
  18. iphonex 序列号_iPhoneX怎么看序列号?苹果iPhoneX查看序列号的三种方法
  19. Android Zenmode/DND(勿扰模式) 实现原理剖析
  20. ABP VNext学习日记20

热门文章

  1. 云架构的一些核心概念
  2. 足坛诗人--贺炜的5大经典解说
  3. 服务器放在机柜哪个位置,服务器放在机柜
  4. Apache服务器的搭建与配置
  5. java寂静岭 攻略,GBA版《寂静岭》HARRY篇图文流程攻略
  6. Android Studio中 HAXM安装失败的问题(Intel HAXM installation failed. To install Intel HAXM follow the...)
  7. 概率论与统计推断(四) ------ 统计推断
  8. ubuntu中使用vi编辑无法使用上下左右移动键的处理方式
  9. 计算机毕业设计之SpringBoot+Vue.js工会管理系统 工会管理平台
  10. 中小企业 数量 e-mail_采购订单管理——中小企业采购容易忽视的环节