前沿

这几天ChatGPT可谓是热火朝天,很多同事和朋友都来找到勇哥,说能不能说一说相关话题,但是之前几天勇哥都在默默的干一件大事情,今天终于成型、有结果了,所有就抽了点时间来和大家一起聊聊ChatGPT背后的技术,让大家对一自然语言处理背景的技术有一个入门级别的了解。

阅读本文你的收获★★★

  • 了解到ChatGPT是什么、有哪些功能?

  • 了解到ChatGPT背后自然语言技术有那些?

  • 了解到一般AI系统的工作流程

老规矩,你觉得本文不错,点赞、关注一下,鼓励鼓励勇哥!

ChatGPT简介

ChatGPT是OpenAi 在12 月 1 日上线的一套在线人机聊天产品,而这套产品这几天已经突破上100万的,可谓是火得不要不要的了,但勇哥总结其火的背后主要有这么几方面的因素:

  • OpenAi 背后的大佬是微软

  • ChatGPT之别被姓马的夸赞,起到了很好的宣传

  • OpenAi 这套产品自身从技术+架构方面有新的突破

  • 各位网友心中都有一个未来科技梦

  • ChatGPT不对中国区开放,但是支持中文(这点细品....)

在这里勇哥主要站在产品自身的技术和架构方面的突破来给大家说一说,先说一说ChatGPT能做什么,我简单的归类了一下功能,包括:

  • 知识问答

    • 知识点解答

    • 数学题求解

      .....

  • 文学创作

    • 写作文

    • 写诗

    • 写小说

    • 写邮件

      ......

  • 程序创作

    • 写代码

    • 改BUG

      ......

ChatGPT技术★★★

下面这张图是OpenAi官网上的一张说明图,但是这张图只说明了其系统的模型(PS:这里的模型大家可以简单理解成一对特殊的数据)训练和应用流程:

上图并没有说明太多这样系统的技术架构,那么勇哥在这里来给大家脑补一下,一般这种系统的数据流是如何进行流转的:

数据流说明:

ChatGPT是一个聊天系统,用户输入一句话,那么ChatGPT就需要依据用户输入的信息反馈相关内容,比如上述用户输入“背《观沧海》",系统接收到信息后,就经过以下处理,来为用户生产相对准确的答案:

  • Li处理:既语言识别(Language identification),ChatGPT是面向中国区之外的用户,因此用户输入的信息有多种语言,至于是那种语言需要先进行识别。识别之后既可以确定在PPO中使用的是中文、还是英文、还是其它模型数据。

  • Ea处理:既情感分析(Emotional analysis),ChatGPT对于输入信息进行了多中情感分析,如果情感不符合正能量方面的要求,ChatGPT会自动拒绝回答相关用户问题。这点也是非常必要的。Ea处理也需要基于PPO模型库来分析计算。

  • Ei处理:既抽取信息 (Extract information),从用户输入的信息中提取关键特征,为下一步准备数据

    • NER处理:既命名实体识别(Named entity recognition),负责提取其中的人名、地名、专业术语等信息

    • SS处理:既句子相似性处理(Sentence Similarity),用户输入的信息可能存在错别字等信息,通过此步可以进行一个修正

    • TC处理:既文本分类(Text Classification),把用户输入得信息进行分类,通过此步分类,好定位到下一步搜索用到的相关搜索索引

  • Full Search 处理:既全文搜索处理,ChatGPT是一个自然语言+搜索引擎集成的架构,通过Ei处理得到的数据就是全文搜索的输入数据,比如EI提取出 NER=观沧海,SS=,TC=文学,那么此步就可以去搜索文学索引中的《观沧海》,得到想要的答案。

  • TG处理:既文本生成(Text Generation),上一步搜索的结果可能有多条数据,那么那一条最符合用户需求呢?则通过RM模型来进行选取,选取后生成对应的文本内容。

  • QA处理:既问题解答(Question Answering),把上一步生成的答案进一步转换成适合问答的形式或格式。

总结:

ChatGPT总体架构技术是:NLP是核心 , 搜索辅助,算力是硬核

NLP : 上述流程描述中:Li、Ea、Ei、NER、SS、TC、TG、QA等处理,都需要依赖ChatGPT自身的GPT-3.5自然语言模型数据,而且按照上述流程执行,流程步骤长,上一步的结果就是下一步的输出,一步出错,结果必错。ChatGPT能做到现在这样已经是相当的了不起了。NLP自然就是ChatGPT的核心了。

搜索:一般自然语言处理后的特征数据,是句子或者词组,对此搜索,常规的搜索肯定不行,而全文搜索技术自然就成为首选,比如开源流行的Elasticsearch,在里面主要存储了大量的问题答案、范本数据等。

算力:告诉大家一个事实:一般一个NLP模型数据非常大,上G上T都是非常正常的事情;那么这么大的数据量,每次搜索都要进行与其计算,普通的CPU肯定是更不上的,因此GPU是首选,而且最好是使用云上的GPU算力,才能收缩性更得上。

展望未来

我在网上看到很多喷ChatGPT答案不正确的(如下图),其实这个问题在我意料之中,毕竟AI的难度不是一点半点,而且它还依赖硬件等外部因素的影响,所以一步登天很难。展望未来,ChatGPT这一波展现出模型上的突破,但在应用场景上并没有创新,所以未来ChatGPT除了完善模型(这个是重点)、完善搜索库等之外,还需要考虑一些创新性的应用场景。

比如:网友问 ChatGPT,霍布斯主张三权分立吗?很明显回答的很好,但它的回答却是错误的。

我的博客即将同步至腾讯云开发者社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=3gatjq6iej280

用一张图说一说 ChatGPT 内部技术工作流程相关推荐

  1. IT内审那点事之内部审核工作流程

    从事IT内部审计已经3年多了.国内IT审计可以说刚刚起步,可以借鉴的地方太少.在这我整理了一下3年内审工作的心得,希望能给大家有所帮助. 一.内审存在的意义 当组织已经建立了环境管理体系,并按规范进行 ...

  2. MySQL怎么运行的系列(八)14张图说明白MySQL事务原子性和undo日志原理

    本系列文章目录 展开/收起 MySQL怎么运行的系列(一)mysql体系结构和存储引擎 MySQL怎么运行的系列(二)Innodb缓冲池 buffer pool 和 改良版LRU算法 Mysql怎么运 ...

  3. 一句话+一张图说清楚——银行家算法

    本文试图用一句话+一张图说清楚操作系统中的银行家算法.我相信用一句话可以讲清楚一个算法的核心思想,一张图可以描述整个算法的操作步骤.但本人能力有限,错误之处望大家指出,多谢. 一句话: 当一个进程申请 ...

  4. 【机器学习-分类】一句话+一张图说清楚朴素贝叶斯算法(附案例+代码)

    说在前面 同一个算法本身存在各种不同的变体,即各种改进版本.一句话+一张图并不能涵盖所有情况,只是尽量用通俗的语言介绍其中经典的算法版本.希望对某算法本身不了解的人看完能迅速get到该算法在干什么:二 ...

  5. 中科院张家俊:ChatGPT中的提示与指令学习

    内容来源:ChatGPT 及大模型专题研讨会 分享嘉宾:中国科学院自动化研究所研究员 张家俊 分享主题:<ChatGPT中的提示与指令学习> 中国科学院自动化研究所研究员张家俊以ChatG ...

  6. ChatGPT相关技术必读论文100篇(2.27日起,几乎每天更新)

    按上篇文章<ChatGPT技术原理解析:从RL之PPO算法.RLHF到GPT-N.instructGPT>的最后所述 为了写本ChatGPT笔记,过去两个月翻了大量中英文资料/paper( ...

  7. 再记公式弱爆了!用 ChatGPT 将 Excel 工作效率提高 10 倍

    公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! 在未来,精通 Excel 或许不再是简历亮点了. ChatGPT 自去年 11 月 30 日 OpenAI 重磅推 ...

  8. 如何用ChatGPT高效完成工作

    如何用ChatGPT高效完成工作 过完年刚开工,很多人还没有从假期综合症中走出来,不想上班,总想摸鱼,可是手上的工作还是要完成的.都2023年了,是时候让ChatGPT来帮我们完成工作了!本文将教你如 ...

  9. ERNIE源码学习与实践:为超越ChatGPT打下技术基础!

    ★★★ 本文源自AlStudio社区精品项目,[点击此处]查看更多精品内容 >>> ERNIE学习与实践:为超越ChatGPT打下技术基础! ERNIE是BERT相爱相杀的好基友,由 ...

最新文章

  1. kafka源码分析(二)Metadata的数据结构与读取、更新策略
  2. CocoaPods一个Objective-C第三方库的管理利器
  3. python如何导入txt文件-python如何将数据写入本地txt文本文件
  4. python 学习笔记day03-python基础、python对象、数字、函数
  5. rest风格使用两个变量_为什么要用Rest风格,接口应该怎么定义,除了Rest还可用什么方式写接口的?...
  6. MySQL表结构优化
  7. wx.getBLEDeviceCharacteristics 微信小程序蓝牙 微信小程序热敏打印机
  8. [ 原创 ]学习笔记-安卓虚拟机终于达到最佳状态了
  9. POJ 2975 Nim(博弈论)
  10. SQL Server 2012 扩展事件(2)体系结构
  11. 【优化算法】多目标跟踪优化算法(MTOA)【含Matlab源码 1466期】
  12. elasticsearch入门(三)
  13. Redis闲谈:你一定需要的知识图谱
  14. Django 之 Views
  15. python中文繁简体转换库zhconv
  16. 统计基础:3.3_假设检验之t检验(Student‘s t test)
  17. win10计算机还原点如何创建,win10系统如何建立自动还原点?
  18. Word如何从中间页插入页码
  19. IBM 开源J9 JVM
  20. 了解音频频率范围和音频元器件

热门文章

  1. 耶鲁法学院院长二〇〇七年秋季迎新致辞
  2. 序列模型(1)—— 难处理的序列数据
  3. web开发学习(2) - 从数据库迁移开始(bootcamp)
  4. 怎么new 一个String数组,以数组的形式输出, 以及语法糖
  5. C++中键盘输入一个字符串
  6. 硬件知识——主板插槽
  7. [Python-Excel](01)Excel列数据提取到TXT文件
  8. 服务器被黑之后的恢复站点
  9. 【阿里聚安全·安全周刊】阿里安全潘多拉实验室完美越狱iOS11.2.1|Janus漏洞修改安卓app而不影响签名...
  10. ExcelVba 选区遍历