OpenAI 发布GPT-4

最近 OpenAI 犹如开挂一般,上周才刚刚推出GPT-3.5-Turbo API,今天凌晨再次祭出GPT-4这个目前最先进的多模态预训练大模型。与上一代GPT3.5相比,GPT-4最大的飞跃是增加了识图能力,并且回答准确性也得到显著提高。GPT-4在多个专业和学术基准测试中展现出令人印象深刻的表现,有时甚至达到了人类水平。GPT-4 的关键特性之一是它能够理解和分析视觉和文本信息。通过结合这些模式,该模型能够对各种任务生成更准确、更细致的回答,例如图像说明或问题回答。此外,GPT-4 能够从大量数据中学习,并适应不同的上下文,使其成为自然语言处理、计算机视觉和机器学习等许多领域中非常有价值的工具。

文章目录

  • OpenAI 发布GPT-4
    • GPT-4的能力
    • 对GPT-3.5错误的修正
      • 链式推理
      • 逻辑谬误
      • 数学能力
    • 如何访问GPT-4
    • 总结

GPT-4的能力

虽然GPT-4是在其前身GPT-3.5的基础上升级而来,但是一些微妙的差异使得GPT-4可能颠覆整个游戏规则。

第一眼看上去,在一些随意交谈中很难看出GPT-3.5和GPT-4之间的区别。然而,当你让模型完成一些复杂的任务时,区别就显现出来了。GPT-4比GPT-3.5更可靠、更具创造力,并且能够处理更细微的指令。GPT-4最令人印象深刻的功能之一是它能够理解上下文并生成与当前情况更相关的响应。例如,如果你问它一个关于特定主题的问题,它能够考虑到对话的背景,并提供一个更准确和合情的答案。GPT-4的另一个显著改进是它的创造力。它可以对提示产生更具想象力和独创性的响应,使其成为作家、艺术家和任何想要挖掘其创造性一面工作者的绝佳工具。

我们具体看看 GPT-3 和 GPT-4 之间令人兴奋的区别,下图是 GPT-3 和 GPT-4 在各种基准测试中的表现对比:

从测试数据上看,GPT-4 比 GPT-3 整体好40%,在超过一半的测试中 GPT-4 比 GPT-3 有飞跃性进步。

再给大家看一个我个人认为很神奇的案例:给出食材,让GPT-4食谱。

上面案例展示了GPT-4良好的图像理解能力。

对GPT-3.5错误的修正

之前ChatGPT在很多问题上表现并不理想,为此我专门针对ChatGPT过去表现不佳的问题以及我关注的使用场景对GPT-4做了专门测试。

链式推理

GPT-3.5在一些非常复杂的问题,需要多条推理链的问题上,经常会要求提供更多信息。而GPT-4明显改进链式推理能力,在多推理链问题上表现良好。

GPT-3.5

GPT-4

逻辑谬误

GPT-3.5经常会在一些简单问题上犯逻辑错误,出现这种问题一般是由于问题中夹杂着一些无用的干扰项,比如:”蓝盒子里有一个苹果,蓝盒子里还有一个红盒子,红盒子有个盖子,请问我要如何取出苹果?“。其中”红色盒子有个盖子“就是无用干扰信息,GPT-3.5会给出完全荒谬的回答:

GPT-3.5

而GPT-4可以给出相对合理的答案,且很清楚地说明并避开了问题中的陷阱。

GPT-4

数学能力

GPT-3.5的数学能力广受诟病,甚至在一些简单的小学数学题上频频出错。比如:”我今年6岁,妹妹年龄是我的一半。那么当我90岁时,妹妹多少岁?“

GPT-3.5

GPT-3.5煞有介事的一步一步推理计算,最后给出45岁的错误答案。而GPT-4则修正了这方面的缺陷:

GPT-4

如何访问GPT-4

目前,ChatGPT Plus 会员可以通过 chat.openai.com 访问 GPT-4,但有使用上限。

在进入ChatGPT界面后,用户可以选择使用的模型。有3个模型可以选择

OpenAI很贴心的用直观可视化的方式对比了三个模型。

从官方给出的功能性能对比指引可以看出,GPT-4在推理能力和简明扼要方面明显由于GPT-3.5。

GPT-4的API与GPT-3.5的接口一致,不过目前需要申请开放。我已经第一时间加入了waitlist,等审批通过后再位大家带来GPT-4的接口使用体验报告。

总结

总的来说,GPT-4在推理能力上比GPT-3.5进步巨大,很多之前的问题都得到了修正和改良。我还没有测试GPT-4的多模能力,后面我会继续进行更多的测试,并即时更新文章分享给大家。

OpenAI 发布GPT-4——全网抢先体验相关推荐

  1. 80%白领危了!OpenAI发布GPT时代就业秘笈:34大铁饭碗保命

    [导读]GPT-4发布没几天,OpenAI直接告诉所有人,GPTs是通用技术,80%的美国人的工作受到影响.想要保命,且看这34大「铁饭碗」. 前脚刚推出GPT-4,OpenAI后脚就发布了35页论文 ...

  2. JeecgBoot版本4月份新版即将发布,抢先体验。。

    JeecgBoot版本4月份新版即将发布,抢先体验.. 即将发布版本-更新日志: 1.代码生成器GUI工具 2.支持一对多代码生成器 3.支持按钮权限 4.支持数据权限 5.Excel导入导出工具集成 ...

  3. 一加点击android系统时间,终于等到你!一加发布国内首个Android P定制系统 一加6抢先体验...

    原标题:终于等到你!一加发布国内首个Android P定制系统 一加6抢先体验 目前国产手机采用的都是安卓系统,由于某些不可抗力的因素,安卓原生系统在国内很多功能都无法正常使用,因此国产手机采用谷歌的 ...

  4. 【建议收藏】ChatGPT 联网版抢先体验,学会这 8 大高阶实用技巧,让你秒上手!

    ChatGPT 联网版抢先体验,学会这 8 大高阶实用技巧,让你秒上手 一.前言 福利:文末有分享chat GPT 免费中文版哦 二.ChatGPT 联网!!! 1. Web browsing 功能, ...

  5. 互联网晚报 | OpenAI就GPT致用户信息泄露道歉 ;杉杉股份称新任董事长选举有效;贾跃亭称FF首款旗舰电动车即将开始生产...

    OpenAI就ChatGPT致用户信息泄露道歉  当地时间3月24日,OpenAI发布声明,向其用户和整个ChatGPT社区道歉,并称将努力重建信任.声明称,本周早些时候,该公司将ChatGPT下线, ...

  6. 在google play开放平台上closed texting如何删除_“爷青回”!如何抢先体验《英雄联盟》手游?这份攻略送给你...

    如果你要问我最近什么手游最火?那我的回答肯定就是<英雄联盟>手游了!自从拳头公司在前几天爆出部分地区公测的消息之后,很多国内玩家就已经按耐不住自己激动的心了.由于国服没有公测,所以许多国内 ...

  7. repl java9_Java 9抢先体验:与JShell进行动手实践– Java REPL

    repl java9 从今天开始,如何开始使用Java 9的最酷功能之一? 上周末,我终于开始尝试使用Java 9的早期访问版本.第一站是JShell,它也被称为Project Kulla. 首先让我 ...

  8. Java 9抢先体验:与JShell的动手实践– Java REPL

    从今天开始如何开始使用Java 9最酷的功能之一? 上周末,我终于开始尝试使用Java 9的早期访问版本了.第一站是JShell,它也被称为Project Kulla. 首先让我鼓起勇气尝试早期访问J ...

  9. OpenAI发布ChatGPT:程序员瞬间不淡定了

    OpenAI发布ChatGPT:程序员瞬间不淡定了 12月1日,OpenAI发布了针对对话场景优化的语言大模型ChatGPT.ChatGPT是InstructGPT的兄弟模型,可以以对话的形式与用户交 ...

最新文章

  1. AIX 操作系统中AIO、DIO、CIO 的相关概念介绍 (二)
  2. Linux 操作系统原理 — loop 伪设备
  3. 二维数组的对角搜索C++
  4. 采用APACHE POI操作EXCEL文件--计算式调用另一文件
  5. cs架构用什么语言开发_用Rust语言开发微信小程序
  6. 喝最烈的酒、挖最大的DONG——工具与技巧篇
  7. bert模型可以做文本主题识别吗_BERT如何融合主题模型-ACL2020
  8. matlab打开时总闪一下才打开_大家装窗帘轨道时,是不是多数都是下面这样的: 打开网易新闻 查看更多图片 或者做个窗帘盒,遮盖一下?...
  9. Kubernetes集群部署1
  10. IS-IS快速收敛调优(二)——链路故障检测、LSP智能定时器和SPF智能定时器
  11. python基础之列表生成式和生成器
  12. 7.2.5 dps 测试软件,魔兽世界7.2.5兽王猎DPS有什么改动测试
  13. 推荐一款神仙颜值的 Redis 客户端工具
  14. python 自动下载脚本_Python脚本自动下载小说
  15. 苹果x屏幕失灵乱跳_苹果iphone11 pro max屏幕触摸失灵怎么办?
  16. 【已解决】pdf导出的eps图形在WinEdt中只显示一半
  17. 飞思卡尔单片机PLL时钟总线模块
  18. 记一次折腾可移动式Ubuntu 20.04 安装在折腾折腾系列的WD p50上(即移动式挂在nvme协议下的移动固态硬盘以uefi模式启动的Ubuntu20.04 (to go))
  19. vue3项目使用prettier格式化代码
  20. @pack://application:,,,/报错

热门文章

  1. Bootstrap 面板(Panels)
  2. 移动端 HDR 视频产品实践与探索
  3. 平行泊车系统路径规划(2)
  4. 技能树成长——工作篇
  5. 《大话数据结构》第五章 串
  6. macbook百度网盘下载保存的文件在哪❓找不到
  7. python中pprint是干什么的_python之pprint模块简用
  8. 2022-2028全球与中国3-硝基-4-氯苯甲酸市场现状及未来发展趋势
  9. 工厂人员定位系统源码,支持智能考勤、工时统计、行为检测、历史轨迹回放、人员管理、电子围栏功能
  10. 使用Mac终端将mp3/m4r格式转为caf格式