目录

  • 前言
  • 百度内测申请
  • 天工内测申请
    • 申请方式
    • 内测体验
      • 登录界面
      • 运行体验
  • 内测对比
    • 基本问答
    • 事实性问答
    • 科普文写作
    • 小红书文案
    • 项目计划撰写
    • 古文理解
    • 模型的常识能力和反事实推理
    • 代码理解
    • 法律相关
    • 广告话术
    • 数字排序
    • 数值计算
    • 推理解题
    • 跨语言能力
    • 文生图
  • 总结
  • 其它资料下载

前言

3月16日,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏现场展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。官方表示,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上,能够处于独一无二的位置。作为革新生产力工具,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。

4月17日下午,昆仑万维的首席执行官方汉发布了公司的大型中文语言模型——天工3.5。这款模型是国内为数不多已经进行过内测的中文语言模型之一,如“文心一言”、“360智脑”等。在发布会现场,天工大型模型展示了写周报、写招聘岗位、写代码以及回答网友奇怪提问等功能。

百度内测申请

关于百度内测资格详细申请方式详见我的另外一篇博客:
百度生成式AI产品文心一言邀你体验AI创作新奇迹:百度CEO李彦宏详细透露三大产业将会带来机遇

天工内测申请

申请方式

发送申请邮件到邮箱:neice@kunlun-inc.com

正文需包括以下内容:

姓名:
公司:
职务:
电话:
申请理由:

大概经过10多天的排队,博主收到了内测通过的邮件。如下:

内测体验

登录内测网址

输入申请时候的手机号码

输入邀请码:

输入手机验证码:

登录界面

运行体验

感觉天工生成答案,不是那么连续,中途会经常暂停,然后生成下一句话。这点不知道是不是网速原因,还是说系统设置了一些时间缓冲,也有可能近期内测人数太多,导致平台缓慢。

内测对比

说明:以下所有测评内容非专业测评,仅为个人使用测评,仅供大家体验参考。其中ChatGPT大多使用ChatGPT3.5模型,除非特别说明为GPT-4模型。

基本问答

  • 百度文心一言

  • 天工

  • ChatGPT

三者在基本问答这块,基本没有任何问题。

事实性问答

  • 百度

  • 天工

  • ChatGPT

这一部分,三者回答都没有问题,但百度、天工回答会相对更详细。

科普文写作

  • 百度

  • 天工

  • ChatGPT

    这一部分,天工、百度、ChatGPT回答各有千秋。

小红书文案

  • 百度

  • 天工

  • ChatGPT

    感觉文案方面大家都还可以,不过关于手机的参数细节,都会有一些和真实情况不符。另外天工并没有加入emoji,总体来说,百度会略胜一筹。

项目计划撰写

  • 百度

  • 天工

  • ChatGPT

项目计划撰写这块,天工除了显示有一点问题外,从项目计划细节、时间上都比较完善。百度有点套用模板的感觉,ChatGPT时间上出了问题,但项目计划等都还是不错。

不过GPT-4下的回答,应该算是完美!

  • GPT-4

古文理解

  • 百度

  • 天工

  • ChatGPT

    这部分,百度要略强于天工和ChatGPT,只是部分字未识别出来。

模型的常识能力和反事实推理

  • 百度

  • 天工

  • ChatGPT

    这一部分,百度文心一言是最完美的答案(以前测评百度发现过也和天工基本一样,但应该是更新过模型了,后面回答完美了),但天工则直接套用模板,回答错误。

代码理解

  • 百度

  • 天工

  • ChatGPT

    没想到,天工的代码理解能力也是不错的,百度稍弱。

法律相关

  • 百度

  • 天工

  • ChatGPT

    这部分,天工非常详细地提供了更多的建议,可以说是天工完胜。

广告话术

  • 百度
  • 天工
  • ChatGPT
  • GPT-4

    不得不说,GPT-4是非常完美的一个广告话术,百度和天工更像是套用相关模板生成的,缺乏吸引力。

数字排序

  • 百度
  • 天工
  • ChatGPT

    这部分,就可以看出天工的数理能力还是较差,ChatGPT和百度都能最后输出正确答案,而天工仅给出一段python代码,基本没有回答到问题的关键点。

数值计算

  • 百度

  • 天工

  • ChatGPT

关于数值计算这部分,仅有百度最后显示出正确答案,而ChatGPT显示出计算过程,但关于乘法计算显示出错误答案,天工则全部错误。

推理解题

  • 百度

  • 天工

  • ChatGPT

这一部分,百度算是完胜,不仅显示了正确答案,还显示了推理过程。ChatGPT最终答案是正确的,但是推理过程出现了一点小问题,把多了和少了给反复推理了一次。而天工则推导错误。

跨语言能力

  • 百度
  • 天工
  • ChatGPT

    三者在跨语言模型理解上,基本都没有什么问题。

文生图

目前三者中,只有百度文心一言能直接生图,ChatGPT和天工只能使用免费图片数据库进行生图,例如使用Unsplash,全球最大的免费图片数据库之一,图片有免费版权可商用,而且开放了API接口,这就为ChatGPT和天工生成Unsplash图片提供了基础条件。

  • 百度
  • 天工
  • ChatGPT

总结

整体上百度文心一言模型比天工还是要更强一点,天工在数理这块劣势明显,但语义理解等文本那块还是可以。

虽然在国内外模型综合比较中,我们国内的GPT模型整体水平还有一点差距,特别是和GPT-4模型相比会有明显的差距,但是我们坚信这个差距会逐渐缩小。总有一天,国产大模型能够与OpenAI的大模型同台竞技,甚至超越它们。

其它资料下载

如果大家想继续了解人工智能相关学习路线和知识体系,欢迎大家翻阅我的另外一篇博客《重磅 | 完备的人工智能AI 学习——基础知识学习路线,所有资料免关注免套路直接网盘下载》
这篇博客参考了Github知名开源平台,AI技术平台以及相关领域专家:Datawhale,ApacheCN,AI有道和黄海广博士等约有近100G相关资料,希望能帮助到所有小伙伴们。

15大不同领域问答对比,ChatGPT模型大战:国产版百度文心一言、昆仑万维天工能否击败GPT-4(含百度文心一言、昆仑万维天工个人内测体验测试邀请码获取方法,亲测有效)相关推荐

  1. 百度生成式AI产品文心一言邀你体验AI创作新奇迹:百度CEO李彦宏详细透露三大产业将会带来机遇(文末附文心一言个人用户体验测试邀请码获取方法,亲测有效)

    百度生成式AI产品文心一言邀你体验AI创作新奇迹 中国版ChatGPT上线发布 强大中文理解能力 超强的数理推算能力 智能文学创作.商业文案创作 图片.视频智能生成 中国生成式AI三大产业机会 新型云 ...

  2. 阿里云盘内测邀请码是多少?阿里云盘邀请码获得方法

    原文链接:http://www.jb51.net/article/200636.htm 阿里云网盘注册邀请码怎么免费获取?为了让更多的小伙伴也体验体验,特分享一批阿里云盘邀请码送给大家,下面为大家分享 ...

  3. 为Android购买多个改装微信,分享外面高价售卖的修改微信号方法 亲测成功 仅限安卓手机...

    分享外面在高价售卖的微信号修改方法 亲测成功 仅限安卓手机 这个方法今天在外面看到很多人在代修改,转卖方法!小编觉得还是有必要发出来让大家去动手尝试一下! 实际上这个修改微信号的功能在内测版微信就可以 ...

  4. python编程输入名字配对情侣网名_名字配对测试两人关系,亲测有点准。

    原标题:名字配对测试两人关系,亲测有点准. 无论是正在爱情中,还是爱情处于萌芽中,都有一种朦胧的处境,理不清,里还乱,我们便可以通过名字配对测试两人关系来转移注意力. 情侣姓名配对方法: 就是把你们两 ...

  5. mmdetection2.3.0版本安装过程,以及训练、测试、可视化等(亲测好用,很顺利)

    欢迎大家关注笔者,你的关注是我持续更博的最大动力 原创文章,转载告知,盗版必究 mmdetection2.3.0版本安装过程,以及训练.测试.可视化等(亲测好用,很顺利) 文章目录: 1 运行mmde ...

  6. 最新哔哩哔哩视频弹幕播放器源码+带后台/亲测无错误

    正文: 最新哔哩哔哩视频弹幕播放器源码+带后台/亲测无错误,此款播放器源码添加及修复了很多功能,且所有源码均本地化,不存在外链的情况,测试环境:PHP7.0+MySQL5.6 安装教程: 1,访问/d ...

  7. 趣谈唯一邀请码生成方法

    趣谈唯一邀请码生成方法 前段时间项目上需要生成唯一邀请码!嘿嘿,多简单的一件事,心里就已默默将代码写了一遍.但小小的邀请码生成却也小有乾坤,这就是后话了. 一.最简单的实现 很多人 肯定都和我一开始一 ...

  8. 电视android已停止运行是什么意思,智能电视提示应用停止运行,三种方法亲测有效!...

    原标题:智能电视提示应用停止运行,三种方法亲测有效! 智能电视使用时间一长,或者是使用不当总会出现一些问题,当电视机页面出现"某软件"已经停止运行提示的时候,是什么原因导致的?自己 ...

  9. 美丽乡村建设网站php源码_2020最新亲测php网址导航源码全开源-清爽收录导航网站源码...

    2020最新亲测php网址导航源码全开源-清爽收录导航网站源码 一款轻巧.清爽的php源码,已亲测完整可用,运行十分流畅,网页加载非迅速,源码UI设计漂亮,且功能完整.为响应式设计,兼容各种手机移动端 ...

最新文章

  1. iPhone上将短信内容发送到指定邮箱的方法
  2. django 1.9 后台中文界面
  3. POJ 1716 区间最小点个数
  4. STM32通过串口如何接收服务器发来的数据
  5. 订单最小量限制的增强
  6. TransparentBitmap函数设置透明位图的原理分析
  7. 泛型(CSDN转载)
  8. android x86 sleep,如何打开Android X86对houdini的支持
  9. voc数据集的map计算方式
  10. 2000-2019全国各省分品种能源消费量
  11. 错误报告函数:strerror和perror
  12. python(模块)xlwt
  13. JavaScript格式化时间与日期
  14. 2020杭电多校赛 Multi-University Training Contest
  15. SSM整合开发实战-poi导入导出excel-前言
  16. hardhat 教程及 hardhat-deploy 插件使用
  17. 创业工场麦刚:不要把创业美化
  18. 使用excel进行数据挖掘(4)---- 突出显示异常值
  19. 排序知识点总结及代码实现(C++)
  20. python无限制邮件群发软件_收藏 - 使用Python通过SMTP协议群发/单发邮件方法

热门文章

  1. MAX232引脚说明
  2. 腾讯又一重磅服务停服!网友:陪了我5年了
  3. uniapp接入谷歌导航功能
  4. Linux redHat7.2配置yum源
  5. python-opencv2利用cv2.findContours()函数来查找检测物体的轮廓
  6. Linux检测端口是否被防火墙禁止或端口是否被占用
  7. 三菱FX3U——ST编程红绿灯
  8. 编译型语言与解释型语言
  9. 计算机入门初中教学视频,【初中计算机教学方法初探】初中信息技术计算机组成教学视频...
  10. 专访李瑞丰:建立一个全面的知识网络是很重要的一件事儿...