2023年4月4日,来自加州大学圣迭戈分校、中山大学和微软亚研的研究者提出了Baize,该模型是让ChatGPT 自我对话,批量生成高质量多轮对话数据集,利用该数据集对LLaMA进行微调得到的(目前版本还没有RLHF)

关于Baize的详细介绍可以参考:https://mp.weixin.qq.com/s/zxElGfclNbBwTuDG4Qrxnw

  • 论文题目:Baize: An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat Data

  • 论文链接:https://arxiv.org/abs/2304.01196

  • Github:https://github.com/project-baize/baize/blob/main/README.md

  • 在线 Demo:https://huggingface.co/spaces/project-baize/baize-lora-7B

之前对LLM模型进行了相关的体验对比,感兴趣的可以阅读如下列表:

谷歌Bard_VS_百度文心一言

Bard vs. Bing vs. ChatGPT效果对比

文心一言 VS ChatGLM-6B对比

GPT4 VS ChatGPT,优劣势对比

下面使用Huggingface的在线demo进行体验,并且与谷歌Bard进行对比:

Note:体验的Prompt来自谷歌Bard_VS_百度文心一言

下面从ChatGLM-6B的六大方面进行测试对比

自我认知

Bard

文心一言

Baize-7B

结论:上述三个模型都有基本的自我认知

提纲写作

Bard

文心一言

Baize-7B

结论:Bard和文心一言给出了大纲的列表;而Baize-7B做了简单介绍,最后列出了NLP的相关任务;Baize-7B明显不如Bard和文心一言

文案写作

Bard

文心一言

Baize-7B

结论:Bard和文心一言都生成了一段文案,而Baize-7B只是把关键词split出来了;在生成新闻方面Baize-7B也弱于Bard和文心一言,并没有生成10个新闻,而是6个

邮件写作助手

Bard

文心一言

Baize-7B

结论:Baize-7B生成的邮件内容较短

信息抽取

Bard

文心一言

Baize-7B

结论:Bard的表现是最好的,提取信息最全,其他两个模型只提取了部分信息

角色扮演

Bard

文心一言

Baize-7B

结论:角色扮演方面Bard表现较好,而文心一言和Baize-7B几乎没有这样的能力

评论比较

Bard

文心一言

Baize-7B

结论:文心一言拒绝回答这样的问题,而Bard和Baize-7B都给出了自己的看法;

旅游向导

Bard

文心一言

Baize-7B

结论:在旅游推荐方面,上述三个模型都给出了答案,但是Baize-7B的答案没有换行,缺少条例性

谷歌Bard_VS_Baize-7B_VS_文心一言体验对比相关推荐

  1. 谷歌Bard_VS_百度文心一言

    Bard内测申请地址:http://Bard.google.com 近期获得了谷歌Bard的内测码,迫不及待来体验一下,关于Bard的其他体验对比,可以参考:Bard vs. Bing vs. Cha ...

  2. 文心一言 vs GPT-4 —— 全面横向比较

    文心一言 vs GPT-4 -- 全面横向比较 3月15日凌晨,OpenAI发布"迄今为止功能最强大的模型"--GPT-4.我第一时间为大家奉上了体验报告<OpenAI 发布 ...

  3. 【ERNIE Bot】百度 | 文心一言初体验

    文章目录 一.前言 二.文心一言介绍 三.申请体验⌈文心一言⌋ 四.⌈文心一言⌋初体验 1️⃣聊天对话能力 2️⃣文案创作能力 3️⃣文字转语音能力✨ 4️⃣AI绘画能力✨ 5️⃣数理推理能力 6️⃣ ...

  4. 谷歌开放生成式AI Bard,百度文心一言《唐伯虎点秋香》出圈

    雷递网 雷建平 3月22日 谷歌今日正式开放类ChatGPT产品Bard的访问.谷歌称,这是一项早期实验,可让用户与生成AI协作. Bard的服务从美国和英国开始,随着时间的推移将扩展到更多国家和语言 ...

  5. 「文心一言」内测详细使用体验

    ★观前提示:以下内容仅为内测测试内容,不代表未来正式版如何,或许你认为它与chatgpt仍有不小的差距,或许你认为它目前做的已经不错了,都可以,但是咱们测试体验,只讲述体验,本篇文章不做对比. 目录 ...

  6. 15大不同领域问答对比,ChatGPT模型大战:国产版百度文心一言、昆仑万维天工能否击败GPT-4(含百度文心一言、昆仑万维天工个人内测体验测试邀请码获取方法,亲测有效)

    目录 前言 百度内测申请 天工内测申请 申请方式 内测体验 登录界面 运行体验 内测对比 基本问答 事实性问答 科普文写作 小红书文案 项目计划撰写 古文理解 模型的常识能力和反事实推理 代码理解 法 ...

  7. 百度生成式AI产品文心一言邀你体验AI创作新奇迹:百度CEO李彦宏详细透露三大产业将会带来机遇(文末附文心一言个人用户体验测试邀请码获取方法,亲测有效)

    百度生成式AI产品文心一言邀你体验AI创作新奇迹 中国版ChatGPT上线发布 强大中文理解能力 超强的数理推算能力 智能文学创作.商业文案创作 图片.视频智能生成 中国生成式AI三大产业机会 新型云 ...

  8. 文心一言: 中国科技 “元实力” 的一次喷发

    它没有摧毁,它改变了一切, 它制造了一些新的东西. 目录 勇气与厚积薄发的信心 "元实力"的一次喷发 为创新加油,让未来可期 获取源码?私信?关注?点赞?收藏? 用"不完 ...

  9. 文心一言背后,百度还是那个百度

    对百度而言,文心一言不是一个结果,而仅仅是这家技术企业在过去多年投入的一个缩影和侧写. 作者|皮爷 出品|产业家 "第一枪"打响. 伴随着一身"工程师范"的李彦 ...

最新文章

  1. 美国实行公共场所禁用面部识别设备 IBM跨界饮食业利用AI开发美食
  2. 一个人的MVP(微软全球最有价值专家),所有人的帮助!
  3. Tesseract-OCR引擎 入门
  4. AtCoder Regular Contest 120 C - Swaps 2 线段树模拟
  5. java基础教程知识点,[Java教程]js基础知识点总结
  6. PAT乙级(1002 写出这个数 )
  7. 图解带你掌握`JVM`运行时核心内存区
  8. Redis基础(五)——删除策略和内存淘汰机制
  9. JVM调优总结:一些概念
  10. ad自动连线_ad如何自动布线
  11. Mixly-数位计及1602屏亮度显示
  12. Pytorch Gradient Checkpoint使用示例
  13. PB调用C#动态库轻松实现微信、支付宝支付
  14. 播布客教学视频_C学习笔记_7_100内最大的素数(97)
  15. java 二进制 表示负数_java中的负数表示
  16. 为什么java反射比较慢
  17. 怎么把动图放到word里_word文档如何插入动图?
  18. 计算机二进制补位是什么,2、二进制
  19. 网页微信,微信 1101,1102原因汇总
  20. 所有地区的中英文名称,手机区号,字母缩写(代码)json文件整理

热门文章

  1. javassm奥运会志愿者管理系统
  2. Unity 内的敌人AI 或者 有限状态机FSM实现AI
  3. 国家一级博物馆“镇馆之宝”盘点 有文物也有故事
  4. 第二届智慧交通论坛开幕:欲善“城市”其事,必先利“交通”其器
  5. 为什么生物不能永生?
  6. 听听音乐,平静下生活
  7. 五种IO模型:阻塞/非阻塞/复用/信号驱动/异步IO模型
  8. 批量获取文件的摘要(md5、sha1、sha256)
  9. 图解人工神经网络 BP算法代码和注释
  10. 离散数学命题逻辑连接词的解释