文章目录

  • 大LLM使用过程中的成本缩减策略
  • Google发布生成式AI教程《Google Cloud Skills Boost》
  • 马毅团队新工作|突破黑盒,深度网络研究
  • 大模型微调究竟需要多少数据
  • Yann LeCun-智源大会

大LLM使用过程中的成本缩减策略

该研究概述并讨论了用户可以利用的三种策略来降低使用 LLM 的推理成本:1)prompt 适应,2)LLM 近似和 3)LLM 级联。此外,该研究提出了级联 LLM 一个简单而灵活的实例 FrugalGPT,它学习在不同查询中使用哪些 LLM 组合以减少成本并提高准确性。

论文地址:https://arxiv.org/pdf/2305.05176.pdf

Google发布生成式AI教程《Google Cloud Skills Boost》

https://baai.org/l/27311

马毅团队新工作|突破黑盒,深度网络研究

https://baai.org/l/27317

大模型微调究竟需要多少数据

https://baai.org/l/27339

多样性,高质量这两个数据上的问题一直被认定是决定模型性能的天花板。

在目前的绝大多数微调模型,都是靠着大力出奇迹来实现一个较好的性能,这也是过去几个月大家都在卷数据量的一个真实写照。

但是否想过,openai这种什么技能都能做到的模型,在多样性上应该做了大量的工作,并且在数据量上应该没有太大的追求。

所以,最近的风向变成,是否可以利用少量的数据就能取得差不多的效果,这样的话,努力的方向就可以变成多样性数据的挖掘上,这可能是openai走通但我们没想明白的地方。

Yann LeCun-智源大会

https://mp.weixin.qq.com/s/Wu603Sk0QjwCKXhq4_aFFQ

这就是近年来一些流行的大模型的工作原理:其中一些来自 Meta 的同事,包括开源的 BlenderBot、Galactica、LLaMA、Stanford 的 Alpaca(Lama 基于 LLaMA 的微调版)、Google 的 LaMDA 、Bard、DeepMind 的 Chinchilla,当然还有 OpenAI 的 ChatGPT 和 GPT-4。
如果使用一万亿个 Token 或两万亿个 Token 的数据训练模型,它们将获得惊人的性能。但实际上,它们也会犯很愚蠢的错误(事实错误、逻辑错误、不一致性等),它们的推理能力有限,会产生有害内容。
大量研究表明,这些系统缺乏底层的现实知识,因为它们纯粹是通过文本来训练的,无法完全理解人类知识,无法真正规划答案。然而,这些系统在编写辅助工具、生成代码以及帮助程序员编程方面都非常出色。

你可以让他们做各种事情:用各种语言写代码、生成文本,而且效果很好。但同样,他们会虚构一些故事。如果你想获知真实的信息,我们不如使用信息检索系统、搜索引擎。
所以,这些系统对于写作辅助、初稿生成、统计出版都很有帮助(尤其对于写作语言非母语者)。但此类系统不擅长给出真实、一致的答案。对于一些数据集中存在的行为,它们可以做得很好。然而,对于推理,计划,做算术之类的问题,他们要用搜索引擎计算器数据库查询之类的工具来解决。它们还需要得到进一步的训练。
目前研究的一个热门话题是,如何让这些系统调用上述工具。这被称为扩展语言模型。我和 FAIR 的同事讨论了为扩展语言模型提出的各种技术。我们很容易被目前的 AI 系统流畅的性能所欺骗,以为他们很聪明,但实际上并非如此。这些系统非常擅长「提取记忆」。但是,他们并不理解世界的运行原理。这种基于自回归的生成存在一个主要的缺陷。

事实上,我认为,人工智能研究面临三大挑战:
(1)通过自监督学习习得表征并预测世界模型。当下的自监督和强化学习需要大量的样本和试验。我们要通过自监督学习,以一种任务无关的方式表征世界。学习用于规划和控制的预测模型。
(2)学会推理:犹如 Daniel Kahenman 提出的「系统 1 & 系统 2」的理论。系统 1 是一种与潜意识计算相对应的人类行为或行为,你不需要思考就能做的事情。系统 2 是有意识地用你的大脑的全部力量进行推理。当下的人工智能系统大多停留在系统 1 的阶段。
(3)学习规划复杂的动作序列。通过将复杂的任务分解成简单的任务来分层次地计划复杂的动作序列

智源论文前沿记录230610相关推荐

  1. 2021年智源人工智能前沿报告(AI Frontiers Report)发布【附下载链接】

    导读:2021年对于人工智能技术和产业,依旧是不平凡的一年.随着算力.数据.算法等要素逐渐齐备,先进的算法结构不断涌现,各个研究方向研究成果层出不穷,成熟的AI技术逐渐向代码库.平台和系统发展,实现产 ...

  2. 智源承认论文抄袭,相关责任人已离职!

    文 | 金磊Alex(凹非寺) 源 | 量子位 "2处属于抄袭,4处引用不规范." "相关责任人均已主动离职." "大模型研究中心部门重组." ...

  3. 抄袭处理通报!智源抄袭门:2处抄袭4处引用不规范,相关责任人均已主动离职......

    金磊 Alex 发自 凹非寺 转载自:量子位(QbitAI) "2处属于抄袭,4处引用不规范." "相关责任人均已主动离职." "大模型研究中心部门重 ...

  4. 2019北京智源大会在京开幕, 中外学术大咖共话人工智能研究前沿

    10月31日,由北京智源人工智能研究院主办的2019北京智源大会在国家会议中心开幕,会期两天.智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动,定位于"内行的AI盛会&quo ...

  5. “智源论坛Live”报名 | 清华大学游凯超:领域适配前沿研究--场景、方法与模型选择...

    报名请点击「阅读原文」 在线直播时间:12月24日19:30-20:30 "智源论坛Live"第2期 "智源论坛Live"是智源论坛系列活动之一,通过在线直播形 ...

  6. 免费报名 | 智源论坛:智能处理器探索,AI技术前沿精粹尽览

    主题:智源论坛:智能处理器探索 智源系列论坛,AI技术前沿精粹尽览 先行者解读,为岔路口的你指点迷津 独家经验分享,由当事人向你道来 顶尖学者零距离,传递深邃思考,打开你永不满足的好奇心 探讨技术,亦 ...

  7. 智源社区AI周刊No.97:Bengio新论文用GFlowNets统一生成模型;北大发布AI for EDA数据集...

    汇聚每周AI观点.研究和各类资源,不错过真知灼见和重要资讯!欢迎扫码,关注并订阅智源社区AI周刊. 编辑精选 专访北京大学教授黄铁军:"AI视觉"的创新源头,从仿脑到追光逐电 查看 ...

  8. 百余署名AI论文被爆抄袭 智源现已致歉

    2022年4月初,一起AI界的学术不端事件可谓是「引爆」了整个学术圈. 涉及到的100位作者,无一不是业内大佬. 知乎讨论也从第一天最初的几万浏览量,飞涨到了现在的600多万. 对此,我们可以引用知乎 ...

  9. AI:2023年6月9日北京智源大会演讲分享之基础模型前沿技术论坛—《工程化打造AI中的CPU》、《构建一个AI系统:在LLM上应用带有RLHF来推进定制》、《多模态预训练的进展回顾与展望》、《扩展大

    AI:2023年6月9日北京智源大会演讲分享之基础模型前沿技术论坛-<工程化打造AI中的CPU>.<构建一个AI系统:在LLM上应用带有RLHF来推进定制>.<多模态预训 ...

最新文章

  1. linux esd转iso,window_Win10 TH2正式版10586官方ESD映像怎么转换成ISO镜像?,今天phpstudy分享了Win10 TH2(Build - phpStudy...
  2. 数据恢复利器:通过frm文件恢复数据表的sql结构语句
  3. What are HANA's models of cloud computing, and which should I choose?
  4. hdfs du命令是算的一份数据
  5. python爬虫有什么用处-python为什么叫爬虫 python有什么优势
  6. 关于Nowpaper
  7. 一个 Vue + Node + MongoDB 博客系统
  8. 掌握Java的内存模型,你就是解决并发问题最靓的仔
  9. 2014河北廊坊计算机一级,2018年上半年河北省廊坊市计算机等级考试简章
  10. ajax 跨域请求_什么是跨域问题?如何解决?
  11. 华三 h3c ospf、rip 路由引入和路由策略
  12. (百万数据量级别)java下的mysql数据库插入越插越慢的问题解决
  13. 25个最好免费下载电子书(Ebooks)的网站
  14. java sql 搜索拼音
  15. 用python做探索性因子分析(Exploratory Factor Analysis,EFA)全代码
  16. 央行 继续实施稳健货币政策适时适度预调微调
  17. ES6 Javascript Nodejs Mindmap
  18. 大学英语B116-阅读理解
  19. 不能启动的问题 社区版安装后_Windows To Go安装使用手记
  20. 头歌实践教学平台——python程序设计——元组的使用

热门文章

  1. 1325: 深入浅出学算法020-阶乘和(sum)
  2. PHP单页面加密视频教程附源码,thinkphp3.2最新版本项目实战视频教程(含源码)
  3. 基于OPENCV和图像减法的PCB缺陷检测
  4. matlab两轮自平衡小车,两轮自平衡小车(全部设计资料+设计分析)
  5. MOSSProject 2007语言包安装和部署
  6. 脉动进位计数器Verilog表述
  7. WeX5之登录注销功能实现
  8. 社群管理工具之非凡社群管理
  9. 你的计算机主机名称是什么,Mac苹果电脑主机名、电脑名、局域网主机名怎么修改...
  10. spring框架官网直译IOC容器(1.5-1.8)