国内大模型领域进入乱战时代

  • 2023.4.12
  • 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。

什么是大模型

大模型,又称为预训练模型、基础模型等,是指模型参数数量很大,需要大量计算资源才能训练的深度学习模型。这些模型通常包括数千万甚至数百亿、数千亿个参数,其中常见的大模型包括BERT、GPT、ResNet等。

大模型的优点在于它们可以更好地学习数据中的复杂特征,从而提高模型的准确性和泛化能力。然而,由于这些模型需要大量计算资源来训练,因此它们的训练时间往往非常长,需要使用大量的计算资源,如GPU或TPU。

为了训练大模型,需要使用高性能计算机或云计算平台。这些平台可以提供大量的计算资源,从而加速训练过程。此外,还需要使用优化算法和技术,如分布式训练、混合精度训练、梯度累积等,以提高训练效率和准确性。

国内大模型的现状

截止2023年4月上旬,国内已有很多家公司发布/或预发布大模型。我搜集了大部分数据,根据宣布时间排序,大致情况如下:

  1. OpenAI的GPT-3.5/4(国外)
  2. Google的Bard(国外)
  3. 百度的文心一言
  4. 华为的大模型盘古
  5. 清华大学发布大模型ChatGLM,开启内侧
  6. 阿里发布大模型通义千问
    • 阿里达摩院上线“文本生成视频大模型”:目前仅支持英文输入,已开放试玩
    • 蚂蚁集团与清华大学签署合作协议,将合作研究“安全通用大模型”和“下一代互联网应用安全技术”
  7. 商汤科技发布多模态多任务通用大模型“书生2.5”,迈向AGI通用人工智能
  8. 360宣布:基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将面向企业用户开放内测
  9. 科大讯飞:将于5月6日发布“1+N认知智能大模型”及应用产品
  10. 毫末智行推出全球首个自动驾驶认知大模型DriveGPT,4月公布最新进展
  11. 商汤科技推出“日日新SenseNova”大模型体系,发布自研中文语言大模型应用平台“商量SenseChat”
  12. 昆仑万维:即将发布国产大语言模型“天工”3.5,将于4月17日启动邀请测试
  13. 有赞上线大模型驱动AI产品“加我智能”,支持图文推广和活动策划两大场景
  14. 腾讯混元系列AI大模型还在研发中
  15. 字节跳动组建大模型团队:朱文佳带队,搜索、智创两部门牵头。
  16. 搜狗创始人王小川宣布开启人工智能大模型领域创业:成立新公司“百川智能”,已获得5000万美元启动资金
  17. 京东陆续发布了10亿级的K-plug模型、百亿级的Vega模型等一系列领先的大模型,并拟于今年发布千亿级的言犀大模型。
  18. 达观数据研发“曹植”大语言模型,致力于国产GPT模型
  19. 澜舟科技完成数亿元融资,推出孟子MChat可控大模型
  20. 复旦大学研发MOSS大模型,拟4月中旬开源
  21. 中科院自动化研发紫东太初大模型,能够实现视觉、文本、语音三个模态间的高效协同,性能全球领先。
  22. 北京智源人工智能研究院发布万亿参数的超大规模智能模型“悟道2.0”

于此同时

郭嘉对擅自提供ChatGPT访问服务的公司和个人进行了打击。

一些预测

  1. 一拥而上的大模型,带来的结果会是:伴随用户试用过程中的嘲笑/调侃而慢慢退出市场(有ChatGPT行业标杆的衬托),丢人丢面。
  2. 垂直行业类的大模型在专门的领域内有超越ChatGPT的可能(专业vs通用),满足行业用户的需求而长期存在。
  3. 随着资本的涌入,追赶OpenAI的步伐会加快,但中短期内缩小不了差距*(年底GPT-5就会发布)。
  4. 乱战时代存活下来的头部企业能喝汤,其它公司的投入打水漂。

国内大模型领域进入乱战时代相关推荐

  1. AI:大模型领域最新算法SOTA总结、人工智能领域AI工具产品集合分门别类(文本类、图片类、编程类、办公类、视频类、音频类、多模态类)的简介、使用方法(持续更新)之详细攻略

    AI:大模型领域最新算法SOTA总结.人工智能领域AI工具产品集合分门别类(文本类.图片类.编程类.办公类.视频类.音频类.多模态类)的简介.使用方法(持续更新)之详细攻略 导读:由于ChatGPT. ...

  2. 干货!拥抱大模型,探寻新时代的科研范式

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 随着ChatGPT.SAM为代表的大规模预训练模型的横空出世,对于人工智能.自然语言处理.计算机视觉以及软件开发等领域都带来了巨大的影响 ...

  3. 钉钉正式接入阿里“通义千问”大模型;金山办公发布“WPS AI”;北大团队推出ChatExcel丨每日大事件...

    ‍ ‍数据智能产业创新服务媒体 --聚焦数智 · 改变商业 企业动态 黑芝麻智能携武当系列智能汽车跨域计算平台.华山开发者计划参加上海车展 4月18日,黑芝麻智能在上海车展现场举办发布会,首席市场营销 ...

  4. 华为大模型重磅来袭!!!

    华为终于又透露了大模型的消息. 大模型新产品将于今年7月初发布,据了解,这款大模型产品是一款多模态千亿级大模型产品,其客户主要面向To B/G政企端客户. 这也让华为在大模型领域的野心逐渐摆上台面.天 ...

  5. 国内主流AI大模型盘点

    今年年初,轰动科技圈的大事就是ChatGPT的面世,它的到来打响了AI智能时代的第一枪,同时展开了一场别开生面的智能科技革命. 随着ChatGPT迅速走红,国内各大企业纷纷发力认知大模型领域.经过一段 ...

  6. 新程序员大会(NPCon):从大模型到AGI,ChatGPT的大航海时代!

    AI激荡70载,身处操作系统演变的中心位置,在ChatGPT.文心一言等AIGC产品,GPT-4.Stable Diffusion.Midjourney等AI大模型的加持下,程序员现有的编程范式将会遭 ...

  7. 科技云报道:国内AI大模型鏖战,上演科技罗生门

    科技云报道原创. ChatGPT的狂热从年初持续至今,这份狂热不仅仅来源于用户层,从业者.投资人以及企业可以说有过之无不及. 于是,这些投资人.从业者以及企业将狂热转化,宣布入局大模型赛道并推出相关产 ...

  8. 一周 AIGC 丨国内掀起大模型军备竞赛,第一季度推出超 150 个 AI 聊天机器人

    国内互联网圈好久没有这么热闹了,要感谢漂洋过海的 ChatGPT.它让互联网大厂意识到,除了和小区门口卖菜的大妈争夺流量,原来还有更有意义的事情可做,于是一股脑扎进来掀起大模型军备竞赛.它还让隐退的互 ...

  9. 极客公园对话 Zilliz 星爵:大模型时代,需要新的「存储基建」

    大模型在以「日更」进展的同时,不知不觉也带来一股焦虑情绪:估值 130 亿美元的 AI 写作工具 Grammarly 在 ChatGPT 发布后网站用户直线下降:AI 聊天机器人独角兽公司 Chara ...

最新文章

  1. PostgreSQL、Greenplum 日常监控 和 维护任务
  2. 笔记-项目整体管理-指导与管理项目工作的输出
  3. 微软认知服务应用秘籍 – 与机器人聊知识
  4. 启动和停止一个服务,修改服务的启动类型 Start and Stop Service for windows
  5. 7000块招不了一个工人
  6. TJUSCSST第二次作业
  7. jQuery 学习-样式篇(一):如何引用 jQuery
  8. java sessionid_Java SessionKey.getSessionId方法代码示例
  9. go java 垃圾回收_JAVA什么时候执行垃圾回收以及回收流程-Go语言中文社区
  10. iredMail安装
  11. 100句励志名句让你在困境中绝地求生
  12. cisco 三层交换机与二层交换机级联 vlan trunk
  13. 推荐 10 款 C++ 在线编译器
  14. 解决springboot无法访问此网站,localhost 拒绝了我们的连接请求的问题。
  15. 社交电商如何持续进化?来看看最新的拼团玩法——七人拼团
  16. 我是学计算机的表情包,我是一个热爱学习的人表情包
  17. 史上最简萤石云视频显示开发教程(pc端)
  18. 数据网站 免费数据网站
  19. css 超链接样式设置
  20. pdf怎么编辑连续页码

热门文章

  1. Obsidian的图片支持HTML本地图片
  2. 景联文科技提供自动驾驶路况信息采集服务
  3. UnityShader学习教程之<顶点膨胀效果 局部变胖实现思路>
  4. 利用transform:translate使div居中显示
  5. 使用SSM框架上传图片
  6. TensorFlow(Keras) 一步步实现Fashion MNIST衣服鞋子图片分类 (2) Coursera深度学习教程分享
  7. Kong动态负载均衡与服务发现
  8. LINUX IDL8.4安装 那些坑!
  9. 1032: 单位转换(1级)假设Laughing Sir希望全部采用公里计量,你可以帮他写出转换程序吗?已知1英里等于1.609公里。
  10. 批量添加在线地图 教程 快速添加