文|张向前
源|分布式实验室

OpenAI的新业务模式,卖Model instance,起价26万4千美元一年。

这个Model instance的好处是它完全归属于你,你可以按照自己的要求,对它进行有针对的微调,使它具备你需要的专业能力。可以理解为OpenAI提供通用基础脑,而客户可以把它改成专业脑。

由于基础模型的功能已经足够强大,对它进行改造的成本很低,所以企业无需自己从头训练一个大型LLM,直接在OpenAI的基础上微调就能得到自己的模型。

OpenAI悄悄启动了一套全新开发者平台,允许客户使用专用容量运行OpenAI的新型机器学习模型,包括GPT-3.5。根据用户在Twitter上亮出的早期截屏画面,OpenAI即将发布的这款产品名为Foundry,号称“专为运行更大工作负载的顶级客户而设计”。

文件指出,“Foundry能够支持大规模推理,用户可以完全控制模型配置与性能设定。”我们已经联系OpenAI以确认这条消息是否准确可靠。

如果截屏内容可信,那么在启动之后,Foundry将专门为单一客户提供“静态分配”的计算容量(可能由OpenAI的首选公有云平台Azure提供)。这样,用户就能使用OpenAI内部的模型构建和优化工具/仪表板,对特定实例开展监控。此外,Foundry还会提供一定程度的版本控制,由客户决定是否升级到更新的模型版本,并为OpenAI的新模型提供“更健壮”的微调。

Foundry还将提供服务水平承诺,例如正常运行时间和按期工程支持。这些专用计算单元要按季度或年计算租金,运行单一模型实例需要租用特定数量的计算单元(详见下图)。

可以肯定的是,这类实例不会太便宜。即使是GPT-3.5的轻量化版本,三个月期的运行费用也高达7万8千美元;一年期承诺合约的运行成本为26万4千美元。作为对照,英伟达最新一代超级计算机DGX Station的每单元运行价格为14万9千美元。

敏锐的Twitter和Reddit用户们已经发现,实例定价表中列出的文本生成模型之一具有32K的最大上下文窗口(所谓上下文窗口,是指模型在生成其他文本之前所能考虑的背景信息;上下文窗口越大,则代表模型能够「记住」之前的更多文本内容)。OpenAI的最新文本生成模型GPT-3.5具有4K最大上下文窗口,这暗示着此处的新模型很可能是大家期待已久的GPT-4——或者说3.5到4.0之间的某个过渡版本

从微软获得数十亿美元的投资之后,OpenAI目前正背负着巨大的盈利压力。根据报道,该公司预计将在2023年赚到2亿美元。但截至目前,这家初创企业的研发投入已经砸下10亿美元。

这笔开销大部分来自计算成本。对于前沿AI模型的训练而言,瞬间就会烧掉几百万美元,后续的推理运行也不会便宜太多。根据OpenAI联合创始人兼CEO Sam Altman的介绍,OpenAI如今爆火的聊天机器人ChatGPT在处理每次会话时成本为几美分。考虑到早在去年12月,ChatGPT的用户就已经超过百万,这部分运营成本也绝对不容小觑。

在AI货币化的过程中,OpenAI最近还推出了ChatGPT的“Pro”版——ChatGPT Plus,每月起步价20美元。他们还与微软合作开发了Bing Chat,在争议声中迅速获得主流关注。根据相关消息,OpenAI未来还计划推出移动版ChatGPT应用,并将其AI语言技术引入Word、PowerPoint和Outlook等微软产品。

另外,OpenAI将继续通过微软Azure OpenAI服务(一套以企业为中心的模型服务平台)进行技术交付,并维护与GitHub合作开发的付费代码生成服务Copilot[1]。

后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

[1]https://mp.weixin.qq.com/s/rAxz1qacC2Tuo2Nnigvc_g

OpenAI推出新业务模式:售卖Model instance相关推荐

  1. 安谋科技发布新业务品牌“核芯动力”,先手布局智能计算产业

    安谋科技(中国)有限公司("安谋科技")举行"创芯生,赋未来" 新业务品牌战略发布会,重磅发布"双轮驱动"战略以及新业务品牌"核芯 ...

  2. 5G商用大幕拉开 下一个风口:行业新应用、新业务或新商业模式?

    从3G跟随.4G并跑到5G引领,可以说是中国通信业数十年埋头发展的真实写照.5G,中国无疑是全球通信行业的重要贡献者,包括技术.设备.网络.终端.平台到应用开发等.此前中国的通信运营商已率先制定5G测 ...

  3. 苹果手机变成耳机模式怎么调回来_苹果耳机推出“新功能”:打僵尸!

    昨天晚上,苹果悄么声的在官网上发布了他们的最新产品:AirPods Pro,习惯了在发布会上搞大动静发售新产品的苹果,这次走了一波低调奢华的路线. 当然,苹果的文案还是一如既往的稳(如果你还记得iph ...

  4. AI-Powered Concierge App:如何在2018-2019年推出新的业务方式

    一个为您全天候工作的个人助理 - 听起来很诱人,不是吗? 无论你走到哪里,梦想着这样的帮助都会转变为许多分支机构的商业理念,热情好客即将到来. 您的任何客户都很乐意立即获取所需信息,所以也许是时候为您 ...

  5. 净利下降7成、新业务“扛大旗” 阿里转型更需耐心

    股价低迷.被罚款.国内竞争加剧,过去的2021年,阿里巴巴遇到了一个又一个挑战,直观可见的就是股价的下跌.而昨天发布的2021年第四季度财报,似乎也在印证着外界对于阿里的唱衰. 但需要注意的是,没有一 ...

  6. OpenAI 推出漏洞赏金计划,最高奖励 2 万美元;京东零售开启 5 年来最大组织变革;​Django 4.2|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  7. android新架构模式_Android MVIReact架构模式

    android新架构模式 If you are already aware of basic principles of architecture patterns and MVVM and MVI ...

  8. ChatGPT——OpenAI推出的人工智能聊天机器人

    ChatGPT--OpenAI推出的人工智能聊天机器人 目录 [隐藏] 1 什么是ChatGPT 2 ChatGPT的应用领域[3] 3 ChatGPT的原理 4 ChatGPT的发展历程 5 Cha ...

  9. 高擎信息安全大旗,打造“互联网+”新服务模式

    现代社会,各行各业都逐渐建立起了大数据分析系统,大数据已经悄悄渗入我们生活的方方面面.举一个简单的例子:您每天在电商平台的浏览与购买行为.在各搜索引擎搜索过的内容都会被各行各业拿来进行数据分析,将您希 ...

最新文章

  1. Android之自定义 ActionBar 上的菜单(Menu)文字颜色
  2. 反向输出dna序列_蛋白质序列反向(逆向)翻译成DNA序列-在线工具
  3. 用Matlab实现字符串分割(split)
  4. it转正述职报告_三年产品经理的转正述职报告
  5. fedora 不在sudoers文件中_Spring AOP中还有你不知道的JVM Class文件字节码转换知识!...
  6. Centos6.5搭建mongodb分片
  7. C++关键字 explicit
  8. 配置高并发jdbc连接池
  9. 基于HTTP协议的Java文件传输
  10. 内连接和外连接的区别和详解(全)
  11. SWMM与Python的那些事 (一)
  12. 计算机五笔是什么时候学的吗,电脑五笔输入法怎么学
  13. CentOS7 配置防火墙规则应对漏洞扫描
  14. 《惊人的假说-灵魂的科学探索》读书笔记(1)
  15. QQ群、讨论组上传文件,由于网络原因上传失败?
  16. 大班线描机器人_大班美术lbrack;漂亮的机器人rsqb;活动设计
  17. 【安卓】处理Android Studio中文字体为繁体字
  18. JS手写上传文件、React手写上传文件
  19. flutter下载慢
  20. 程序员职业资格软考——软考,你不想软就得考 (值得一看的总结)

热门文章

  1. 计算机毕业设计springboot家私导购系统5z229源码+系统+程序+lw文档+部署
  2. Android 仿微信朋友圈拍照原理解读,技术分析
  3. 钢条切割问题——递归求解法
  4. 2022年塔式起重机安装拆卸工(建筑特殊工种)考试试题及模拟考试
  5. 面试官问我有没有分布式系统开发经验,我一脸懵圈…
  6. 远程连接 腾讯云 redis 服务器
  7. 一觉醒来,硬盘数据被远程删光
  8. 计算机英语统考免考条件,统考可以申请免考吗?符合什么条件可以申请免考?...
  9. 用深度学习识别人脸openface和dlib
  10. 学习笔记三:GMM模型以及EM算法理解及代码实现