李林 发自 凹非寺
量子位出品 | 公众号 QbitAI

“百度非常愿意和全球有梦想的开发者一起,来实现一个理想:Everyone can AI。”

2018年7月的百度Create开发者大会上,李彦宏一句话赢来满场掌声。

百度有一款工具便与这个理想息息相关——定制化训练及服务平台EasyDL。它的目标,就是让零算法基础的用户,也可以基于自身业务需求和数据,快速训练专属的定制化AI模型。

转眼已是2019,EasyDL怎么样了?

如果你对它的印象还停留在刚刚推出之时,认为它不过是个能自动训练图像分类模型的试验性产品,那么,你的认识需要刷新一下了。

2018年,EasyDL有两大核心进展。

产品和技术层面,它支持的任务已经覆盖图像分类、物体检测、文本分类、声音分类。

而且,EasyDL还新增用离线SDK来部署模型功能,用户不仅能通过调用接口来使用在平台上训练出来的模型,还可以下载封装了模型的SDK,嵌入终端使用,无需联网就能运行。

应用落地方面,官方数据显示,截止2018年12月31日,EasyDL平台总注册用户数超过10万名,应用企业覆盖22个行业。

全面发展的EasyDL,正在一点一点地削低人工智能开发门槛,助力各行各业升级转型,也让更多普通个人参与进来,用AI改变生活。

削平门槛,人人AI

2018年,无论从企业的行动上,还是从政府的政策鼓励上来看,AI发展的主旋律都离不开两个字:

落地。

工厂流水线上的质量检测、商店里的自动识别结账、无处不在的智能审核……

越来越多来自不同领域的企业,开始“想AI”。他们面前,摆着重重关卡。

先是人才关

《人民日报》海外版此前有报道称,中国人工智能人才缺口超过500万。这样的供需关系也导致人工智能人才价格水涨船高,《第一财经》在2018年冬天的一篇报道中提到,企业招应届生的薪水比上年提高了10%-20%,甚至有公司给博士生的薪水从上一年的年薪50万元涨到了80万。

招不到、招不起,似乎已成常态。

就算高价请来AI大牛,还有业务关摆在面前,“落地”依然遥远。要把前沿技术与相对传统的业务实践结合起来,可是个难题。

怎样跨越这两道关卡?

百度的第一个答案,是百度大脑AI开放平台上的一系列标准API,包括语音识别、图像识别、自然语言处理等等,供企业直接使用。

这的确帮企业绕开了人才一关,但放到实际业务场景里,百度发现,很多客户都有个性化需求,统一的API倒在了业务关前。

比如说,一个通用的图像识别API,面对细分场景的需求实在无能为力:想让它看图识别家居风格?判断工人有没有穿工服?厨师有没有戴帽子口罩?Sorry,没学过。

要是懂业务的自家员工,能用自家数据,定制训练符合自家业务场景需求的AI模型就好了……

可是这些员工可能并不熟悉深度学习,如何跨越技术门槛?

这就要看“优化版”答案了:2017年11月,百度上线自动化机器学习平台EasyDL。几乎是同时,谷歌也瞄准了这个方向。2018年1月,谷歌开始测试自动化机器学习产品AutoML。

两家在人工智能领域大力布局的巨头,都进入了这个领域。

EasyDL作为定制化模型训练和服务平台,用自动的算法削平了定制AI模型的技术门槛,用户需要做的,是理清需求,准备数据。

定制AI模型4步走

用EasyDL训练机器学习模型,分4步:

整个流程都是可视化图形操作,不用写一行代码,就能训练出AI模型。

训练出来的模型,也并不比专业人士差。

EasyDL训练的模型,有2/3以上准确率都超过了90%,在比较简单的任务上,比如为传统制造业的鲽鱼科技检测键盘组装是否合格,识别准确率就超过了99%。

而且,训练起来,可能比专业人士还快。拿1000张图片使用EasyDL训练一个图像识别模型最快只需要8分钟;拿1000条音频来训练声音分类模型,只需15分钟;使用3000条数据训练文本分类模型,也只需8分钟。

4步自动定制高精度模型,是由什么样的技术支撑的呢?

为了实现全流程自动化,百度构建了机器学习从训练到上线的工作流引擎AI Workflow,能将大数据成熟的工程系统与人工智能分布式模型训练相结合。

而模型训练的工作,就要交给迁移学习和自动模型搜索(Auto Model Search)了。

训练的原理,简单来说是个“举一反三”的过程:拿来一个经过大规模数据集预训练的模型,把它学到的“知识”应用到特定的业务场景上。帮它理解这个场景的,是来自实际业务的新数据集。

这个新数据集并不需要太大,比如说在图像识别任务里,用户只需要为每个类别准备20到100张图像就够了。

自动训练的过程,则比人类专家训练模型有效率得多。为了尽可能找到性能最好的模型,自动模型搜索算法会选择多个预训练模型,再搭配不同的批次大小、学习率等超参数,发起多个训练。然后,再筛选出最适合的模型。

另外,EasyDL的算法还会自行通过early stopping来降低过拟合风险。除了模型训练之外,EasyDL平台还包括了数据集管理、标注、版本控制等功能。

这样,那些本来离人工智能有点遥远的企业、机构、甚至爱好者,都具备了训练模型的能力。

进击的2018:落地各行各业

就是这个一站式的人人AI平台,从发布到现在,一年出头的时间实现了巨大的跨越。

EasyDL在2017年11月初次亮相时,只有图像识别一种能力,其他数据,概不能学。

一年出头的时间,它增加了定制化声音分类和文本分类两大类新功能,还有新的部署方式:离线SDK。

声音分类可以用在安防领域来监测异常声音,也能用在野外通过声音分辨不同物种;文本分类则用来给文章分类、审核文字内容有没有包含违法信息等等。

而离线SDK,则应对着企业实际应用中的现实问题:网络可能不好,数据可能不方便传到云端,对检测速度可能有极高要求。这些,就催生了把模型部署到本地硬件上的离线SDK。

现在,EasyDL平台总注册用户数超过10万名,覆盖的行业有22个,包括零售、安防、互联网内容审核、医疗、法律、会计、餐饮、购物等等。

在工业领域,它就已经是个很成熟的质检员了。在一家名叫柳州源创的传统企业里,检验工业喷油嘴瑕疵这道工序就已经不再需要人力——EasyDL训练的算法代劳了,每年节约的人力成本有60万元。

又比如地板公司圣象,也通过EasyDL把人工智能用到了生产中。以前,生产出来的地板需要工人一片片肉眼识别是否合格,再分拣出来。而现在,他们部署了EasyDL训练出来的算法,用摄像头自动判断地板质量、机器自动分拣。“比做了3年的老员工还要精准”。

在安防监控领域里,它也是个厉害的监测者。说广东佛山的供电局,就在用EasyDL训练的模型,通过摄像头时刻监控输电线路有没有遇到吊车、挖掘机等安全隐患。长江沿岸,也有摄像头结合EasyDL训练出的算法监控着非法采砂、破坏河道的船只。

最新上线的文本分类模型也已有落地应用。货运平台货拉拉就在用EasyDL文本分类,来筛选优质用户留言,精准定位目标客户,提升整体的运营效率。

也有商家用EasyDL训练的模型审核商品陈列是不是符合要求,中国食品药品鉴定研究院在用它识别中草药,还有供电局用它监控输电线路隐患……

案例之多,应用场景之丰富,远不是这样几段文字所能展现。

而这种广泛应用,也正体现出了EasyDL与企业需求的契合。它只需少量数据,就可以训练出模型,然后落地验证效果。这样,既为企业省去了找深度学习工程师的成本,又大大降低了因为可行性不确定而带来隐患。

在AI变革生产力的大潮中,EasyDL这样的工具让众多中小企业有了参与感:要想让AI成为各行各业新的生产力,不能仅仅依靠行业里的头部公司做定制化的大单,这样一个大单需要AI公司动用少则几十人,多则几百人的团队,耗资上千万,很难规模化。

EasyDL展示了百度AI开放生态的另一种玩法:用平台的思路,做规模化的AI落地。

EasyDL这个定制化工具,是百度大脑AI开放平台一站式AI解决方案的一部分。

整套解决方案中,有深度学习框架PaddlePaddle等底层技术,供有算法实力的公司使用;有能满足零技术基础企业个性化需求的EasyDL和Unit智能对话训练与服务平台、模板化文字识别平台;还有各行各业应用场景的成套解决方案,直接满足企业比较普遍的需求。

迎接全民开发者时代

其实不止企业,很多既没有基础,又单打独斗的个人,也在用EasyDL进行实践,融入AI无处不在的时代。

2018年5月以来,百度举办了多场EasyDL挑战赛,参赛者有来自一线的工程师、工人、律师、会计、护士等。

他们从自己的职业和生活出发,用EasyDL设计了各种脑洞大开的AI模型。有识别口红色号模型,用来拯救直男,有共享单车损坏识别,有小麦识别病症模型……这些AI模型虽然较难产生巨大的经济效益,做出巨大的科技突破,但是却能解决个人经验积累、信息不对称的问题。

比如说在医疗行业,医生这个职业的高度专业性,让技术的落地难上加难。好在,也有医生在根据自己的需求,定制出了属于医生的AI模型。

援藏医生陈静飞就是这样做的。藏地牧区,寄生虫病高发,而检验人员缺乏。于是,他就运用EasyDL技术,几个月建立了一套寄生虫识别系统,可以识别显微镜下十几种寄生虫卵,测试准确率超过97%,可以媲美20年临床经验的专家。

也有久病成医者。亲人不幸患病的个人开发者郭晶,就开发了医学诊断模型,想辅助医生分析病情,减少失误。他组建团队用EasyDL开发了AI辅助诊断和管理App,仅是EasyDL比赛就参加了两次,还获得了第四届中国研究生移动终端应用设计创新大赛三等奖。

此前,很多人谈到AI的时候,要么恐惧,要么就抱有过高的期待,不如直接试一试EasyDL,在尝试中看看AI究竟能做什么,培养起AI时代的AI素养。

Next…

覆盖了这么多用户、积累了各个行业的应用之后,EasyDL的下一步是什么?

答案是更多模型定制新功能。百度透露,未来将会在平台易用性、模型类型的丰富度上持续精进,与各行业合作伙伴一起壮大EasyDL平台。

继续扩大用户群、扩展到更多行业,也是必然。

作者系网易新闻·网易号“各有态度”签约作者

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

要让人人能AI的百度EasyDL,现在怎么样了?相关推荐

  1. 如何获取高精度CV模型?快来试试百度EasyDL超大规模视觉预训练模型

    在深度学习领域,有一个名词正在被越来越频繁地得到关注:迁移学习.它相比效果表现好的监督学习来说,可以减去大量的枯燥标注过程,简单来说就是在大数据集训练的预训练模型上进行小数据集的迁移,以获得对新数据较 ...

  2. 百度EasyDL深度学习实战营,免费教你转型AI工程师!

    新型冠状病毒的疫情动态牵动着每个人的心,在当下疫情控制阶段,AI技术的应用也正在为抗疫贡献自己的力量. 百度飞桨联合百度技术学院正式加推"EasyDL深度学习实战营"系列直播课,免 ...

  3. 智能化转型浪潮下,百度EasyDL的“AI普惠”之路

    文 | 曾响铃 来源 | 科技向令说(xiangling0815) 人人都想搭上人工智能这辆快车. 然而不会编程,心有余而力不足,无法跟上技术推动下产业发展的节奏应该怎么破? 百度EasyDL正是这样 ...

  4. 从谷歌AutoML到百度EasyDL,AI大生产时代,调参师不再是刚需

    出品 | AI科技大本营 头图 | 付费下载于视觉中国 2018 年,Google Cloud 宣布将 AutoML 作为机器学习产品的一部分.至此,AutoML 开始进入大众的视野. 实际上,201 ...

  5. 15分钟实现AI端计算模型训练、加速与部署 | 百度EasyDL公开课

    主讲人 | 阿达 百度高级研发工程师 量子位 整理编辑 | 公众号 QbitAI 端计算模型目前已应用到各行业的AI落地实践中,如部署在野外气象观测点用于环境监测,以及响应垃圾分类政策用来打造智能垃圾 ...

  6. AI:百度飞桨EasyDL多门视频课程,手把手教你如何定制高精度AI模型

    AI:百度飞桨EasyDL多门视频课程,手把手教你如何定制高精度AI模型 目录 百度飞桨EasyDL多门视频课程,手把手教你如何定制高精度AI模型 百度飞桨EasyDL多门视频课程,手把手教你如何定制 ...

  7. 【高校校徽识别】基于百度EasyDL实现

    期待您的fork https://aistudio.baidu.com/aistudio/projectdetail/2424635 小程序演示 校徽 校徽(school badge)是学校徽章的简称 ...

  8. 闪耀世界人工智能大会背后,AI头雁百度已成智能经济强力引擎

    7月11日,2020世界人工智能大会在上海圆满闭幕. 本届大会,多位商界领袖.行业专家针对人工智能发表了自己的观点与见解,并引发人们对AI的思考.腾讯CEO马化腾称:"人工智能本身就是一场跨 ...

  9. BAT全球扩张AI路线图 | 百度早于谷歌,腾讯投资最多

    文章经授权转载自新智元(ID:AI_era) CB Insights的最新报告挖掘BAT的AI相关专利记录.投资和收益等,全方位描绘了BAT的AI策略.报告显示,百度在AI领域处于领先地位.BAT分别 ...

最新文章

  1. vbox 设置linux共享文件夹,Windows 7下设置VirtualBox中Linux共享文件夹
  2. Spring Boot 动手写一个 Start
  3. 转载--web前端工程化
  4. 成功解决eric6-EditorConfig Properties The EditorConfig properties for file h5py\numpy.pxd could not be l
  5. 关于AttributeError:‘Flask‘ object has no attribute ‘ensure_sync‘的报错解决
  6. order by、group by也会使用索引?使用这俩关键字的时候索引什么时间会失效
  7. java(3)——数据类型中的数值型的整数类型
  8. sql server中的go
  9. 应用程序添加到服务器,在同一应用程序中的配置服务器和eureka服务器:尝试连接到localhost:8761...
  10. Java大牛的一些总结,献给对未来还在迷茫中的你!
  11. 前端组件化的三种方案:
  12. 推荐算法工程师必备!!!协同过滤推荐算法总结
  13. 使用MDT2012部署WindowsLinux操作系统(4)
  14. 学JS必读,《JavaScript高级程序设计(第3版)》
  15. matlab中生成瑞利信道的两种方法
  16. Visual Studio 2012下载资源 百度云
  17. ZEMAX | 如何使用 ISO 元件制图工具
  18. PMP 项目进度管理 -CPI SPI CV SV
  19. PO模式项目实战思路分析
  20. cad延伸快捷键_熟练掌握快捷键,提高CAD绘图效率

热门文章

  1. 我们为什么要学习 Python、TypeScript 与 Go?
  2. World Leading!世界第二!百度云在吹牛?
  3. php order by 3-- 没反应,Thinkphp 无法使用-)order() 排序的两种解决办法!
  4. zabbix监控nginx连接数
  5. 远程登录服务器哪个工具好,远程登录服务器,有什么比较好用的工具?
  6. dout java,java socket 发送文件
  7. java reset_void reset()
  8. bash 脚本_实用的 bash 自定义脚本,快速提效工作流程
  9. redis分表_《面试官系列:深入数据库分区分库分表》
  10. 理解 webpack 热更新