收藏 | 一文看完吴恩达最新演讲精髓,人工智能部署的三大挑战及解决方案
点上方蓝字计算机视觉联盟获取更多干货
在右上方 ··· 设为星标 ★,与你不见不散
仅作学术分享,不代表本公众号立场,侵权联系删除
转载于:新智元
AI博士笔记系列推荐
周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接
AI算法研究的进展似乎已经到了一个瓶颈期,现在许多公司和研究团队正在努力将研究转化为实际的生产部署。吴恩达(Andrew Ng)最近在斯坦福大学的一个线上的演讲中,分享了一些他认为有趣的观点。
Andrew这次演讲的主题是「Bridging AI's Proof-of-Concept to Production Gap」,即「将人工智能的概念验证与生产差距连接起来」,提出了人工智能部署面临的三个调整和解决的方案,并解答了一些问题。
人工智能部署面临的三大挑战
1.小数据(Small data:Moving beyond big data)
当今很多互联网公司的人工智能算法研究通常使用的是「Big Data」,因为用户产生了很多的数据可供模型训练,而小数据在消费者互联网之外的工业应用领域中却很常见。
智能手机上的各种APP,因为「拿到」了数以亿计的用户数据,所以训练出一个效果很好的神经网络是非常简单的。
但是如何使用小数据来让很多其他行业也能得到效果不错的模型,将是未来的AI发展面临的一个挑战。
例如在做X射线的时候,当样本量达到11000时,AI算法的诊断结果和放射科专家的结果是没有区别的,但在数据量很小的时候,放射科医生的准确率就会远大于模型的结果。
吴恩达指出,当数据分布大致呈现出均匀分布的时候,模型的效果通常是不错的,但是当模型的分布非常不均匀的时候,机器学习算法的效果就会差强人意,这正是人工智能在医疗领域面临的一个重大问题。
如上图所示,「Hernia」是一种罕见的案例,统计数据量非常少,忽略不计对模型准确度的影响不大,但是在医疗领域,「Hernia」作为一种症状,是绝对不可以被忽略的。
就像他经常听到很多的有趣对话一样,通常算法工程师在炫耀说:「快看我的模型在测试集上得到了非常高的准确率」,而医生则通常会说:「恭喜你的算法取得了很好的效果,并且能发论文了,但是你的系统不能用」。
而这种结果就导致了人工智能面临的第二个挑战。
2.算法的鲁棒性和泛化性(Generalizability and robustness)
一个模型通常在已发表的论文中work,而在实际生产环境中通常不work。
而这种情况不仅仅只发生在医疗领域,在其他的领域中也非常常见。很多情况下,当你使用了一个完全不同的数据集,模型的泛化能力就会大大降低。
3.变革管理(Change management:manage the change the technology brings)
在自动化工作流中,一个部分使用的模型可能会潜在地影响整个系统和许多其他相关方。
吴恩达举了一个姑息疗法(Palliative care,也叫临终关怀)的例子:在美国,很多医生虽然非常的关注自己的病人,但是由于医生人数的短缺,他们却很少会去做Palliative care。
而通过人工智能设计的系统,医生们可以了解到每一位病人的死亡率,可以更高效的辅助他们的工作。
同时,在医疗系统中,「可解释AI」的作用非常重要,因为医生是无法轻易信任一个黑盒算法给出的结果的。
最后,吴恩达还指出,机器学习的代码(ML Code)只是解决问题的非常小的一部分,需要很多环节形成一个整体的闭环。
应对挑战的解决方案
通常来讲,一个AI项目的整体流程包括如下几个阶段: 完成一个项目需要系统地规划机器学习项目的整个周期,从范围到数据、建模和部署。
在部署阶段,吴恩达指出了一种「Shadow deployment」的方法,就像在放射科使用AI系统一样,算法本身不会做出任何的决策,只会用来辅助医生得到诊断结果。
在模型构建和训练的阶段,Andrew提出了训练数据的重要性,在训练阶段使用一些现成的数据集得出的模型并不一定在实际使用中有很好的泛化能力。
在数据方面,「不要等待找到完美的数据才开始行动」,这是Andrew接触过的很多CEO经常会犯的错误。
吴恩达还指出,AI解决问题不可以凭空想象,一定要结合各个行业的实际痛点,解决对商业有价值的需求。
演讲的最后,他还分享了一个麦肯锡的调研图表:
结果显示,AI所能做的领域远不止消费电子行业,其他领域也有非常广阔的市场空间。
完整版视频地址放送如下:
https://crossminds.ai/video/5f9a11f026cd723d6a05efa4/?timecode=1134.021093202179&&utm_campaign=bc839cc127703d0c&utm_medium=share
end
这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习
目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟
王博的公众号,欢迎关注,干货多多
王博的系列手推笔记(附高清PDF下载):
博士笔记 | 周志华《机器学习》手推笔记第一章思维导图
博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”
博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”
博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”
博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”
博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)
博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)
博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)
博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)
博士笔记 | 周志华《机器学习》手推笔记第八章(上)
博士笔记 | 周志华《机器学习》手推笔记第八章(下)
博士笔记 | 周志华《机器学习》手推笔记第九章
点个在看支持一下吧
收藏 | 一文看完吴恩达最新演讲精髓,人工智能部署的三大挑战及解决方案相关推荐
- 一文看完吴恩达最新演讲精髓,人工智能部署的三大挑战及解决方案
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 本文为吴恩达(Andrew Ng)最近在斯坦福大学的一个线上的演讲.Andrew这次演讲的主题 ...
- 带你少走弯路:五篇文章学完吴恩达机器学习
本文是吴恩达老师的机器学习课程[1]的笔记和代码复现部分,这门课是经典,没有之一.但是有个问题,就是内容较多,有些内容确实有点过时. 如何在最短时间学完这门课程?作为课程的主要翻译者和笔记作者,我推荐 ...
- 低调现身北京的吴恩达,刚刚给人工智能公司下了个定义
大数据文摘作品 记者:魏子敏 2月的第一天,吴恩达在北京完成了一次颇为低调的露面. 国家会议中心工业互联网峰会的主论坛上,吴恩达以Landing.AI创始人&CEO的身份,几乎全程中文,进行了 ...
- 吴恩达:我们说人工智能时,实际在说些什么?
吴恩达:我们说人工智能时,实际在说些什么? 搜狐IT消息 吴恩达在IT领袖峰会上讲了一个长篇故事--我们节选部分,大家感受下. 1.百度在人工智能的优势是啥? 吴恩达用火箭来比喻人工智能.火箭的 ...
- 我从吴恩达课堂演讲中学到的一些建议
作者 | Richmond Alake 原文 | 见页面左下角『阅读原文』 编译 | 机器之心 近来,硅谷迎来裁员潮,机器学习领域的求职压力也有所增加.如何规划 ML 职业生涯,才能获得长期成就?吴恩 ...
- 吴恩达最新斯坦福课程《深度学习》全部视频已送达,请签收!
参加 2019 Python开发者日,请扫码咨询 ↑↑↑ 责编 | Jane 出品 | AI科技大本营(公众号id:rgznai100) [导语]2018 年秋季,吴恩达教授在斯坦福新开了一门 CS2 ...
- 吴恩达最新成果 CheXNet详解:肺炎诊断准确率超专业医师
离开百度之后,吴恩达在学术界异常活跃,除了推出最新的深度学习在线课程之外,他还带领着一支来自斯坦福的团队不断推进深度学习在医疗领域的应用. 近日,吴恩达团队在 arXiv 上发表了他们的最新成果--用 ...
- 深度学习(二)吴恩达给你的人工智能第一课: 02.改善深层神经网络:超参数调试、正则化以及优化
目录 第一周 深度学习的实用层面 1.1 训练 / 开发 / 测试集 1.1.1. 训练集.验证集.测试集 1.2 偏差 / 方差 1.3 机器学习基础 1.3.1.降低偏差/降低 ...
- 重磅 | 就在刚刚,吴恩达最新的《AI 转型指南》正式出炉!
点击上方"AI有道",选择"置顶"公众号 重磅干货,第一时间送达 参与 | 泽南.张倩.李亚洲 机器之心授权转载,禁二次转载 CEO 们应该如何借助 AI 对自 ...
最新文章
- 黑龙江专科大学计算机专业,黑龙江10大最好的专科学校,有你心仪的学校吗?...
- Android开发环境——模拟器AVD相关内容汇总
- python 易支付sdk
- STM32F4_LCD12864并行驱动
- linux path在哪个文件夹,linux PATH环境变量全解析
- mysql 复制表耗时_聊一下mysql的表复制
- 0810 - 代码,还是得一行行写
- 查看mysql数据库历史_查看mysql数据库历史
- Java内存模型和优化
- “约见”面试官系列之常见面试题之第七十八篇之fetch(建议收藏)
- 容器编排技术 -- Kubernetes kubectl create secret generic 命令详解
- Pandas库之DataFrame学习笔记
- 车间调度建模系列1|复杂车间调度问题特点
- 线性判别分析(Linear Discriminant Analysis ,简称LDA)
- 《容器技术系列》一3.2 Docker Daemon的启动流程
- 包含农历、节气、节假日的前端日历
- 破圈-从认知菜鸟到认知高手的四个境界
- 《鹰猎长空》讲述戏曲与电影的渊源
- 阿里巴巴与蚂蚁集团开源框架SOFA Boot
- 浅谈Mysql数据库
热门文章
- python安装时没有选path怎么办,环境变量是个啥? 没有勾选Add to Path怎么办?
- python *args用法_python函数参数*args**kwargs用法实例
- 计算机老师任课教师寄语,任课老师寄语大全
- 64位linux安装mysql数据库吗_Linux下安装Mysql数据库
- 深度linux运行卡顿,Deepin很卡怎么办?Deepin卡顿解决方法盘点
- 东财网络学校计算机统考真题,东北财经大学网络教育学院高中起点计算机基础入学测试模拟题(一)...
- java如何脱离ide运行_如何脱离IDE使用自己的jar包?
- 各层电子数排布规则_一文读懂PCB多层板各层含义与设计原则
- 中南大学c语言试题期末考试,2011年中南大学C语言期末试题卷A
- 晶圆缺陷检测设备_KLA突破电子束晶圆缺陷检测瓶颈,将助EUV光刻机一臂之力