编 | 好困 袁榭
源 | 新智元

【导读】当代人工智能领域最权威的学者之一吴恩达,于2022年2月8日晨在自己推特上宣布新冠检测结果阳性,不过症状轻微。

北京时间,2022年2月8日早上6点,吴恩达新冠病毒检测呈阳性。

吴恩达表示,由于自己已经接种了疫苗和加强针,目前的症状和与轻度的流感差不多。感谢全世界从事疫苗工作的人们。

大年初一的时候,他还发推祝大家虎年快乐。

还有不到3个月就要过46岁生日了,希望大佬好好休息,早日康复。

成就一览

吴恩达无疑是当代人工智能和机器学习领域最权威的学者之一,同时在商业上也颇有建树。

吴恩达是斯坦福大学计算机科学系和电气工程系的客座教授,曾任斯坦福人工智能实验室主任。

吴恩达的理想是让世界上每个人能够接受高质量的、免费的教育。于是便与达芙妮·科勒 (机器学习界的一姐和大牛,《Probabilistic Graphical Models: Principles and Techniques》的作者)一起创建了在线教育平台Coursera。

吴恩达于1976年出生于英国伦敦。他的父母都是来自香港的移民。在成长过程中,他在香港和新加坡度过了一段时间,后来于1992年从新加坡莱佛士书院毕业。

1997年,他获得了宾夕法尼亚州匹兹堡卡尼基美隆大学班级顶尖的计算机科学、统计学和经济学三重专业大学学位。1996年至1998年间,他在AT&T贝尔实验室进行了强化学习,模型选择和特征选择的研究。

1998年,吴恩达在马萨诸塞州剑桥的麻省理工学院获得硕士学位。在麻省理工学院,他为网络上的研究论文建立了第一个公开可用,自动索引的网络搜索引擎(它是CiteSeer/ResearchIndex的前身,但专注于机器学习)。

▲趣味哏图:「当你看到以下片头标时,就会知道影视产品很棒:20世纪佛克斯、派拉蒙、华纳兄弟、吴恩达微笑」

2011年,吴恩达在谷歌创建了谷歌大脑项目,以通过分布式集群计算器开发超大规模的人工神经网络。

2014年5月16日,吴恩达加入百度,负责「百度大脑」计划,并担任百度公司首席科学家。2017年3月20日,吴恩达宣布从百度辞职。

2017年12月,吴恩达宣布成立人工智能公司Landing.ai,担任公司的首席执行官。

▲趣味哏图:「AI的文艺形象是终结者,真实形象是吴恩达公开课」

作为教师,他保持一项纪录:在2013-1014年斯坦福大学秋季学期的「机器学习」课程中,这门由吴恩达主讲的课程有超过800名学生选修。这曾是斯坦福历史上最多人同时选修的课程。

没有任何教室可以容纳,所以很多人都是在家看课堂录像。不过这门计算机专业的研究生课程比Coursera上的同名公开课要难很多,用他自己的话来说就是“这(和Coursera上的相比)可以说是两门课”。

▲吴教授公开课金句:「听不懂先不要怕」

他在斯坦福公开课与Coursera里主讲机器学习,效果极佳,在业界和普罗大众中都非常受欢迎。

▲趣味哏图:「女友:你看泰坦尼克都不哭!难以置信!你究竟有没有感情!你哭过没有!AI学子:有啊,吴恩达公开课结尾出手写感谢字幕的时候。」

吴恩达在Coursera上的机器学习课程,平均得分4.9分。Coursera上的课程评分满分5分,大部分公开课处于4-4.5分之间,能做到4.9分的课程很少,而这门课程有近五万人给出评分。按Freecodecamp的统计,这是机器学习在线课程中最受欢迎的一门。

吴恩达的公开课程中高数内容相对不多,在同类公开课中比较亲善大众。他解释过原因:「这门课没有使用过多数学的原因就是考虑到其受众广泛,因此用直觉式的解释让大家有信心继续坚持学习。」

▲趣味哏图:「吴恩达公开课,默默为AI新丁挡下了微积分、线代、统计、概率论这些高数火力,让学子们得以安眠。」

80%的数据+20%的模型=更好的机器学习

机器学习的进步是模型带来的还是数据带来的,这可能是一个世纪辩题。

吴恩达对此的想法是,一个机器学习团队80%的工作应该放在数据准备上,确保数据质量是最重要的工作。

「AI = Data + Code」

出现问题时,大部分团队会本能地尝试改进代码。但是对于许多实际应用而言,集中精力改善数据会更有效。

吴恩达认为,如果更多地强调以数据为中心而不是以模型为中心,那么机器学习将快速发展。

我们都知道Google的BERT,OpenAI的GPT-3。但是,这些神奇的模型仅解决了业务问题的20%。而剩下80%就是数据的质量。

MLOps是什么?

MLOps,即Machine Learning和Operations的组合,是ModelOps的子集。

它是数据科学家与操作专业人员之间进行协作和交流以帮助管理机器学习任务生命周期的一种实践。

与DevOps或DataOps方法类似,MLOps希望提高自动化程度并提高生产ML的质量,同时还要关注业务和法规要求。

比如在缺少数据的应用场景中进行部署AI时,例如农业场景,你不能指望自己有一百万台拖拉机为自己收集数据。

基于MLOps,吴恩达也提出几点建议:

  1. MLOps的最重要任务是提供高质量数据。

  2. 标签的一致性也很重要。检验标签是否有自己所管辖的明确界限,即使标签的定义是好的,缺乏一致性也会导致模型效果不佳。

  3. 系统地改善baseline模型上的数据质量要比追求具有低质量数据的最新模型要好。

  4. 如果训练期间出现错误,那么应当采取以数据为中心的方法。

  5. 如果以数据为中心,对于较小的数据集(<10,000个样本),则数据容量上存在很大的改进空间。

  6. 当使用较小的数据集时,提高数据质量的工具和服务至关重要。

十年前,社区开始接受深度学习,那时还不知道需要多少万份新颖的发明、多少研究论文,才能达到我们现今的发展地位。

但昔日的不解早已烟消云散。

「人们一开始质疑TensorFlow和其它奠定基础的框架。而如今,我认为,在考虑MLOps和以数据为中心的人工智能时,随时都有数以万计的想法有待发明。」

归根结底,任何机器学习的企业都必须关心客户对产品的需求,所有事情都与业务有关。

在构建MLOps团队时,吴恩达推荐了一条可靠的原则:

要求团队进行长期、认真地审视,确保在整个产品生命周期中,始终能产出高质量的数据。

「即使MLOps一词没有出现在职位描述中,但我认为,MLOps仍然是现在人们需要学习的一项重要技能。」

后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

 

[1]https://twitter.com/AndrewYNg/status/1490808144267673601

吴恩达,确诊新冠阳性!相关推荐

  1. 突发!吴恩达确诊新冠,46岁生日还有不到3个月

    编辑:好困 袁榭 [新智元导读]当代人工智能领域最权威的学者之一吴恩达,于2022年2月8日晨在自己推特上宣布新冠检测结果阳性,不过症状轻微. 北京时间,2022年2月8日早上6点,吴恩达新冠病毒检测 ...

  2. 吴恩达,确诊新冠阳性

    点击"开发者技术前线",选择"星标"让一部分开发者看到未来 转载自:新智元  |  编辑:好困 袁榭 [导读]当代人工智能领域最权威的学者之一吴恩达,于2022 ...

  3. 吴恩达成立新公司,签约富士康,专注制造业AI变革(附视频)

    今年六月份,从百度离职三个月后的吴恩达宣布成立新公司Deeplearning.ai,专注AI领域的教育培训(戳这里了解大数据文摘相关报道).六个月后,就在刚刚,他在twitter上宣布了另一家新公司的 ...

  4. 吴恩达团队新研究!用MRNet进行膝关节磁共振影像诊断 已媲美医生 | 论文

    乾明 发自 凹非寺 量子位 出品 | 公众号 QbitAI 近日,吴恩达在Twitter上po了自己团队的最新研究. 一种能够预测"膝关节磁共振影像检查"异常的算法. 这个算法主要 ...

  5. 吴恩达团队新研究:用X光片识别14种疾病,AI准确度部分超越人类

    栗子射线 发自 凹非寺  量子位 报道 | 公众号 QbitAI 最近,吴恩达的斯坦福团队发布了一个X光诊断算法,基于深度神经网络. 与曾经的肺炎检测专门算法不同,这次的CheXNeXt模型,可以诊断 ...

  6. 重磅 | 吴恩达Coursera新课已经上线,开启全民 AI 时代!

    点击上方"AI有道",选择"星标公众号" 关键时刻,第一时间送达! 说起吴恩达「Andrew Ng」,相信大家都非常熟悉了.作为人工智能的大 IP,吴恩达一直致 ...

  7. 吴恩达机器学习新课程又来了!旁听免费,小白友好

    Alex 发自 凹非寺 量子位 | 公众号 QbitAI 吴恩达的经典机器学习课程又双叒开新课了! 今天,吴老师发推分享了这则好消息. 该课程由deeplearning.ai和斯坦福大学提供,目前已上 ...

  8. 刚刚,吴恩达 ChatGPT 新课三连发!

    你有没有想过,你可以自己构建一个AI系统,或者开发一个使用大语言模型(LLM)的应用,甚至理解并创建扩散模型?我在吴恩达的三门新课程中找到了答案,这些课程让我看到了AI的无限可能性. 好消息!就在昨天 ...

  9. 吴恩达经典ML课全面升级!更新为Python实现,加入更直观的视觉教学

    丰色 发自 凹非寺 量子位 | 公众号 QbitAI 吴恩达的机器学习课程要推出全新版本了! 就在Coursera成立十周年之际,他在推特上宣布了这一重大惊喜: 一时之间,评论区刷满了网友的期待和兴奋 ...

最新文章

  1. group by 查找订单的最新状态 join
  2. PYG教程【四】Node2Vec节点分类及其可视化
  3. Python 常见的17个错误分析
  4. Java加密与解密的艺术~DigestInputStream
  5. Java 字符串拼接的各种玩法
  6. i2c-tools 使用集锦
  7. IDEA 之because it is included into a circular dependency循环依赖的解决办法
  8. 2021年蓝桥杯省赛JavaB组真题解析
  9. python中的nmap模块(编写扫描器)
  10. 如何提高自身代码能力
  11. BTN7971B电机驱动设计(含原理图)
  12. Kubernetes安装EFK日志收集
  13. 表现与数据分离、web语义化的理解
  14. 计算机大专考试题,计算机大专考试试题一
  15. JavaScript 常见鼠标事件
  16. Graphics Layer Tree创建
  17. 分布式存储系统——《Neo4j》
  18. NeurIPS latex中文支持
  19. 浅淡数据结构时间复杂度和空间复杂度
  20. MySQL多表查询优化

热门文章

  1. json字符串和字典类型的相互转换(转载)
  2. java 几个线程池的理解
  3. SQL Server 和 Oracle 以及 MySQL 有哪些区别?
  4. [转]java 组播
  5. 通过 .NET Framework 中的 XPath 和 XSLT API 方便地操作 XML 数据
  6. Sql 实现自动添加行数标记
  7. GARFIELD@10-07-2004
  8. 华为海选开发者状元?还送14件豪礼?
  9. Linux 开发者最应该知道的命令汇总
  10. Adbshell相关命令