了解H2O-Driverless AI自动机器学习

  • 引子
  • 目前机器学习技术应用落地三大宏观方面的挑战
  • 机器学习技术的应用场景
  • 具体到一些行业领域能解决什么问题
  • 机器学习技术
  • H2O的DAI(DriverlessAI)可以做些什么?
  • 可以参考如下Demo视频
  • 一起讨论学习机器学习吧!

#自动机器学习
#H2O.ai
#DriverlessAI

H2O,听起来名字像是“水”,有那么点意思。
水这个东西好啊,水这个东东自然界都需要,而且也比较容易获得,孕育了万物。一项技术也应该如此,再好的技术,不容易被应用起来,这个技术也很难走进我们的工作和生活。
the Highest Good is like Water
[上善如水]

引子

AI/ML:人工智能和机器学习都是当今的热门词,而且也的确越来越成熟。但是也的确又离我们还有那么点距离,毕竟这技术不是谁都能搞的,这都是烧人烧钱的活,所以推广应用的范围和深度还不是那么猛烈。
因此,也同时普遍给人们传递出那么点感觉:AI是比如Google/微软/IBM/等等…这一类大公司才能干的事情,不是一般企业或者机构可以干的事情。

如果是这样,那么这项技术就不会是一个被普及性应用的技术了…

通过这篇粗略的介绍,希望可以传递一个理念,或者一个信念给大家:
Technology shouldn’t be a barrier, any company should be able to transform into an AI company.
技术不应该成为一个门槛, 任何公司都应该可以转型成为一个AI公司!

下面我们从不是那么技术的角度来看看H2O这家公司是如何助力您的AI/ML技术应用落地,让您的企业实现AI驱动转型的。

目前机器学习技术应用落地三大宏观方面的挑战

1. 技术人才挑战

机器学习技术的应用对专业算法团队和数据科学家团队的要求非常高,技术门槛高带来的就是高投入和风险。此外即便是实力雄厚的大企业也面临市场上人才短缺的困境。

2. 时间效率挑战

时间效率挑战:因为技术难度高,且需要反反复复修改,迭代,提升,做一个机器学习项目耗费的时间就长效率就低,这样导致实际的技术意义就大打折扣。

3. 技术的沟通与信任

技术的沟通与信任:通常技术部门做的东西业务人员或者其他非技术参与方就比较难理解,更别说机器学习这种新技术做出来的成果了。保证一个技术应用在项目参与方的可沟通性,并且让业务主管部门信任的去使用这个技术的成果也是一件非常有挑战的事情。

此外,技术人员做出来的模型,往往像一个“黑盒子”,其他参与方理解困难,同时很多时候因为一个人的流失,对项目也造成极大损失。

机器学习技术的应用场景

说到应用场景,其实也可以换句话问:机器学习有什么用?

简单的说,机器学习可以解决两大类问题:

  1. 非常复杂的事物。
    在我们生活中,面临非常多复杂的问题,有非常多的变量和因素,我们通常很难描述其中的规律,换言之我们目前很难写出一个方程式或者函数去描述某个事物的规律。

举个栗子:
比如:“用户流失”这件事情,一个产品的最终用户是否忠诚有很多影响因素,比如价格调整,产品质量,颜色,材质,某个功能,客户的性别,年龄,可能都会有关系,都会是用户流失的一个影响因素。这实际上就是一个有着非常多,非常复杂变量互相影响的一件事情,我们很难用一个函数一个方程式去说明和计算某个用户的流失可能性是什么样的。

比如:“交通堵塞”这件事情,一个城市有很多条街道构成,每条街道在不同时段的车流量是动态变化的,街道路口分布着不同的红绿灯,车辆有不同的行动路径和方向,然后我们需要去预测堵塞并优化交通这件事情。这实际上也同样是一个有着非常多并且很复杂变量的一个事情,我们很难用一个函数去描述其中的规律。

  1. 精细度,颗粒度的问题。
    以往,我们都某个事物能找到一些规律,或者一些规则,但是规则太粗了,颗粒度太大了,对于事物中每个个体考虑的不够周到,解决的不够细致。

举个栗子:
同样,我们还是拿用户流失这件事情,虽然这个事情复杂,很难用一个方程去准确描述,但是我们通过数据和时间积累,还是可以通过一些数据和现象去定义一些规则,比如看看多少岁年龄段的用户,在价格是多少区间的时候,忠诚度处于一个什么状态,然后依次类推,定义出一些规则,然后对用户加以区分,这样可以在比较粗的一个范围类做出一些判断。
但是,个体的差异太大,特别在用户量非常大的时候,我们发现之前的那些规则开始不那么灵敏了。比如有的用户的数据正好在你之前不同的规则之间交织或者徘徊,你的规则又不是那么细,那么他的忠诚度落点会在哪里呢?这个就很难计算了

再举个颗粒度的例子,以前我们银行给人房贷凭的是经验,看看这个人的实力。后来随着数字化信息化,我们收集了越来越多的个人信息,比如他的各种资产,他的收入情况等等,然后据此定出了一些房贷的规则。当这个人有多少资产,月收入流失在什么样的情况下然后就可以贷款多少钱。
可是随着用户量越来越大,贷款需求也越来越大,客户千差万别,有很多贷款人和贷款的需求很难被之前做的规则覆盖到,因为之前的规则不可能细到区分每个人的情况。

具体到一些行业领域能解决什么问题

具体到某一些行业领域,我们可以看看机器学习能做些什么:

-#FSI-金融服务业:
客户流失预测分析
信用风险评分
消费活动预测
消费额预测
反洗钱
信用卡申请反欺诈
个人贷款风险评估
信贷申请审批
信用卡临时额度调整
客户画像与分类
客户行为分析
市场营销策略优化
定价策略优化
会话中营销
IT系统预防性维护

-#Telco-电信业:
营销活动优化
最佳报价和建议
个性化消费项目推荐
对话中营销
欺诈检测
站点选址
预防性网络维护
降低可避免的到场服务
网络异常检测
网络优化
智能电力管理
主数据管理
网络安全
推荐引擎
智能广告投放
客户流失预测
客户体验改善

-#HealthCare-医疗健康:
早期癌症检测
远程病人监护
医学检验预测
个性化处方推荐
流感预测
医疗保险申报反欺诈
药物研发发掘

不止这些问题和场景,机器学习可以做到更多,比如各行业企业的供应链优化,设备主动维护,交通拥堵优化,等等

当然,机器学习不止可以去解决上面提到的那些问题,实际上可以覆盖非常多的应用场景。
从领域上来讲,也不仅仅是上面提到的一些基于大数据的一些问题,我们当前经常听到的有关计算机图像识别(CV),自然语言处理(NLP)也都是机器学习技术的一个应用方面。

机器学习技术

机器学习技术发展了很多年,也发展的很快,越来越成熟,我们可以学习,探讨更多有关机器学习方面的知识,在次就暂不展开过多阐述。

H2O的DAI(DriverlessAI)可以做些什么?

回到我们一开始提到的目前机器学习的应用挑战,H2O根据多年的技术沉淀和经验,通过DriverlessAI这么一个技术平台(autoML自动机器学习),帮助企业和人们快速将机器学习技术应用落地。

说人话:
就是机器学习技术能帮我们企业,机构,个人解决很多很多问题,可以被用在很多场景中。机器学习是一个技术活,是一个解决问题的技术,但是机器学习这个活干起来比较困难(对人的技能要求高,时间周期长,技术难以沟通并被信任使用)。

H2O的DriverlessAI把机器学习这个活里面最麻烦,最复杂的那一块工作帮你自动化了(下面工作流中红色框部分)

这样子,在您的团队里面,在没有很强的算法团队和数据科学团队,也可以把机器学习这个技术用起来。如果你的团队有不错的算法或者数据科学团队,那也可以帮助他们提高工作效率,并且让团队的水平都能达到一个平均比较高的水准。

再不准确但通俗点说:就是把机器学习这件技术活,从Photoshop降低到“美图秀秀”的难度,让机器学习易用起来。

这样,我们的业务人员,数据科学人员,算法人员,就可以坐在一起比较畅快的沟通,确保业务工作目标的实现。

这个可以理解为就是比较流行的一个词:人工智能技术的民主化!

DriverlessAI是一个技术平台,不是一个应用
是的,DriverlessAI是一个技术平台,一个给业务人员,算法工程师,数据科学人员使用的一个技术工具,而不是一个应用。
这个问题经常被问到,所以实际上,上面已经回答了大家的问题。DriverlessAI不是一个应用,是一个技术工具,是一个帮助大家容易采用机器学习技术去解决一些业务问题的技术工具。

备注:
经常有人问到,你的平台支持什么样的部署方式?我们支持各种常见的部署方式,云端,私有本地方式都可以,Windows/Linux等场景的环境都是支持的。

可以参考如下Demo视频

请尽量在较大屏幕下观看,体验会更好

点击从优酷观看

点击从腾讯观看

点击从B站观看

点击从优酷观看

点击从腾讯观看

点击从B站观看

H2O的主要产品

***H2O Driverless AI***是一款着重于“自动”机器学习的商业版软件。在这个产品中融合了世界顶级数据科学家的建模经验,能够保证在最短的时间内,以最少的人力资源自动生成最准确的机器学习模型。

同时,Driverless AI是一套端到端的解决方案,包含了从数据的导入,到生成直接可以一键部署到生产环境的程序包等所有环节。

***H2O-3***是H2O的开源的分布式机器学习平台是在分布式计算领域最成熟并且最流行的解决方案,已经被业界广泛的认可和应用。

***H2O Wave***是一个开源的Python开发框架,可以帮助数据科学人员,机器学习工程师以及软件开发人员快速开发出实时交互的AI apps

一起讨论学习机器学习吧!

自动机器学习-H2O.ai相关推荐

  1. 报名 | AI Time:“ 论道自动机器学习与可解释机器学习”

    深度学习在各个领域取得了骄人的成绩,基本是舍我其谁了.之前还存在如何调参.如何选架构的问题,最近随着自动机器学习(AutoML)的快速发展,Neural architecture search(NAS ...

  2. AI开发者大会之AI学习与进阶实践:2020年7月3日《如何转型搞AI?》、《基于AI行业价值的AI学习与进阶路径》、《自动机器学习与前沿AI开源项目》、《使用TensorFlow实现经典模型》

    AI开发者大会之AI学习与进阶实践:2020年7月3日<如何转型搞AI?>+<无行业不智能:基于AI行业价值的AI学习与进阶路径>.<自动机器学习与前沿AI开源项目> ...

  3. NeurIPS 2019|腾讯AI Lab详解入选论文,含模仿学习、强化学习、自动机器学习等主题...

    感谢阅读腾讯 AI Lab 微信号第 89 篇文章.本文将解读腾讯 AI Lab 入选 NeurIPS 2019 的 14 篇论文. 第 33 届神经信息处理系统大会(NeurIPS 2019)将于当 ...

  4. Apache Kafka流+机器学习(Spark,TensorFlow,H2O.ai)

    我于2017年5月开始在Confluent工作,担任技术传播者,专注于围绕开源框架Apache Kafka的主题. 我认为机器学习是当今最热门的流行语之一,因为它可以在任何行业中增加巨大的商业价值. ...

  5. AI之AutoML:Ludwig(无需编写代码/易于使用的界面和可视化自动机器学习工具)的简介、安装、使用方法之详细攻略

    AI之AutoML:Ludwig(无需编写代码/易于使用的界面和可视化自动机器学习工具)的简介.安装.使用方法之详细攻略 目录 Ludwig的简介 Ludwig(无需编写代码/易于使用的界面和可视化自 ...

  6. 前沿技术 | 自动机器学习综述

    来源:小金博士公众号本文约5000字,建议阅读10分钟 本文将探索目前可用于自动化过程的框架,以帮助读者了解在自动化机器学习方面可能出现的情况. 自动机器学习综述 自从计算机时代开始,科学家和工程师们 ...

  7. 自动机器学习工具全景图:精选22种框架,解放炼丹师

    作者 Alexander Allen.Adithya Balaji 王小新 编译自 Georgian Impact Blog 量子位 出品 | 公众号 QbitAI 构建一个典型的机器学习项目,一般分 ...

  8. 【机器学习】盘点常见的自动机器学习(AutoML)工具库

    本文总结了常见的AutoML库,可供大家选择. LightAutoML 项目链接:https://github.com/sberbank-ai-lab/LightAutoML 推荐指数:⭐⭐⭐ Lig ...

  9. 自动机器学习AutoML

    [研究背景]随着深度神经网络的不断发展,各种模型和新颖模块的不断发明利用,人们逐渐意识到开发一种新的神经网络结构越来越费时费力,为什么不让机器自己在不断的学习过程中创造出新的神经网络呢? 正是出于这个 ...

  10. 自动机器学习(AutoML)

    自动机器学习(AutoML) 不再需要苦恼于学习各种机器学习的算法 目录: 一.为什么需要自动机器学习 二.超参数优化 Hyper-parameter Optimization 三.元学习 Meta ...

最新文章

  1. MyBatis 的执行流程,写得太好了!
  2. ubuntu pip 安装
  3. 4.帧循环(游戏主循环),schedule
  4. VC 忽略警告的方法
  5. 基于Spring框架的Controller中进行事务管理
  6. React-Router4按需加载
  7. 设计模式入门-工厂模式
  8. keras保存断点模型与加载断点
  9. 《编程之美》笔记(一)
  10. 两转变两服务器,两大服变鬼两老服制霸,《魔兽世界》怀旧免转结束后的服务器调查...
  11. 红外测距模块工作原理_红外测温仪方案工作原理
  12. recv函数linux,linux 下调用recv函数,死循环在recv函数里面,什么原因?
  13. Clock skew too great
  14. 按照黑马教程学习javaWeb出现Property ‘dataSource‘ is requir报错HTTP Status 500 – Internal Server Error——解决方案
  15. Centos 安装docker后 deamo 无法启动的问题 解决
  16. 计算机错误800,win10系统安装出现0x800700B7错误代码的技巧
  17. ArrayList存储自定义对象并遍历三种方式(迭代器 普通for 增强for)
  18. hive分区对应hadoop_Hadoop之Hive详解
  19. 【干货】Keras学习资源汇总
  20. x265-1.8版本-encoder/motion.cpp注释

热门文章

  1. 性能测试——抗攻击-hyenae-ddos攻击
  2. qq邮箱登录收件服务器是什么,你好请问qq邮箱收件服务器不能为空是什么意思...
  3. 360 网站服务器漏洞扫描,360Webscan
  4. 南通大学报计算机等级考试,南通大学2017年上半年计算机等级考试报名时间
  5. idea创建的maven web工程如何修改web版本
  6. 章鱼网络应用链|为什么 DEIP 会选择章鱼网络?
  7. vue使用History mode之后页面无法刷新
  8. 网页或公众号微信网页抓包软件Fiddler的正确安装使用!
  9. 「Odoo 基础教程系列」第七篇——从 Todo 应用开始(6)
  10. AngularJS知识概括