以下内容精选自 2017 全球机器学习技术大会系列直播:《深度学习在阿里菜鸟网络物流领域的应用》

胡浩源 / 阿里巴巴菜鸟网络高级算法专家

阿里巴巴菜鸟网络高级算法专家,研究深度强化学习在仓配供应链中的应用,融合⼤规模并行分布式计算、遗传算法、超启发式框架,以及传统运筹优化算法,解决诸如车辆路径规划、切箱等问题; 曾任职阿里天猫推荐算法团队,完成的“会场个性化”和“我的双十一”作为最早的双十一个性化产品,在 2015 年完成 20 亿成交额,团队获得 CEO 特别贡献奖。

胡浩源老师也是 2017 全球机器学习技术大会 讲师之一,将在 6 月 29-30 日,与来自 Google, Facebook, Microsoft, Tesla, Uber, Netflix, Snapchat, 腾讯, 阿里.....… 40 多位国内外一线机器学习领域技术专家做出精彩的分享!

详情见: http://ml-summit.org/

[文末福利] ↓

直播采访回顾

1.深度学习的应用非常广泛,我们 2017 全球机器学习技术大会 听众中有很多从事不同行业的朋友,可否给大家介绍一下深度学习是如何应用于菜鸟网络的物流业务中的?特别是具体的场景,以及解决的问题?

菜鸟网络目前做的很多都是跟物流相关的事情,包括仓配、供应链、网络规划等,这一点可能和很多技术广告或者搜索推荐的比较大的一个区别是:菜鸟目前大范围面临的是一个运筹优化问题。运筹优化问题,传统上来讲的一个解决方案是混合指数规划或者一些启发式的一些方案。

在菜鸟网络的一些具体场景中,我们进行了一些尝试,其中非常经典的就是切箱问题,它指的是给定一系列大小的候选箱子,当包含很多商品的一个订单来的时候,如何选择放的次序朝向位置,使用的箱子数量最少,表面积最小,从而降低成本。

这一块从传统上来讲,如果是运筹优化领域出身,就会明白有很多启发式的策略可以解决这个问题。我们现在尝试的就是用深度学习的结构来表达其状态本身,后面再带上强化学习的方式把这个启发式的策略学出来,甚至还能学得更好。

另外在菜鸟物流中,比较大的一个领域是车辆路径规划。快递员也好,干线或者支线的运力资源也好,都需要去服务一定的客户群体,那么在这种情况下,怎么合理地安排车辆的路线以及有哪一部分车去服务特定的用户群能够达到车的数量的减少或者距离的减少,这两方面的结果可以为整个中国的物流体系降低成本。

那这就是一个非常经典的带时间窗的一个车辆路径规划问题。然后传统上来讲都是用一些混合整数规划的一些方式,或者是一些元启发式、超启发式,或者并行的方式去解决这个问题,这也是我们现在在研究的内容。

怎么给原始的 VRP 问题做 Embedding ; 其次怎么选择比较合适的一个网络结构把它表达出来; 计算梯度的环节,我们怎么去选择合理的强化学习策略,让整个优化方向朝我们希望的方向走。

在优化问题里面比较特殊的一点就是监督学习的一套可能不太适用,是因为大部分都是 NP-Hard 问题, 作为 target 的 Optimal 的解很难取得。

然后菜鸟还在一些供应链上的,例如像销量预测。比如说像一些具体配送站点的一些单量预测上用上了一些深度学习的预测的一些技术。这些技术,目前的尝试都在逐步接近,甚至超过了传统的一些启发式的结果,帮助我们取得了非常好的一些业务效果。

2.在您平时的工作中,主要使用哪些深度学习框架(诸如 TensorFlow、Caffe、Torch、MXNet...)?是否能简单评价一下它们?

由于我们要考虑到公司整个的一个选型,所以主要用的是 TensorFlow 和 Caffe。选择 TensorFlow 的好处就是它的开发背景比较好,然后另外它的各方面的兼容性和那个开发效率比较高。公司用 Caffe 的人也是比较多的,但是开发插件需要 C++,所以可能难度会高一点。

深度学习的框架在选型上我没有太多的纠结,因为目前看起来都满足我们的需求,只是因为我们需要很多情况下去更改它的底层的源代码,这种情况下,我们目前是选择 TensorFlow 作为我们深度学习的框架。

3.成长成为一名优秀的机器学习工程师,需要那些训练,胡老师有哪些成长经验可以分享?

我认为分几个方面,第一,出身背景还是比较重要的。因为我知道现在很多算法从业人员,可能他主要的资源或者经历是花费在如何调用一些算法包去解决业务问题上,所以就出现很多特征工程师或者调参工程师。其实很多情况下,对计算广告或者搜索推荐而言,从业务领域知识出发的特征的思考,甚至有些情况下会比模型更重要一点。另外很多调参黑科技或者 trick 才是一个公司比较重要的组成部分。但是如果想继续提升的话,特别是非科班出身的同学,我建议关于机器学习最基础的原理、来源、它要解决的一些问题,还是需要去了解一下。

我个人是在做了几年机器学习之后,开始做结合运筹优化和机器学习的领域。后来发现,很多自己之前觉得比较理解的事情,再与运筹优化的一些问题合在一起之后,会有一个更深刻的理解。特别是现在的深度强化学习,以前的机器学习是去学一个函数或者一个函数集。但有了深度学习之后,它学习的是表达本身,比如说有些 embeding 的方式,可能特征也学出来了。虽然效果比不上长时间调的经验特征,但是跟平均水平比也差不多。在这种情况下,去深入的了解一些深度学习和强化学习的原理,会起到很好的效果。大家都知道,深度学习的强化学习里面有很多 trick。包括网络结构,为什么是这个样子,什么样的网络结构适合解决什么样的问题。

所以我的建议是,如果是科班出身的同学,理论基础比较好的,有条件在公司拿能够实际应用的项目练练手,因为这样你也会很有成就感,看到自己做的事情真的产生了价值,产生了利润或者为公司节约了成本。一些非科班出身的同学,但实战经验非常丰富的,那是不是考虑抽一定的时间去把一些比较基础的知识短板补上。

我觉得最有效的就是跟一些你觉得非常强的人在一起,去向他们学习和交流,这个成长速度比自己单纯看书或者看视频要高得多,就像你找一些水平非常高,能跟你一起去组队打比赛,对自己提高是非常有好处的。现在阿里集团提供了一个平台,大概所有人都会有一些大数据方面的竞赛,也欢迎大家参与。特别是有些情况下,公司内部或者外部进行效果 PK 的时候,大家可能都比较聪明,特征也都想的差不多,这个时候来自于原来理论基础上的一些差异就会慢慢涌现出来。

4.您同时也是本次 2017 全球机器学习技术大会 演讲嘉宾之一,可否给大家提前透露一下您本次大会的演讲内容?

这一次演讲主要是围绕着菜鸟网络的业务展开,包括我们现在正在做的,深度强化学习怎么用在几个比较传统的运筹优化领域。

目前我们正在尝试利用一个 RNN 的网络结构去表达问题本身,背后用一些强化学习的方式去求解梯度,看能不能把我们之前的一些启发式的策略给学习出来。这里面还包含了关于如何去选择网络结构?如何把一个问题进行一定程度上的转化,能够把它一边订到一个可解的网络结构,以及在很多运筹优化领域如何去取舍监督学习和强化学习上的一些思考。

还有我们目前作为菜鸟物流正在做的一些仓内机器人,他作为典型的多智能体调度,是传统人工智能的来源,也是一个非常有意思的一个研究领域。除了和运筹优化问题相关的结合之外,还包括就是深度学习作为一种监督学习本身,在我们一些销量或者单量上的一些预测,跟传统的监督学习相比的优劣和它可能适用的场景的一些分析。最后也会概览性地介绍一下菜鸟网络目前正在从事的事情以及人工智能部未来的一些规划。

互动交流问答 (精选部分问题)

@rene:修路或者其他导致路线中断,或者交通拥堵情况产生的话,路线优化能做到可以实时学习优化么?有哪些核心技术问题?如何解决?

这属于 dynamic VRP 问题, 我们是利用流式计算的方式实时求解的,目前遇到比较大的问题是性能和效果的平衡的问题, 我们在探索利用分布式并行化求解的过程。

@C.Y. : 有没有什么场景不适合深度学习,或者什么场景更适合深度学习,目前看更多的是在非结构化的分析识别上应用。

这个问题非常好, 目前除了传统的结构化数据例如图像和语音的领域,其余领域都在探索阶段。

Q: 强化学习目标是指网络吗?规划问题怎么表示?

现在在规划问题里面有两个问题是可以表达的,就像切箱问题和 TSP 问题,因为它可以去表达成一个序列。它在 Reinforcement Learning 也很好表达,对于 TSP 而言就是线路的一个长度;对于切箱问题而言,就是箱子的表面积。切箱问题和 TSP 问题,输入以商品大小和点的坐标表达,reward 用长度和面积表达。

2017 全球机器学习技术大会 将在 6 月 29-30 日于北京金茂万丽酒店盛大举办,特别邀请国内外 AI 领域一线技术专家激情脑暴——

计算机视觉先驱,OpenCV 创始人 / Gary Bradski

Google 数据科学主管 / Ying Lu

Facebook 应用机器学习部门主管 / Huang Fei

美国微软人工智能研究部高级总监 / 张若非

Etsy 数据科学主管 / 洪亮劼

Uber 机器学习平台技术主管 / Li Erran

Tesla 机器学习高级工程师 / Zhenhua Yu

Snapchat AI 团队负责人 / Yunchao Gong

Databricks 机器学习主管 / Xiangrui Meng

腾讯云机器学习平台负责人 / 黄明

阿里云 iDST 深度学习负责人 / 杨军

…………

[撒福利啦] 5 月 22 日晚 8 点,由 Etsy 数据科学主管,前雅虎研究院高级研发经理 @洪亮劼 老师和大家聊一聊 《机器学习在电商领域的应用》。

报名地址: http://ml-summit.org/

深度学习在阿里菜鸟网络物流领域的应用 | 2017 全球机器学习技术大会相关推荐

  1. 深度学习在阿里B2B电商推荐系统中的实践

    作者:卡本,来自:DataFunTalk 导读:推荐导购场景在电商中是重要的满足用户"逛"和"买"的场景,本次分享我们聚焦深度学习在阿里B2B电商 ( 1688 ...

  2. 【推荐实践】深度学习在阿里B2B电商推荐系统中的实践

    分享嘉宾:卡本 阿里 高级算法专家 文章整理:刘金鑫 内容来源:DataFunTalk 导读:推荐导购场景在电商中是重要的满足用户"逛"和"买"的场景,本次分享 ...

  3. 深度学习在植物种类及病害识别领域的研究

    ** 深度学习在植物种类及病害识别领域的研究 ** 植物的基本特征包括叶片的形状特征和纹理特征,而对特征的描述范围又分 为全局与局部. 该方法的效果在很大程度上取决于人们的选择是否合理,但他们在选择特 ...

  4. 【深度学习】生成对抗网络(GAN)的tensorflow实现

    [深度学习]生成对抗网络(GAN)的tensorflow实现 一.GAN原理 二.GAN的应用 三.GAN的tensorflow实现 参考资料 GAN( Generative Adversarial ...

  5. [转] 介绍深度学习和长期记忆网络

    机器学习,深度学习 101 IBM Power Systems 入门 Beth Hoffman 和 Rupashree Bhattacharya 2017 年 7 月 04 日发布 WeiboGoog ...

  6. #今日论文推荐# 爱丁堡大学等首篇《移动无线网络中的深度学习》综述论文,67页pdf涵盖570篇文献阐述深度学习在移动无线网络中的应用最佳实践

    #今日论文推荐# 爱丁堡大学等首篇<移动无线网络中的深度学习>综述论文,67页pdf涵盖570篇文献阐述深度学习在移动无线网络中的应用最佳实践 移动设备的迅速普及以及移动应用和服务的日益普 ...

  7. 为什么说卷积神经网络,是深度学习算法应用最成功的领域之一?

    目前,作为深度学习的代表算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉.分类等领域上,都取得了当前最好的效果. 后来,基于深度神经网络和搜索树 ...

  8. 提升深度学习模型性能及网络调参

    提升深度学习模型性能及网络调参 https://www.toutiao.com/a6637086018950398472/ 图像处理与机器视觉 2018-12-25 10:42:00 深度学习有很多的 ...

  9. 【深度学习】图像输入网络必要的处理流程

    [深度学习]图像输入网络必要的处理流程 文章目录 1 图像处理之灰度转化 2 归一化 3 CLAHE 4 伽马矫正 5 Data augmentation5.1 裁剪(Crop)5.2 缩放ÿ

最新文章

  1. 如果你的云服务商倒闭该怎么办?
  2. redis 集群目标、集群查看、配置方法及过程、哨兵配置启动
  3. javaweb学习总结(十四)——JSP原理
  4. 【初窥javascript奥秘之闭包】叶大侠病都好了,求不踩了:)
  5. 顺序表基本操作在主函数中的实现
  6. Spring 3.1缓存抽象教程
  7. 误操作删除数据文件恢复案例讨论
  8. PowerPC处理器数字仿真测试软件工具——天目全数字实时仿真软件SkyEye
  9. 大数据_MapperReduce_Hbase配置参数说明_以及部分源码说明---Hbase工作笔记0031
  10. 【修真院WEB小课堂】定时器有哪些用法?
  11. 开课吧:为什么AI工程师都要懂一点架构呢?
  12. Mastik:微体系结构侧信道攻击工具包
  13. 中文版-动手学深度学习
  14. Linux安装vim不成功(没有可用的软件包)解决方法
  15. def是c语言特殊标识符吗,typedef和def究竟有什么区别?
  16. 软考 | 2015年上半年 软件设计师 下午试卷
  17. ps4欧洲服务器注册,ps4pro注册港服教程
  18. scratch案例——神奇闹钟
  19. CAD看图如何在电脑上快速找到并打开指定CAD图纸
  20. OkHttp3-使用详解-OkHttpClient

热门文章

  1. 如何用计算机计算sd,科学计算器的使用指导
  2. Berkeley DB(四) -- DB Environment
  3. Vulkan_Shader—高级光照_阴影_实现
  4. 媲美兔子大师!斑点猫2009完全评测
  5. iOS调用becomeFirstResponder失效,键盘换不起来问题
  6. 父与子的编程python_父与子的编程之旅:与小卡特一起学Python
  7. 开源助力云计算十年:从基础设施,到云原生崛起!
  8. My Idea About ID wly_sh (关于用户名 wly_sh 的猜想)
  9. 开发wap wap简介 WAP 网络应用 网络协议 XML
  10. matlab生成exe执行doc太快,matlab编写的程序生成exe可执行文件的方法.doc