摘要:本文由衣二三CTO程异丁为大家讲解了如何基于MaxCompute构建智能化运营工具。
衣二三作为亚洲最大的共享时装平台,MaxCompute是如何帮助它解决数据提取速度慢、数据口径差异等问题呢?程异丁通过衣二三数据体系架构,从用户运营应用、商品运营应用以及算法推荐系统三方面给大家剖析了MaxCompute是如何助力衣二三构建智能化运营工具的。

以下是精彩视频内容整理。


衣二三是谁?

衣二三是亚洲最大的共享时装平台。衣二三提供女性服饰包月租赁制服务,会员们在APP上挑选喜爱的衣服,可以在平台上用固定的月费在一整月内不断地换穿衣服,衣二三通过快递将衣服送到客户手中,客户只要会员期有效,就可以一直穿这件衣服,当会员不想穿的时候,衣二三还会通过快递按照约定的时间地点将衣服收回,这样会员就可以继续下新的订单,可以不断地换穿各种衣服。我们的客户从没有毕业的学生到工作多年的白领,多种类型的客户都能从APP上找到合适自己的衣服。

如今,电子商务发展非常成熟,线下逛街也是大家喜欢的生活方式,那为什么在这种情况下还要租衣服呢?衣二三为客户解决了以下几个痛点:
1.打开衣橱总是找不到今天想穿的衣服。使用衣二三,用户可以灵活的换装,不断地尝试不同风格;
2.费用高。衣二三标准的月费只有499元,相当于买一件衣服的价格,用户可以用买一件衣服的价格换穿一整月的不同服装。
3.大城市的房屋空间有限,拥有一个衣橱对于很多用户来说更是奢望。衣二三可以回收衣服,帮助用户节约空间,同时还负责清洗衣服,正如宣传语所说的那样——“你负责貌美如花,我负责清洗收发”;
4.卫生问题。衣二三联合福奈特、天天洗衣等共同打造了智能化现代化的洗衣工厂,每一件衣服需要经过多达16道清洗消毒流程,比自己家里洗衣服还要干净;
5.购买和退换问题。衣二三通过体验式的方式帮助用户从款式、尺码等方面找到真正适合自己的衣服,并且允许用户买下来。

为什么使用 MaxCompute?

衣二三的前后端运营比较复杂,前端需要让客户在尽可能短的时间认识我们,了解我们,才能形成转化;后端也是特别复杂,与一般的电商相比,衣二三有明显的异同,常规电商的客户在前端下好单后,会通过订单管理系统,将订单派发到仓储中心,仓储中心会对订单进行拣货、配货、包装、物流等,最终将商品送到客户手中,也可能伴随着一小部分的退货或返修,对于一般电商来讲,整个流程到这里就基本结束了,但是对于衣二三来说,该流程只进行了一半,我们需要对所有的衣服进行回收、清洗和质检,才能够再次上架让客户挑选,如此复杂的运营自然离不开大数据的支持,MaxCompute作为整个数据体系的核心,帮助了衣二三很多。

那么,在未使用MaxCompute前我们遇到了哪些问题呢?主要包括以下几方面:

  • 数据提取速度慢。随着系统不断地变复杂,SQL越跑越慢。
  • 数据口径差异。每个工程师将逻辑都写在SQL里,不同工程师得到的数据结果可能不一样,这就是因为我们没有集中化标准化的数据仓库对每一个数据维度和业务的指标有相应明确的定义,造成所有的逻辑都在SQL中。
  • Python脚本实现基础ETL。作业调度与依赖难于维护与迭代,运维也是比较令人头疼的,修复时间长。
  • 人工数据提取及报表制作。工程师忙于提供各个业务部门的数据支持。

这些问题促使我们想要做出改变,起初我们想做一套完整的hadoop全家桶进行替代,但评估后发现其运维代价和资源消耗对于我们的数据团队和运维团队来说,都是比较大的负担,而且很难快速体现价值。后来,我们很幸运的遇到了MaxCompute,从试用开始,我们逐渐把数据仓库和数据体系建构在MaxCompute上。

MaxCompute有哪些好处呢?主要从以下几个维度来分析:

1.MaxCompute是基于云端的大数据仓库,无需复杂作业运维工作
2.数据吞吐量大,查询性能好,支持UDF
3.可视化任务编辑界面,易于上手
4.使用成本低,适合初创公司
5.与阿里云大数据产品生态融为一体,比如RDS,应用层的Quick BI,Blink以及日志服务。

如何应用MaxCompute?

衣二三数据体系架构如图所示,最底层是数据源,包括RDS生产数据库和日志服务等,通过日志服务、DataHub等投递到数据计算层;数据计算层以MaxCompute为核心,同时配合我们自己做的脚本和UDF进行数据存储和计算,生成的结果反馈到前端数据应用层;数据应用层是数据分析展示工具,包括YConsole、QuickBI以及DataV等,我们使用DataV做展示业务全局的看板,让我们快速了解全国各地谁在下单、仓储中心的储备情况等。
我们还有包括用户画像、商品画像、爆款识别、衣二三指数和实时人效监控等。

用户运营应用

用户运营对于互联网公司来讲,都是极其重要的,它有两个业务指标,一是转化,一是留存。转化是指尽快让客户了解我们的价值,同时形成付费和转化;留存是指让已经成为我们用户的用户在平台上得到好的体验,让用户喜欢这种生活方式并留下来。
我们结合了MySQL数据和用户日志放到MaxCompute中,经过PAI平台,我们自己做了数据分析,包括使用数据挖掘算法和随机森林等的数据维度分析,对我们整个用户运营做了很多量化指标,我们通过邮件日报对运营指标监控,基于这些指标我们开发了自有用户分群体系推进用户精细化运营;基于阿里云机器学习计算平台PAI,我们建立了预测模型,预测用户的转化率等;引入流失预警计算体系后,运营根据用户的流失指数进行精准挽留营销,将会员流失降低了超过50%。

商品运营应用

衣二三的每一个商品都有结构化的数据,我们专业的买手会给商品打上20+维度的标签。此外,我们会总结用户行为,用户与商品之间的互动都放在MaxCompute中做相关性分析,形成商品的一系列指标,比如爆款识别,通过爆款识别去预测满足哪些属性和维度的衣服会形成爆款,我们的买手会带着数据工具一起进行采购,极大的提高了运营效率。
我们还结合商品各个表现维度,包括库存深度、出租情况等计算出衣二三指数,它可以对商品进行排名。除了给合作伙伴应有的租赁收益外,我们还会提供数据工具,最大化业务模式的价值。

商品的灵魂就是标签,只要将标签做的足够细,才能从结构化上去理解它,去做一些预测性的指标。我们通过商品不同的标签及风格场景热度指数进行备货指导,通过最终商品空置率进行商品调拨及库存关联,通过衣二三指数反映商品热度排行,根据用户行为促进租售转化,完成商品流动闭环。

算法推荐系统

如何让用户在很短的时间内找到适合一个月穿的衣服呢?这就需要推荐算法的支持。

衣二三的推荐算法也是基于MaxCompute,把用户对商品的行为通过日志收集到MaxCompute中,对用户进行用户画像,对用户画像进行模型训练,最终落地到商品列表展示给用户。使用推荐系统给我们的业务带来很大提升,选衣页推荐的点击率增加了70%,人均点击数增加了50%;相关单品推荐的点击率增加了150%,人均点击率增加了110%。

总结下来,大数据的魅力大家已经认识到,MaxCompute这样的产品对于初创公司来讲将大数据门槛降的非常低,让大数据能够面向各种各样的公司来贡献力量和发挥价值。谢谢在场各位的倾听,以上就是我的分享。

欢迎加入“MaxCompute开发者社区2群”,点击链接申请加入或扫描二维码
https://h5.dingtalk.com/invite-page/index.html?bizSource=____source____&corpId=dingb682fb31ec15e09f35c2f4657eb6378f&inviterUid=E3F28CD2308408A8&encodeDeptId=0054DC2B53AFE745

原文链接
本文为云栖社区原创内容,未经允许不得转载。

基于MaxCompute 衣二三帮助客户找到合适自己的衣服相关推荐

  1. MaxCompute 助力衣二三构建智能化运营工具

    摘要:本文由衣二三CTO程异丁为大家讲解了如何基于MaxCompute构建智能化运营工具. 衣二三作为亚洲最大的共享时装平台,MaxCompute是如何帮助它解决数据提取速度慢.数据口径差异等问题呢? ...

  2. 基于MaxCompute构建Noxmobi全球化精准营销系统

    摘要:大数据计算服务(MaxCompute,原名ODPS)是一种快速.完全托管的TB/PB级数据仓库解决方案.MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速 ...

  3. 基于MaxCompute打造轻盈的人人车移动端数据平台

    摘要: 2019年1月18日,由阿里巴巴MaxCompute开发者社区和阿里云栖社区联合主办的"阿里云栖开发者沙龙大数据技术专场"走近北京联合大学,本次技术沙龙上,人人车大数据平台 ...

  4. 基于MaxCompute分布式Python能力的大规模数据科学分析

    简介: 如何利用云上分布式 Python 加速数据科学. 如果你熟悉 numpy.pandas 或者 sklearn 这样的数据科学技术栈,同时又受限于平台的计算性能无法处理,本文介绍的 MaxCom ...

  5. 基于MaxCompute+开放搜索的电商、零售行业搜索开发实践

    简介:搜索一直是电商行业流量来源的核心入口之一,如何搭建电商行业搜索并提升搜索效果,一直是电商行业开发者努力攻克的难题.基于传统数据库或开源引擎虽然能够搭建基础搜索服务,但随着商品数据的增多和业务流量 ...

  6. 没有找到合适的方法来重写_玻璃片价格太高?你可能没有找到合适的供应商

    玻璃片价格太高?你可能没有找到合适的供应商 通常而言,付出和收获是成正比的.正如一般情况下无法用买起亚的钱购买到奔驰系列的车型,无法用在麦当劳消费一餐的钱享受到米其林五星级的待遇,无法用购买小米手机的 ...

  7. 共享寒冬中的常青树,2 次获得阿里投资的衣二三“欲隐藏”的数据真相 | 深度案例...

    "弱化所有权,释放使用权",共享经济的出现,改变了原有社会资源分配结构,使每一份资源价值都扩大化.作为曾经风口中的风口,现在的共享经济已经千疮百孔.而「衣二三」却是在一地鸡毛.满目 ...

  8. 基于MaxCompute SQL 的半结构化数据处理实践

    简介: MaxCompute作为企业级数据仓库服务,集中存储和管理企业数据资产.面向数据应用处理和分析数据,将数据转换为业务洞察.通过与阿里云内.外部服务灵活组合,可构建丰富的数据应用.全托管的数据与 ...

  9. 基于MaxCompute+PAI的用户增长方案实践

    简介: 如何通过PAI+MaxCompute完成用户增长模型AARRR全链路,包含拉新.促活.留存.创收.分享. 本文作者 李博 阿里云智能 高级产品专家 在过去一年阿里云PAI机器学习团队做了很多偏 ...

最新文章

  1. 记一次discuz修改首页图片路径问题
  2. 《Spring 3.0就这么简单》——1.6 展现层
  3. JS判断是否选中的是表格内当前选中的那一行
  4. 从零开始学习docker(十四)Docker Compose--部署SpringCloud
  5. c语言程序设计函数6,C语言程序设计》第6章函数-XiamenUniversity.PDF
  6. 面对压力,我们可以做什么?
  7. Windows下用vs2017编译和配置libcurl库(手把手教,适合新人)
  8. knx智能照明控制系统电路图_智能照明控制系统KNX
  9. kali启动ssh服务后,依然无法连接的问题。
  10. 演化模型(evolutionary model) 需求不明确+两次开发(实验开发+产品开发)
  11. 听说这个深度学习工具包,可以拯救Java开发者?
  12. 产品经理入门——必备技能之【产品运营】
  13. 罗永浩改造苹果iPad,装了个门把手
  14. 聊聊 Apache、Tomcat 静态网页、动态网页
  15. 【简单应用】STC8+OLED(4P)显示
  16. python新技术_2020年令人期待的Python新功能
  17. 运用简单的超市购物车系统,理解重写equals、hashcode的意义
  18. SuperPoint特征检测算法TrainEvaluate教程
  19. Ubuntu 修改默认 Python版本
  20. 兼收并蓄,不要试图去研究它.---JAVA之我注六经之三

热门文章

  1. 安装应用需要打开未知来源权限_打开安卓这个开关 不让流氓软件肆意妄为
  2. python的加减乘除运算_python实现四则运算
  3. 大顶堆删除最大值_C++|使用STL算法创建、调整、输出最大堆、最小堆
  4. kb4023057安装失败_微软重发Win10 KB4023057 补丁,推动Win10更新
  5. linux下rman自动备份,linux 下rman 自动备份
  6. 计算机网络学习笔记(六)——网络层、虚电路和数据报交换、路由(距离矢量、链路状态算法)、IP编址、网络拥塞控制、网络互联
  7. c语言时间错误的是什么意思,C语言中,如何验证输入日期的正确性!~
  8. 突发,这个国家进入紧急状态!数十年来最严重经济危机、每天停电13小时!外交部发出提醒...
  9. 零的突破!炸出圈的“女娲补天”教授获国家杰青!
  10. 您已关注公众号满1年,诚邀您免费加入金融学习交流群!