与数百位科技创业者一同关注科创人成长心路

文| babayage

编辑 | 笑 笑

1

在数据混不进IT鄙视链的年代

他决定一生ALL IN

科创人(以下简科):您认为自己人生中第一个重要的节点是?

郭炜(以下简称郭):是我大三的时候。我从小学计算机,很早就接触了代码和编程,到了大学就开始思考,学来的技能将来到底能做什么?语言、代码,从basic、pascal、c语言、java……一直都在变化,将来一定还会有新的语言出现。我思考的是,IT技术领域究竟什么是不变的?当时尝试了挺多方向,大学里有各种实验室,网络实验室、数据库实验室、研究芯片的体系结构实验室等等吧,我发现真正不变的只有数据。于是大三那年下决心加入了数据库实验室,本科毕业论文写的就是数据挖掘。

科:您对数据最初的理解是?

郭:那时候触达的层面还是数据库、数据源组、数据关系,事实上任何客观存在都可以被抽象成数据,语言、技术不停在变,但数据相对不变,这让我觉得是一个可以长远做下去的事。尽管当年还没有哲学高度的理解,可我已经对数据入了迷,研究生也没犹豫地选择了数据相关的专业。

科:2002年就有数据专业研究生?

郭:真没有(笑),那时候还叫信息与信号处理,其实是数据挖掘、模式识别。最早数据挖掘是叫Data Miner,中文叫数据矿工,出门跟人聊天人家总问你是挖什么东西的?解释还挺麻烦,只能说不是挖煤的。

科:当年数据专业算是IT圈鄙视链靠末端的?

郭:压根都进不到鄙视链里面(笑),即便是IT圈内大家也不知道我们是干什么的,“做数据的?Oracle?”都是这种反应。闷头做事呗,大学参与了当年中国最大的数据仓库项目,中国移动规划建设的,我参与了中移动经营分析系统的系统规范编写,包括1.0、1.2、1.5。这是国内最早做BI、数据挖掘的项目,我的毕业论文《过程神经网络的客户流失分析》就是用山东省移动的实际数据验证跑出来的,效果比SAS的客户流失分析要更好一些,拿了优秀论文。

回想下,那时候做数据工作受到数据采集的制约很大,现在有智能的IoT设备、有人脸识别这类计算机视觉,当年只能基于传统的数据仓库做一些事情,比如消费者划卡买了哪些东西。可这就足够有趣了,以至于我早早就产生了一个信念,在很多场合也提过,“数据是有灵魂的,我将用一生去追寻它”。

2

因啤酒尿布加入Teradata

在行业波谷选择坚持信念

科:您毕业后选择工作的标准是什么?

郭:数据挖掘这个词的创造者是韩家炜老师,在他的课上接触到了啤酒尿布(注1)的案例,觉得太有趣了,于是毕业后就进到缔造了啤酒尿布案例的大数据公司Teradata,做数据架构师,作为项目经理参加内蒙古移动数据仓库建设。在内蒙古工作的那段时间让人印象深刻,冬天零下三四十度,沙尘暴的时候沙子能把脸刮出血来,出门就得从头到脚全副武装。

注1:啤酒尿布的故事

版本诸多,传播最广的是沃尔玛版,相对真实可信的版本是:1992年,Teradata(当时还是NCR)团队找上美国连锁零售店Osco Drug,取得了25家分店90天共1200万笔的POS数据,分析发现20多种商品有特殊关联性,其中一项是每天下午5点至7点,许多顾客的购物篮内都买了啤酒与尿布(其他还包括“咳嗽糖浆跟果汁”等)。

科:听上去比一般IT从业者辛苦很多,有没有想过放弃?

郭:其实当年很多做数据工作的同学、同事都转行了,不过不是因为艰苦。2000年~2005年是数据行业的一个热度高峰,BI、数据挖掘等等都是热门,但一些企业投入大量资金后发现BI的闭环比较长,并不完美,于是整个数据行业慢慢由热转冷,从业者的收入和上升空间都受到了影响,我还真是靠着信念才坚持下来的。从Teradata去到IBM,这些都是BI、数据挖掘的专业厂商,但当时明显能感觉到因为投入减少,迭代速度放慢,大量工作是重复、低效、缺乏创新的。这样的工作很难做出突破,思前想后,选择去企业端看一看,就去了中金。

科:您是从什么时候开始参与到管理工作的?

郭:Teradata期间第一次尝试PM工作,毕竟个人的技术能力有天花板,有些事搞不定。最初以为做管理是做设计,结果发现最重要的管理技能是沟通,当时吃了一个大亏,项目本身没有什么难度,但做出来之后发现,原来提需求的人未必是真正的最终用户,按照需求做的项目被真正的使用者痛批一顿。那时候意识到,做项目管理一定要穿透现象,看到需求的本质。还有,我强烈推荐大家学习PMP。

3

巧妇难为无数之炊

推进亿元级项目累并快乐着

科:您为何选择去中金?

郭:因为许多新的科技、尤其是数据技术,会率先在投行实现应用,它离钱最近,数据跟钱有一种天生的缘分。

科:从数据专业公司到企业,适应起来有没有遇到麻烦事?

郭:Teradata、IBM这类专业性强的企业工作的时候,项目和工作范围都被定义好了,你只需要做。但是在企业不一样,我到了中金一看,情况是两个极端:交易这部分,一位剑桥的天才少年博士带着做模型分析,特别强悍;但内部管理,什么都没有,所以我在中金的第一个工作是ERP,先得把数据拿到手。直到现在我对应收、应付、人力这些都还挺熟的(笑)。当年很多投行都没有完成电子化,说实话人家确实也没有那么需要,单子+excel基本就能搞定——一开始还觉得这有点落后,可现在我觉得无招胜有招,excel还是非常强大的工具。

Tips-郭炜谈excel

所见即所得,普通财务人员都能用得非常好,不仅是数据平民化的好工具,还支持数据挖掘算法,可以连数据库、图标展示、利用插件实现复杂功能……功能十分强大,就看怎么用。

工具不必追新,关键在思维,能在数据思维引导下解决问题的工具就是好工具。

科:除了推动电子化,您在中金做了哪些跟数据相关的工作?

郭:先是做数据规整,把彭博、路透的数据接进来,然后做历史分析、计算风险敞口。2010年开始做了一个很先进的东西,网络金融,整套系统全部做出来了,网上开户、网络交易……没想到合规审查没有通过。拖了很久,耗时一年多的工作成果闲置在那,团队也不知道做什么,正好万达提供了一个非常好的机会,万达那边业态多、数据也多,我觉得一定会很好玩。

科:万达的商业数据能用来做什么?

郭:WiFi定位,就是通过智能POS刷卡信息、停车信息、智能WiFi记录移动轨迹等数据,之后将数据全部打通,分析消费者在万达广场内的行为,以便优化服务。

万达是真有钱,整个项目下来1.03个亿,光厂商招了20多个,都是世界顶级的供应商:思科、Aruba、Moto……圈在大连万达广场某个办公室封闭开发。万达WiFi定位项目在全球范围内都是领先的,这些供应商有技术但没有现成的产品,他们的工程师也很兴奋,闷头做了3个多月,做出了一个三点定位系统。

这个项目对我来说收获巨大,不仅自己在圈内开始有了点名气,还让我意识到数据已经从线上的点迹流进化到了线下的行为分析流,视野开阔多了。

科:在1亿元规模的项目里扮演重要角色是怎样一种体验?

郭:万达的管理非常严格,到时间交结果,经常下飞机奔现场搞测试忙到第二天天亮。严格管理的优势显而易见,我们最初在4个万达广场搞测试,成功之后只用了半年时间,全国所有万达广场全部上线,这个效率很可怕,当然预算充足也很重要

也碰到过问题,还是沟通,让我更加深刻地意识到沟通是管理工作的重中之重。尽管万达是自上而下推进项目,但我还是需要与各个部门、各个广场负责人说明这个事是什么、为什么做,不然对方的配合程度就会有差,他们总问为什么要把数据给你?

4

最大困局因心太软

管理=两翔相权取其轻

科:您和易观结缘,数据专家加入老牌数据公司,有没有如鱼得水的感觉?

郭:易观创始人于扬于总希望我来做产品和技术赋能,易观作为一家老牌的数据公司,能够十几年坚持着做数据这件事,让我心生敬意,决定来试试。

到了这才发现,为什么说创业是九死一生。创业曲线一开始都很高昂,人人觉得大有可为,推进过程中逐渐发现现实残酷,这不算完,再走一段必然有一个更深的坑等着。我刚来易观的时候这边已经有20多人的团队了,心说不错啊,小伙子们都挺可爱的。最早做的项目是易观千帆,分析移动APP数据的,主要技术功能是采集数据,那就做吧,结果BUG这个多啊,经常数据库半夜挂了,还有一些说都说不清的问题。那段时间又开始熬夜通宵,我辛苦团队也很辛苦,老板也吐槽,说你来了几个月了,这情况,是吧……

结果,到底是出了一个重大事故,接收端出现数据拥堵导致雪崩,团队改了三天愣是没搞定。我记得特别清楚,2016年生日那天老板找我,没骂人,说完“生日快乐”接着就是“感谢你这段时间的工作”(笑)。难受啊,这生日过的,但斗志也激出来了,我没有一次换工作是因为搞不定技术问题,走也必须解决了问题再走。经过仔细思考、反复推敲,我想出来现在易观大数据“云+端”的控制计算逻辑,现学了当时用的技术语言Lua,用一天敲了一段代码实现了雏形、上线,世界安静了,问题解决了。

科:一边觉得很牛一边又觉得CTO敲代码画风凄凉……

郭:CTO么,技术方面到最后搞不定的事情你就要上,不管是写代码还是搞定技术用户,因为你身后再也没有人了,你就是公司技术最后一道保险。经过了这个事,技术圈里的一个好朋友跟我说,别心软,整个团队优化了吧,你填坑的速度肯定没有他们挖坑的速度快,我一想也是,不下决心不行了。后来我在做分享的时候说过“做CTO要有匪气,要心狠一点”,其实就是这件事吸取的教训。

挺多朋友问我CTO工作重点到底是什么,我说最重要的工作是找人,像泡妞一样泡人才,好的人才HR可能招不来,必须boss直聘(并非植入广告)。CTO要负责建立文化体系,100人以上的团队你根本不可能知道每个员工在干嘛,需要用文化和价值观去引领、匡正。

科:似乎那一次难题让您完成了一次精神上的蜕变?

郭:之后其实也有挑战,但都是可预期的,有坑就早填、有雷就早排,新产品线的挑战、是否开源的纠结……压力和困难永远都会有,但自己对事情的控制力还是增强了不少。

还是要说,做CTO需要抗压能力,公司里懂技术的人不多,很多问题都能朝技术团队甩锅,而你作为技术团队的领导者无路可退,身后就是袍泽弟兄,必须要撑得住、处理得好。大部分时候技术管理者面临的问题,不是两利相权取其重,而是两坨翔,一坨大一坨更大,你吃不吃,不吃立刻翻一倍,迟早必须吃,吃完还要笑眯眯的给团队传递正能量,让大家安心冲。

现在团队100多人了,和团队一起将自己开源的项目Dolphin Scheduler成功进入了Apache基金会,易观成为了BATJ之外唯一一个中国非大厂开源项目入选Apache基金的公司。

感谢耐心阅读,

如果喜欢郭炜的故事,

欢迎分享给身边好友。

科创人高端组织闭门聚会 | 扫码报名

【编辑推荐】科创人的成长故事

>>  快狗打车CTO沈剑:努力不会背叛,承担社会责任的企业胜算高一点点

>> DCloud崔红保:uni-app和HBuilder背后的男人,让天下没有难做的开发

>> 17汽车网黄玲艳:乐天派程序媛,梦想是打造社会型企业

>> 贝壳金服史海峰:经济适用型成长 不苛求上限 不放弃底线

>> TDengine陶建辉 自带聚光灯&BGM的半百少年

喜欢今天的内容,请您顺手点个“在看”

点击【阅读原文】,加入高端技术管理者聚会

【科创人】易观CTO郭炜:数据是事业更是信仰 裁员是管理者的成人礼相关推荐

  1. 易观CTO郭炜:如何构建企业级大数据Ad-hoc查询引擎

    凭借多年大数据平台建设经验,易观 CTO郭炜为大家分享了易观在大数据实时查询引擎建设过程所获经验与挑战,以及大数据人员如何快速建立自己的大数据查询引擎套件,让自己的数据人员不再是"表哥表妹& ...

  2. 易观 CTO 郭炜:易观大数据架构的变迁

    今天跟大家分享易观大数据架构的变迁,包含三部分,第一先给大家讲易观的变化,也是易观产品技术的结果:第二是从技术角度来讲一下易观大数据技术架构的变迁:第三分享一点创新方向的心得. 在过去,大家谈起易观, ...

  3. 科创人·知乎CTO李大海:技术服务内容、商业化依赖内容,曾被「呵呵」难到挠头

    李大海 知乎合伙人兼CTO 2006年,毕业于北京大学数学科学学院数学系,先后供职于谷歌.云云网和豌豆荚.加盟知乎后,李大海先后负责过广告技术团队.数据.算法和整体社区业务,目前统筹负责知乎大数据团队 ...

  4. 科创人·和讯网CTO杨扬:技术独狼到业务驱动者的修行之道

    杨扬 和讯网CTO 深谙证券.基金.期货.外汇等金融业务,数字化转型实战专家,擅长从产品.运营.销售角度出发考虑和解决技术问题. - 文 | babayage 编辑 | 笑 笑 记不清被杨扬婉拒了几次 ...

  5. 科创人·微软中国CTO韦青:数智时代创业得跳下巨人肩膀

    韦青 微软(中国)CTO 投身亚洲移动通信.信息技术和智能设备等领域三十余年,2003年加入微软,如今主要负责将微软的产业愿景.创新技术与数字化转型的切身体会介绍给中国的行业伙伴与业界领导者,著有&l ...

  6. 科创人·观远数据CEO苏春园:让业务用起来,是BI行业推倒渗透率之墙的关键

    苏春园 观远数据创始人兼CEO 毕业于卡耐基梅隆大学信息系统管理专业,拥有近20年数据分析以及商业智能管理服务经验,擅长企业数据分析战略规划,曾任全球顶尖BI公司微策略软件全球高管&中国研发总 ...

  7. 【科创人独家】SmartX张凯:技术专家型CTO的修行之路

    很多技术人都有一个"一生精研技术"的专家梦,然而大部分人在成长到一定阶段后,都会选择提升管理能力.补全商业思维,转型为综合型技术人才,原因:事业需要. <科创人>创刊至 ...

  8. 【科创人】快狗打车CTO沈剑:努力不会背叛,承担社会责任的企业胜算高一点点

    沈剑,快狗打车CTO,到家集团技术中心负责人. 都说选择大于努力,事实上,努力到了一定程度的人,才有选择人生的资格. 1 落榜中南财经政法 努力不到位谈何选择 科创人(以下简称科):改变了您人生方向的 ...

  9. 【科创人】快狗打车CTO沈剑:努力不会背叛,承担社会责任的企业胜算高一点点...

    与上百位科技创业者共同关注科创人成长心路. 沈剑,快狗打车CTO,到家集团技术中心负责人. 都说选择大于努力,事实上,努力到了一定程度的人,才有选择人生的资格. - 文| babayage 编辑 | ...

最新文章

  1. HDU1053 Entropy 哈夫曼树
  2. jQuery之替换节点
  3. Android SlideAndDragListView,一个可排序可滑动item的ListView
  4. 【命令】usemod 的用法
  5. clion 工程打开选项 安全模式预览 Preview in Safe Mode 信任工程 Trust Project 简介
  6. poj 1006(中国剩余定理+模板题)
  7. 为什么基于数字的技术公司进行机器人研究
  8. 总结一下优化算法关系【压缩传感】【图像逆问题】
  9. ganglia metric extended by gmetric command line tool
  10. Max 缩放代码 获取2点直接的距离
  11. 安卓自定义控件的原理
  12. 计算机组装与维护文化建设,计算机组装与维护能力标准实训教程
  13. php 判断微信浏览器支付宝,PHP判断是手机端-PC端-微信浏览器
  14. xml转matlab目标检测,将Cityscape转换为PASACAL VOC格式的目标检测数据集
  15. AS下如何生成自定义的.jks签名文件, 以及如何生成数字签名
  16. 抖音获客源码,短视频获客系统,获客SaaS有标准答案吗?
  17. Python程序设计 大作业 简化的PS
  18. 使用QT实现Mjpeg-streamer的客户端,采用单独的线程进行视频图片的获取
  19. 台式计算机内存是什么意思,内存频率是什么意思 电脑内存的工作频率是什么...
  20. jop怎么读音英语怎么说_英语单词job怎么读,job的音标是什么,job是什么意思 - 音标网...

热门文章

  1. Exchange信箱迁移(只适用于DC和exh不在同一服务器上
  2. 802.11be(Wi-Fi 7)技术前瞻
  3. 2018年7月7日笔记整理
  4. 科笛集团冲刺港股:上半年亏2.5亿 红杉与云锋基金是股东
  5. linux安装jdk1.7.0-79
  6. Visual C++免注册调用大漠插件
  7. 命令行运行IDL的sav文件
  8. win2003文件共享
  9. 【数字经济】我国驶上数字经济发展快车道
  10. [附源码]SSM计算机毕业设计japm青篮汇篮球培训系统JAVA