文章目录

  • 大数据时代
    • 数字与人类文明
    • 普查与统计学
      • 统计学所推动的数据新知
    • 统计学之殇:全美流感预测
      • 患病人次预测案例
      • 大数据时代
  • 数据、算法、计算资源
    • 摩尔定律
    • OTT式技术创新
      • 分布式集群
        • 分布式算法执行
      • 虚拟化与云计算
        • 云计算,给万物赋能
    • 数据的价值
      • 数据生产1.0
      • 数据产生2.0
      • 数据产生3.0
      • 数据与石油
        • 算法核心
          • 数理统计与机器学习
          • 学习型算法
    • 医保反欺诈案例
      • 实际案例
    • 推动数据科学进步的三驾马车
    • 人工智能
      • 第一代人工智能
      • 第二代人工智能
      • 第三代人工智能
  • 数据智能与企业应用
    • 市场反馈闭环
    • 算法驱动
    • 数据科学技术:将像电力一样改变世界
    • 人工智能与数据智能
    • 计算型社会的到来
  • 大数据人力资源管理
    • 人力分析的时代背景
    • 联盟
    • 人力资源分析
    • 人力资源分析与商业分析
      • 商业分析的一般流程
      • 人力分析阶段
    • 大数据员工管理
      • 滴滴公司的大数据企业员工管理
        • 员工画像、行为预测与机制优化
          • 员工画像
          • 员工价值评估
          • 员工管理制度优化
  • 人力资源大数据产品实例

大数据时代

数字与人类文明

​ 数字是人类发明的最重要的概念之一,与整个人类文明进程相伴相生

​ 早在8000年前美苏尔地区商人利用泥球计算商品销量

​ 商鞅也说过经典的“强国知十三数“:竟内仓、口之数,壮男、壮女之数,老、弱之数,官、士之数,以言说取食者之数,利民之数,马、牛、刍藁之数。

​ 我国古代的孙子兵法也有五条基本原则:“度(国之大小)、量(粮草资源多少)、数(军队数量多少)、称(各方实力对比)、胜“

​ 从这些概念中都可以明白,数字是从古至今中人类一直在使用的东西,并且伴随着人类的发展也在不断的完善与进步。

​ 对数字的利用在推动人类文明进步的时候都发挥了重大作用例如:美国制宪会议。

​ 在制宪会议中,由于在制定参众两院分权机制的过程中,众议院的席位要按照人口多少来进行分配,拥有众多黑奴的南方各州于是就黑奴是否应该纳入人口总数与北方各州展开了激烈辩论。最终,大会决定,每隔黑奴按照3/5个白人(自由人)的标准纳入南方人口的总数。这个3/5页写进了宪法,成为了黑奴不平等的历史见证。但就当是而言,这个数字的制定,为推动宪法制定做出了重大贡献。

​ 并且数字作为基本工具,为整个科学大厦奠定了基石

  • 在量子力学领域:从数字的结论出发解释了物理的规律
  • 在量化投资领域:用数字结论进行指导投资

普查与统计学

​ 人口普查是人类第一次有意识的、大规模的利用数据,统计学也就在人口普查中诞生了。

​ 人类最早的统计活动,就是起源于和人口情况相关的社会调查。而统计(Statistics)一词也最早见于17世纪的德国,原意为国势学。

​ 最初,人口普查时为了征税、评估国家的军事实力、实施社会控制。而后,纳入普查范围内

的项目数越来越多,普查本身的细分程度也不断加深,统计的难度和工作量不断增加。当时十八世纪的美国,每隔十年就需要进行一次普查,统计数据就要耗费8年。由此催生了自动制表技术抽样统计推断的一系列方法。

  • 自动制表技术:为后续的计算机科学奠定了基础。
  • 抽样和推断:奠定了数理统计学的科学基础

​ 统计学成为近代数据科学最前沿的领域的发展与四个特质是息息相关的:

  1. 始终站在数据应用的第一线
  2. 向各个垂直细分领域渗透
  3. 持续不断的价值产出
  4. 推动理论创新与技术创新

统计学所推动的数据新知

​ 所谓数据,是指指用于记录某项客观事物运行状态或事物属性的有序数字集合,而数据分析则是挖掘数据所蕴藏的规律,而数字规律,即事物规律,然后用这些规律进一步的去指导生产生活,来不断的完善人们的生活。

统计学之殇:全美流感预测

​ 2009年出现了一种新型流感病毒,这种甲型H1N1流感结合了导致禽流感和猪流感的病毒特点,在短短几周之内迅速传播开来。全球的卫生机构都担心一场致命的流感病毒即将来袭,更有评论家警告说,可能会爆发大规模流感。

​ 然而更加糟糕的是,针对这个问题我们还没研发出对抗这种新型流感病毒的疫苗,因此能做的事情只是根据病毒出现地方进行应急防范,以延缓传播速度。这就要求必须先知道这种流感病毒出现在了哪里。

​ 然而,患者只会因为患病后,甚至患病多日后才回去意愿,因为医疗机构的统计汇总效率比较底下,导致上报疾控中心需要时间,并且统计汇总也需要时间,造成的后果是公共卫生机构通常在两周后才能统计出全国各地患病信息这也导致了公共卫生机构在疫情爆发的关键时期反而无所适从。

​ 但是,在H1N1爆发的几周前,谷歌公司的工程师们在《自然》杂志上发表一篇论文,论述了如何利用人们在网上的搜索记录来完成全美冬季流感的传播预测,甚至可以精确到特定的地区和州,这是因为他们利用了5000万条人们的检索词频和美国疾控中心在2003年至2008年间流感传播时期的数据进行比较,并通过这些搜索记录来预测这些是否患上了流感,最终这项研究最终大获成功,他们的算法最终发现了45条检索词条的组合,最终预测结果和官方数据相关性高达97%,下面是预测的结果比较。

通过对2009年甲型H1N1流感的预测可以看出,两种统计方法表现出了两种截然不同的效率:

  • 官方机构的统计因为官方数据习惯性的滞后导致疾病爆发两周后才能统计出结果
  • 而谷歌的预测显然更有效及时,他 们能够提前一天预测全美各个地区流感爆发的趋势

​ 谷歌的预测可以为公共卫生机构的预防流感措施部署提供极有价值的信息,更关键的是,这是一种从未使用过的预测工具。该事件所代表的价值观和方法论,都深刻的影响了我们看待和使用数据的方法。

患病人次预测案例

我们希望通过这次案例获取患病人次的一般规律,进行患病人次的预测。

首先进行背景介绍:

  • 如今,定量化的了解区域内居民医疗卫生服务需求,对于合理制定区域卫生规划、优化医疗卫生资源配置、提高医疗卫生服务质量和效率,切实有效缓解群众看病难、看病贵的状况,有着显著的现实意义。

然后我们进行目标分析,我们希望可以达成三点:

  • 高精度:首先进行的是针对某市按月进行患病人次预测,希望能够将误差控制在5%左右,在确定模型稳健性之后既可通过预测序列和实际序列的比对来查找患病人次异常的时间点。
  • 动态预测:能够使用一种确定的模型进行长期迭代预测,并且要求能够预测每年患病人次序列的波峰变化情况。
  • 可扩展性高:确定一种模型或方法,能够应用到不同细分序列(如不同地区、不同人群的患病人次序列)、平行序列(如人次和金额序列)的预测当中,并且通过平行序列的比对来查找异常点。

我们选择时间序列模型进行分析,查看一下数据图。

下面查看实际的患病人次与预测的人次之间的差距

通过对结果进行分析可以看出,以季度为单位进行迭代式动态预测,以误差率作为评判指标,预测集和训练集无交集,可见模型较为稳健,并将误差率控制在5%-10%左右。

大数据时代

让我们简单复盘一下谷歌公司如何做到这么精准的预测,在我看来主要是因为拥有三点:

  • 拥有海量的数据
  • 拥有先进的资源
  • 拥有充足的计算资源

​ 在这个大数据时代,所有的大型互联网公司都在朝向大数据领域发力,而上述谷歌公司所拥有的的三点,将会最终构成推动数据科学发展的三驾马车。

数据、算法、计算资源

摩尔定律

IT技术的蓬勃发展,可以用摩尔定律准确的描述,1965年,英特尔创始人之一戈登摩尔在考察计算机硬件的发展规律后,提出了著名的摩尔定律。

该定律认为,同一面积芯片上可容纳晶体管的数量,每隔16-24个月将翻一倍,计算性能也将翻一倍。换而言之,也就是每隔16-24个月,单位价格可购买到的计算能力将翻一倍。在随后的几十年内,摩尔定律被无数次的被印证。

而同步发展的还有网络宽带和物理存储容量

下图是硬盘存储器一兆节价格一览图(美元),从图片中可以看出,半个多世纪以来,存储器价格几乎下降到原来价格的亿分之一。

下图是网络宽带变化的趋势

OTT式技术创新

伴随着物理硬件升级,IT领域的OTT式技术革新,分布式计算和量子计算机的出现,也必将决定性的改变计算资源供给端的情况:

  • 分布式计算技术:逐渐成为大数据领域底层IT架构的行业标准
  • 量子计算机技术:使得单体计算能力将拥有质的飞跃

分布式集群

分布式集群可以调动不同的计算资源为同一个计算目标服务,可以实现一个计算目标可以调配无限计算资源并予以支持,解决大数据情境中运算量过大超出单台屋里机运算承受能力极限的问题,最终达成同物理计算资源协同调配的成效,也为后续的云计算奠定了基础。

分布式算法执行

借助分布式集群、Hadoop生态进行算法执行,使用者创造工具,那么工具肯定也会反过来影响使用者,而分布式式算法可以解决多个步骤:

  • 通过利用分布式的存储、计算框架,完美解决分析过程中数据量大、中间结果多,无法单机运行等问题。
  • 能够直接嵌入产品,从而加快产品开发过程。
  • 可以进行流式处理,用户可较为快速得到响应,并在第一时间予以回复,从而缩短了算法得到反馈、建立闭环的时间,加快了算法迭代速度。
  • 利用MLlib和systemML,使得算法开发相对独立、算法使用相对灵活,通过建立机器学习流,提高算法复用率,极大程度简化调参过程,加快了算法开发效率。

虚拟化与云计算

云计算是指在虚拟化技术的基础之上,根据实际计算需求定制化的输出计算资源从而获取计算资源,打通了计算资源供给和需求的两端,可以不用在本地配给计算资源,直接通过互联网给计算中心发送计算请求,计算中心在根据计算要求分配计算资源并执行运算,最终将计算结果返回给用户。

云计算,给万物赋能

通过云计算,只要能联网、有消息发送终端和接收终端,就能随时随地申请计算资源执行计算,终端不再需要拥有复杂运算能力,也能够执行复杂运算,进一步执行复杂决策,云计算能够给万物赋能,赋予万物执行计算的能力。

当然,云计算所代表的赋予万物计算能力中心化的管理,也客观上促进了数据统一存储,同时也推动了物联网的兴起。

数据的价值

数据生产1.0

IT行业每隔15-20年就会迎来一轮重大的技术革新,在1980年前后,第一次信息化浪潮也就是个人计算机的普及到1995年前后,第二次信息化浪潮也就是互联网化的浪潮。伴随着这两次信息化浪潮的出现,数据的诞生方式产生了重大的变化,从原先的可以搜集的小样本抽样转变为后来的自动生成无穷无尽的数据。

数据产生2.0

90年代末,互联网技术兴起,主要的作用是信息的传播和分享,到2004年Facebook和Twitter相继问世,互联网成为了人们实时互动、交流协同的载体,全世界的网民都开始变成了数据的生产者,在到2012年乔治大学的教授李塔鲁考察了Twitter上产生的数据量,他作出估算说,过去50年,《纽约时报》总共产生了30亿个单词,现在仅一天,Twitter上就产生80亿个单词的信息量。

数据产生3.0

现在我们通过智能手机+智能穿戴+感知传感器,这极大程度上拓展了数据采集渠道,我们利用智能手机与其他组织或个人发生实时互动,行为数据也被实时记录,智能穿戴和传感器无时无刻,不在自动采集数据,在可以预见的未来,以人为核心的一切事物运行和状态都将被数据所记录。

数据与石油

数据的价值,在于数据结论的产出,也就是如何使用数据,就如同埋在地底下的石油,需要开采和冶炼,才能够真正挖掘其价值。所以在大数据时代,数据是基础,而算法是核心。

算法核心

算法核心用途是挖掘事物运行内在逻辑和规律,如果说数据是石油,计算能力是开采石油的工具,那么算法,则是石油冶炼技术,将算法作用于数据,产出有价值结论的过程,实际上就是挖掘数据价值的过程。

数理统计与机器学习
  • 传统数理统计分析算法:

    以神经网络为代表的机器学习类算法,正掀起一场针对统计学算法的革命。

  • 机器学习算法:

    通过数据的训练,不断迭代不断优化从而逐步改善、自我提高。

目前来说以神经网络为代表的机器学习类算法,正掀起一场针对统计学算法的革命。

学习型算法

阿里集团学术委员会主席、湖畔大学教育长:曾鸣提出的看法是:所谓学习是通过概率论的方法,不断地去通过正反馈来优化结果,而不是像人一样去思考学习。这种机器学习的方法必须基于海量数据的校验,必须基于算法的一个不断反馈调整的过程。

医保反欺诈案例

随着社会老龄化程度加深,我国各地医保压力持续增加,部分地区已经面临穿底风险。并且医保欺诈面临着以下的问题:

  • 老龄化:随着社会老龄化程度不断增加,医保支出初年增加,在医保骗保问题没有得到有效解决之前,医保面临压力与日俱增。
  • 检测效率:传统医保反欺诈检测主要依靠人工抽查审核,不仅检测效率较低,许多新形式的骗保模型也无法通过经验迅速判别,这也是长期以来医保欺诈问题没得到有效解决的原因之一
  • 暗箱操作:有人就会犯错,有政策就会有对策,部分医保局甚至存在对医保骗保睁一只眼闭一只眼的态度,有的则更甚。
  • 亡羊补牢:通过抽查进行人工审核,无法在就医行为发生时就及时对骗保行为进行制止,就算判别为欺诈,很多时候也都是”人去财空“

在此背景下,利用大数据的方法,对医保骗保行为进行智能识别,在骗保行为发生的第一时间进行识别与制止,则能够起到较好的反欺诈效果。

首先,我们抽象定义时间和时间,以及它们的属性。

  • 事件:患者与医院进行一次交互的抽象
  • 时间:两次时间之间的时间间隔,根据决策树分类结果进行分箱的结果】
  • 事件属性:在抽象的事件中针对某些目的所赋予事件的标签

接着,将就医路径抽象成有时序关系的事务集。

然后查看各类的相关指标

实际案例

CDA就曾与重庆卫计委展开合作,就一些病情对患病人群进行调查分析,并且可以针对某些具体的病症进行观察,成功的帮助卫计委对患病人群进行管理预测。

推动数据科学进步的三驾马车

随着科技不断的进步,数据科学也在不断的进步,而主要推动数据科学进步的有三部分:

  • 基础:计算能力
  • 关键:数据
  • 核心:算法

这三部分是相辅相成、相互促进,并且缺一不可的,只用继续的发展这三部分,数据科学才能在发展的道路上,拥有源源不断的动力。

人工智能

根据2018年1月18号颁发的中国《人工智能标准化白皮书》定义,我们可以将人工智能视为数据科学皇冠上的明珠,目前的主流研究仍然集中于弱人工智能,并取得了显著进步如语音识别、图像处理和物体分割、机器翻译等方面取得了重大突破,甚至可以接近或超越人类水平。但是弱人工智能并不能成为真正实现推理和解决问题的智能机器,这些机器表面看像是智能的,但是并不真正拥有智能,也不会有自主意识。

2018年1月国家标准化管理委员会颁布的《人工智能标准化白皮书》对人工智能学科的基本思想和内容作出了解释:

  • 围绕智能活动而构造的人工系统
  • 知识的工程
  • 机器模仿人类利用知识完成一定行为的过程

而人工智能随着这么多年的发展,可以将其发展历程分为三代

第一代人工智能

第一代人工智能是基于规则的“智能”,典型代表:IBM深蓝(Deep Blue)

1997年5月11日美国IBM公司研制的并行计算机“深蓝”击败了雄踞世界棋王宝座12年之久的卡斯帕罗夫。但是国际象棋每一步的选择以及应对对手某一特殊步骤的最有方案是确定的,只要足够多的定性棋谱以及足够大的计算速度,就能够在对手走任何一步的时候准确判断出下一步应该如何走,就本质上而言,1997年的深蓝是基于规则的人工智能,深蓝本身并不会创造新的战略战术。

第二代人工智能

第二代人工智能是能够自主学习的人工智能,典型代表:谷歌的AlphaGo

2016年3月9日到15日,阿尔法围棋程序挑战世界围棋冠军李世石的围棋人机大战五番棋在韩国首尔举行。比赛采用中国围棋规则,最终阿尔法围棋以4比1的总比分取得了胜利。

2017年5月23日到27日,在中国乌镇围棋峰会上,阿尔法围棋以3比0的总比分战胜排名世界第一的世界围棋冠军柯洁。在这次围棋峰会期间的2017年5月26日,阿尔法围棋还战胜了由陈耀烨、唐韦星、周睿羊、时越、芈昱廷五位世界冠军组成的围棋团队。

第三代人工智能

假如数据变为无限,那么世界将会变成什么样子,目前第三代人工智能的代表是百战百胜的AlphaGo Zero

2017年10月19日,谷歌DeepMind团队在Nature发表论文,以《Mastering without human knowledge》为名,详细介绍了没有再用人类历史棋局作为训练样本,训练过程从随机开始,通过左右互搏精进棋艺,最终以100:0战胜了AlphaGo的AlphaGo Zero。

但是以上的这些人工智能,都是在信息透明,规则透明,结构明确,且为围棋规则和判断棋局的输赢本身也是一种监督信号,总的来说尚未脱离人类控制

数据智能与企业应用

市场反馈闭环

企业要应用数据、释放数据的价值,那么核心就在于构建从算法到市场应用的反馈闭环,从打通算法结论到实际应用的通道,到给予算法及时有效的市场反馈再到训练算法并在训练过程中优化。这三个步骤是不断的在循环完善自身的,形成一个自我促进,自我发展的闭环。

算法驱动

现在的社会可以由并且有一些领域已经开始由算法来驱动,在人类的基础重复决策领域上代替或指导人类参与决策,例如:

  • 驾驶领域:无人驾驶
  • 基础诊断领域:辅助诊疗
  • 基础法务领域:法律大数据
  • 基础翻译领域:智能翻译

并且算法可以在人类未知的领域开拓先知,比如IBM就实验过,如何快速决定某种蛋白质对治疗癌症有效,一般人工试验时,每研究一种蛋白质,耗费的人力物力都非常大。10年时间也可能只能研究10多种。但是使用机器学习判断时,机器“读”完了近30年来有关蛋白质研究的所有论文,从中确定蛋白质生物属性上的关系,进而决定哪种蛋白质更值得研究。这种速度是比人类快很多倍,而这一切只需要机器有强大的计算能力就可以了。

数据科学技术:将像电力一样改变世界

​ 来自MIT经济学教授艾瑞克.布莱恩.杰弗森的观点他认为普遍性技术(GPT)应该有三种特征:

  • 扩散性:在很多行业内得到普遍应用,且引发很多行业的突破,如蒸汽机
  • 改进性:随着技术发展,会迅速进行不断的自我改进,如电脑的摩尔定律
  • 连锁创新性:每到一个行业,就创造新的生产过程、新的商业模式,如互联网

而每当发生重大的技术突破时,由于它对整个社会的影响力巨大,甚至需要整个社会进行重新组织,来适应这种新技术。

人工智能与数据智能

人工智能是数据养育的智能,其决策核心是算法,同十八世纪工业革命通过机器生产代替手工劳动从而释放人类劳动力类似,数据智能就是能将通过参与、代替人类决策的方式,帮助人类释放脑力

计算型社会的到来

现在计算型社会已经到来,只是还没有开始流行起来,就比如无人驾驶现在所遇到的道德和法律上的难题,和数百年前汽车代替马车的过程有这惊人的相似性,所以我们现在已经迎来了计算型社会,只是如果想全面建成的话,还有很长的一段路要走。

大数据人力资源管理

人力分析的时代背景

人才对于企业的价值体现在了劳务输出,创新能力以及人才吸引的作用,所以人才的需求现在的竞争已经算愈发的激烈,在发达国家里,人才创造了了绝大部份价值,专门计算公司无形资产(如技术、专利、品牌等)的人认为治理产出占公司总价值的80%,接下随着经济转型和产业升级,可以预料到的人才需求竞争会愈发激烈

但是随着互联网化程度加深,信息资源可获取性加强,以及高新产业快速发展与迭代,“时间战场”、“注意力商人”等概念兴起,企业员工流动性明显加快,员工平均任期不断下降。亚特兰大联邦储备银行考察了各年龄段和各时代员工的工作流动率的平均值发现:

  • 1993年出生的千禧一代20岁到30岁之间平均工作任期只有一年
  • 1983年出生的一代在相同年龄的工作平均任期为2年在30岁到40岁之间的平均工作任期为3年在相同年龄的工作平均任期为4年

联盟

在当今时代,人才和雇主的关系悄然发生变化,雇主和人才的“联盟”正作为一种新兴的人才机制在互联网时代大行其道,所谓联盟,是指雇主与员工之间从商业交易转变为互惠关系的框架。而公司实行这种互惠的框架要获得收益只需要进行三步:

  • 首先是互惠投资:创建一种鼓励公司和个人相互投资的工作模式
  • 然后是实行任期制:打造任期制,将非终身雇用的员工变为公司的长期人脉
  • 最终进行获益:吸收员工的高效人脉情报

只有雇主与雇员结为强大的联盟,共同拥有持续的创新与丰富的智慧宝库才能繁荣发展

人力资源分析

通过人力资源分析,我们可以找到“猎取、培养和留住人才”的解决方案。

在2016年CDA就与期合作企业有利网,就针对有利网公司的内部开展了一项人力分析项目并取得显著成效,通过制定数据指标体系来评估客服人员的工作绩效,并通过构建模型来预测销售人员的任期生命周期。

但对于整个行业而言,大数据人力资源管理尚处于行业探索期。根据Sierra-Cedar公司的最新报告指出,企业人力资源管理应用大数据者尚不超过9%,IBM曾经对342名首席人力资源官员进行了研究,结果报告显示:

仅有不到16%的公司能够使用数据针对未来的员工问题进行预测并采取行动。因此,一个比较好的方式方法,是参考已经成熟的应用数据的商业模式,来进行人力资源分析。

人力资源分析与商业分析

根据美国巨兽公司负责大数据分析和商业智能的全球副总裁Jean Paul Isson的观点,人力资源和市场营销有着显著的共性,他们都曾是“凭直接和经验作战”的团队,以及都曾是公司的“成本中心”

但是有些公司的市场营销很早就开始利用数据,实现了严谨的艺术与科学之间的平衡,发挥了巨大的商业价值,走在时代潮流前面的公司已经开始逐渐摒弃那些际遇直觉的判断和实现。

商业分析的一般流程

目前进行商业分析的流程一般有两种类型,一种是IBM商业分析方法论,一种SAS的数据挖掘方法论:

  • IBM的CRISP-DM商业分析方法论

  • SAS SEMMA 数据挖掘方法论,主要分为:

    • Sample–数据取样
    • Explore–数据特征探索、分析和予处理
    • Modify–问题明确化、数据调整和技术选择
    • Model–模型的研发、知识的发现
    • Assess–模型和知识的综合解释和评价

人力分析阶段

根据商业分析的一般流程,我们可以总结出企业应用商业分析的三个阶段:

  1. 根据相应的可行性评估,明确分析目标,进行有针对性的数据采集、整理、清洗,以及建立完整与人资相关的自动化数据搜集体系
  2. 根据分析目标构建切实可行的算法模型,根据业务需求,构建可解释型算法或结果导向型算法,并提供相应的算法模型结论
  3. 将模型结论付诸实现,并根据实际效果提供反馈,再根据反馈的情况不断修正和优化模型

大数据员工管理

在大数据人力资源管理,在实际应用相对较为成熟的,是因为在员工管理领域,主要是因为以下三点:

  • 拥有历史人资数据
  • 拥有现任员工数据
  • 能够获取现任员工及时反馈迅速建立业务反馈闭环

滴滴公司的大数据企业员工管理

接下来,以滴滴公司对司机管理为例,来对大数据企业员工管理进行简单说明。

滴滴公司的员工管理面临着两个方面的问题,一方面随着滴滴公司在打车领域市场地位确立,旗下全职、兼职司机数量众多,另一方面,由于不存在硬性制度约束,公司又面临单纯依靠业务关系很难与司机建立长期稳定雇佣关系的困境。

作为数据驱动的公司,滴滴公司需要考虑将业务领域应用非常成熟的大数据技术应用于司机管理领域。

员工画像、行为预测与机制优化

大数据企业员工管理的工作又可分为三个主要方面,也是滴滴公司在进行智能化司机管理前的三方面工作,分别是员工画像,员工价值评估和管理机制优化。

  • 员工画像:基础的核心是将一些可以量化描述或考核指标进行量化处理
  • 员工价值评估:在员工画像的基础上,对员工对公司的收益贡献程度进行量化评估
  • 管理机制优化:利用数据分析方法及结论进行管理方法方面的优化
员工画像

员工画像包括两部分,为后续的分析先做好数据铺垫

工作内容 客户画像 员工画像
第一层次采集基本数据 采集与市场营销相关的客户数据基础字段,包括客户生物属性、社会属性等;年龄、性别、收入、资产状况、消费记录等。 采集与人资管理相关的员工数据基础字段,包括客户生物属性、社会属性等;年龄、性别、工龄、家庭状况、司机职称、车辆信息、驾驶记录、客户评分等、
第二层次根据基本数据生成标签 如:高学历、青年、未婚、电子产品控、科技工作者等。 车辆安全系数高、驾驶经验丰富、工作时间稳定、出勤率高、驾驶平稳、事故率低、五星司机等。
员工价值评估

和客户价值评估一样,接下来在员工基本数据的基础上,去寻找高价值司机,然后在高价值司机群体重,通过其标签,挖掘共性:

  • 出勤率高
  • 驾驶习惯良好
  • 服务态度认真
  • 已婚
  • 中年
  • 工作时间稳定

这些部分是和管理经验相符合的,更重要的是,数据分析可以提供一整套数字化结论的同时,还提供了能够行之有效的解决方案。

员工管理制度优化

员工管理制度优化与运营策略创新类似,针对不同价值等级的员工,基于相应的管理策略

员工价值 核心策略 具体方法
高价值员工 维护为主 收益优化(派单策略调整);特权福利(车辆升级,优惠购车等);定制化保赔服务等
潜在高价值员工 培养为主 收益保证(派单策略调整);阶段性鼓励措施等
其他员工 激励为主 阶段性鼓励措施、抢单激励措施等
流失员工 激励为主 回归福利等等

并通过算法自动的进行决策,进行准确、快速、高效、廉价的决定,同时和《联盟》思路高度契合,由雇佣关系转变为互相投资的互惠关系。

人力资源大数据产品实例

每个企业可以根据企业的需求,为企业内部员工提供系统化、个性化的培训方案,提高员工的技术水平,当然如果企业内部暂时没有能力去执行这样的方案的时候们可以寻找专业的提供数据分析方面的企业内训服务,帮助员工快速提高技术水平,实现合作共赢。

下面是有关CDA与某公司合作制定的有关员工的管理分析



大数据在人力资源管理当中的应用相关推荐

  1. 《大数据》第1期“动态”——大数据导航人力资源管理

    大数据导航人力资源管理 Human Resource Management Based on Big Data 大数据处理技术的应用已经在全球范围内迅猛增长,推动整个社会进入了大数据时代[1].特别地 ...

  2. 大数据对信息资源管理的影响

    概述: 从大数据的角度看,当今社会已不再是那个信息匮乏的时代,而是人们只要想要某方面的信息,就会被各种各样的信息所淹没.所以在这个时期无论是从国家.政府的宏观层面,还是各种企业.组织这种社会的中观层面 ...

  3. 【云计算与大数据技术】资源管理、调度模型策略的讲解

    一.资源管理模型 集群资源管理模型通常由两个部分组成,即资源表示模型和资源分配模型,由于这两个部分是耦合的,所有优化集群资源管理时需要同时结合这两个部分考虑,资源表示模型用于描述集群资源的组织方式,是 ...

  4. 人力资源管理中的大数据应用之道

    本文来自网易云社区. 随着时代的发展,计算机技术已经成为了人们生活以及日常办公必不可少的重要手段,尤其是近两年来,大数据以及云计算已经成为了企业管理的重要手段,不仅帮助企业提升业务管理,同样对于企业的 ...

  5. 2016 大数据版图

    原文是 FirstMark Capital 的 Matt Turck 的文章.本文全面总结了大数据领域的发展态势,分析认为尽管大数据作为一个术语似乎已经过气,但是大数据分析与应用才刚刚开始兴起,在与 ...

  6. 2016——大数据版图

    编者注:原文是 FirstMark Capital 的 Matt Turck 的文章.本文全面总结了大数据领域的发展态势,分析认为尽管大数据作为一个术语似乎已经过气,但是大数据分析与应用才刚刚开始兴起 ...

  7. AI—2017大数据版图发布:AI、大数据与云计算结合是大势所趋

    [ 亿欧导读 ] 2016年,大数据初创企业的总融资达到了148亿美元,占到了全球技术风险投资的10%.随着核心基础设施不断走向成熟,以及在AI推动下应用侧的爆发,2017年的大数据(以及AI)生态体 ...

  8. 云计算与大数据的发展

    大数据平台融合云计算 摘自 恒生电子副总 张良友 云计算与大数据的发展路线必将交接.碰撞,而这已经成为现实.为什么大家开始对大数据讳莫如深呢?大数据给人留下的印象:花钱多,灵活度低,令人头疼的运营管理 ...

  9. 2019年大数据发展现状详解,现在学习晚不晚!

    大数据时代,大数据分析与应用大肆盛行.越来越多的大公司大企业大集团,都越来越重视大数据的影响和作用.可以说,谁想抢得大数据的一手可靠资料,谁就在未来的业务发展和拓宽中占据优势,谁就会在相关领域首先拔得 ...

  10. 数字化转型导师坚鹏:数字化转型背景下的保险公司人力资源管理

    数字化转型背景下的保险公司人力资源管理 课程背景: 很多保险公司存在以下问题: Ø 不清楚保险公司数字化转型目前的发展阶段与重要应用? Ø 不知道保险公司数字化转型给保险公司人力资源管理带来哪些机遇与 ...

最新文章

  1. 2022-2028年中国PE膜产业竞争现状及发展前景分析报告
  2. 自动驾驶进入第3阶段 ADAS黑科技守护开车人
  3. mongdb开始标记
  4. 【python常用模块】os.path
  5. 互逆的压缩与解压(洛谷P1319、P1320题题解,Java语言描述)
  6. 29岁学python的建议_学习Python的建议
  7. 数据中台和业务中台的区别
  8. python做图片-python做图
  9. 3个月内通过7轮面试,程序员拿到谷歌offer后却被女友威胁......
  10. CTF密码学——常见编解码及加解密总结
  11. 英语不好的程序员怎么样才能自己读英文官方文档?
  12. linux终端vim配色方案,Vim自定义配色方案图文并茂
  13. 串口服务器调试助手使用教程,如何配置串口服务器及串口调试的六个技巧
  14. 从BlueSky.h和BlueSky.cpp到BlueSky.out的那些事儿
  15. mysql rds数据库优势_云数据库 RDS MySQL究竟有何优势呢?
  16. python多轴图_python中用Matplotlib做多个纵轴 (多y轴)
  17. 三种Lp范数距离定义
  18. 天龙单机虚拟服务器,最新2021新天龙八部单机版一键端 虚拟机安装带假人天龙八部网单游戏...
  19. 单例模式的五种实现形式(懒汉式,饿汉式,双空判断,内部类,枚举)
  20. openEuler ceph mgr dashboard 无法登陆 报错 401 Unauthorized You are not authorized to access that resource

热门文章

  1. 计算机连上wifi无法上网了,WiFi已连接不可上网怎么办
  2. android手机连不上wifi密码,修改wifi密码后手机连不上_修改wifi密码后手机不能上网-192路由网...
  3. 论文特色自我评价内容结构
  4. RCTF crypto100(1)
  5. access中如何画斜线_在Excel单元格中如何用斜线分割填写?
  6. 26 | 产品安全方案:如何降低业务对黑灰产的诱惑?
  7. Unity 3D项目-Adventure of JM Robot
  8. python ide哪个好用_好用的Python IDE推荐
  9. 下拉框输入模糊查询_高考英语听力考试查询、网上填报志愿时间、诈骗陷阱提防!全在这里了...
  10. JAVA 仿XP画图板的总结