背景介绍

大数据

大数据主要有五个特征,我们称为5V特征:Volume(大量)、Variety(多样)、Value(价值)、Velocity(速度)、Veracity(质量)。

Volume(大量):实时采集人、车、环境各种汽车大数据,数据量庞大;

Variety(多样):数据格式发生了翻天覆地的变化,多类型的数据对数据的处理能力提出了更高的要求。Value(价值):海量数据爆发增长,但价值密度低,类似沙里淘金,需要通过通过强大的机器算法来挖掘数据价值。

Velocity(速度):数据增长速度快,处理速度也快,时效性要求高,处理速度为实时的秒级或毫秒级;

Veracity(质量):数据的准确性和可信赖度,数据的质量参差不齐。

通用人工智能(General AI)概念,指拥有人类五感(视觉、听觉、嗅觉、触觉、味觉、甚至更多)、推理能力以及人类思维方式的神奇机器;

弱人工智能(Narrow AI):执行特定任务的水平与人类相当,甚至超越人类的技术。

上世纪50年代,人工智能的概念就已提出,人工智能的发展也经历了坎坷的阶段;上世纪80年代,机器学习开始兴起,开始用模型、算法和数据组成软件部分;2010年以后,随着处理能力的提升和海量数据的累积,深度学习火热起来,它源自于人工神经网络,深度学习的发展也得益于算法模型的优化,自动学习特征。

数据资源、核心算法、运算能力是人工智能的三大核心要素,它给我们带来了四大方向:

发现:通过人工智能可以发现一些有价值的数据,比如发现一些用户的行为,经常夜间开车等等。

预测:可以对用户进行预测,预测行驶目的地,预测消费趋势;

推荐:预测后就要推荐,通过各种推荐技术,比如猜测行程后进行推荐;

自动化:了解用户定期的消费习惯,自动化的定期进行推荐。

车主画像平台

基于驾驶数据(用户特质,操控,使用,注意力,环境等维度的驾驶分析)、能耗分析、惯走路线、活动区域、用车频度等汽车大数据,结合实时位置数据(包括线下活动区域,近期高频场所,常驻地址等)的深度分析,构建多维度用户分析模型,洞察用户需求。 由此,可以产出多个维度的汽车用户标签,如,人口属性,性别、年龄、婚姻、职业;驾驶类型,老司机、上班族、专车司机等;线下偏好,常驻地址、高频场所、旅游类型等;定制标签,育儿族、富贵族、抱恙族、旅游族等。对于多种汽车用户标签的建立,背后都是AI在支持。

这里就要谈到上面提到过的机器学习和深度学习,机器学习是实现AI目标的重要路径,即通过大量数据和算法“训练”机器,让机器学会如何执行任务。深度学习是一种实现机器学习的AI技术,下面以“好司机”标签为例,解读我们是如何完成深度学习建模的。

建模的基本思路其实很简单,将用户的出险次数作为模型的学习目标,通过特质、使用、操控、环境、注意力5个维度的47项指标,对出险次数进行建模,拥有模型训练需要的特征数据,就可以构建神经网络模型,将数据丢给模型进行自我训练学习。

对于模型的泛化,采用Dropout,通过随机抹掉部分hidden layer的节点,类似通过让模型变得简单,同时通过将多个简单模型的结果综合起来,达到提高泛化能力的目的。并且提供更丰富的训练样本,让模型接触更多不一样的数据,提高泛化能力,从而提高对用户标签的识别判断。

场景配置平台

斑马数智汽车大脑,围绕汽车产业链,以数据为基础,用人工智能做出明智的判断与决定,助力汽车产业升级。6大智+产品体系,覆盖研发、供应链、营销、运营服务、车险、数据可视化等方向,涵盖实时大屏、智能行车助手、智能车主分析、智能服务、智能研发、智能保险等核心功能,为汽车产业提供数据智能的技术服务和商业化应用服务。

场景配置平台是汽车大脑的其中一部分,是我们为汽车行业打造的支持一车一人一面的实时场景引擎后台,管理人员可通过后台系统的可视化操作,按分类/属性筛选海量地址库,来自定义想要配置的场景。其中,可进行全国与各省市的区域选择,一级地址、二级地址与地址属性的筛选。

由于需要以接口的形式将用户到访场景的相关信息进行实时推送,因此实时计算的能力就非常重要,可以帮助客户抓住稍纵即逝的机会,为车主提供个性化服务。

场景引擎:实时的计算能力 按结构划分,人工智能可以分为基础技术层、AI技术层和AI应用层。基础技术层主要聚焦于数据资源、计算能力和硬件平台, AI技术层着重于算法、模型及可应用技术。AI应用层则主要关注将人工智能与各领域结合起来,在汽车这个领域,可应用于UBI车险、汽车自动化、实时营销推荐、行为预测等。

现在,人类可获取利用的数据正以爆炸式增长。自有记录以来至2003年,人类记录数据总量为5PB(petabyte);2011年,每2天创造同样的数据量;2013年,每10分钟创造同样的数据量。海量的大数据通过最新的深度学习技术将为人工智能的发展与应用带来难以估量的价值,而运算能力提升是人工智能发展的前提保障。在计算能力和硬件平台方面,我们采用的GPU数据集群,有以下的多种优势:

  1. 运算速度突飞猛进,拥有了更强大的处理浮点运算的能力。
  2. 用GPU来运行机器学习模型,同样的大训练集,GPU在耗费功率更低、占用基础设施更少。
  3. 应用吞吐量大。

前面我们讲过人工智能的四大方向,发现、预测、推荐与自动化,实时计算在推荐领域的应用非常丰富,基于一人一车一面的信息推荐,每个人接收到的推送内容都是根据个人兴趣偏好、线下场景量身定制的。而用户的兴趣偏好与具体场景,都是通过实时数据计算不断更新。例如,出行服务平台的场景营销,通过实时数据分析发现用户的场景处于机场火车站,结合用户画像的差旅人群识别,就可以及时准确推送出行优惠券。这种场景是只有实时计算才能解决的,也最能体现实时计算的价值。

python 用户的画像可视化呈现技术_一人一车一面:解读汽车大数据用户画像背后的AI技术...相关推荐

  1. python用户画像_大数据-用户画像DMP

    描述 大数据-用户画像DMP --小树老师 更多好课 大数据用户画像系统课程一.项目概述目前推广平台仅在投放端提供了有限的定向能力,广告主没有足够的流量抓手,无法满足大中型广告主的营销目标.画像系统提 ...

  2. 计算机毕业设计之Python+Spark汽车推荐系统 汽车可视化 汽车数据分析 汽车大数据 汽车推荐app 汽车小程序 大数据毕业设计 汽车爬虫

    功能 最近移动端的沙箱支付不太稳定,经常报订单不存在,可以不管,直接多点几次,仍然可以支付的. Vue spark 懂车帝汽车大数据大屏 技术 基于spark java API 实现分析功能 基础情况 ...

  3. 大数据用户画像之基本概念(一)

    什么是大数据用户画像? 大数据用户画像指的是基于大数据技术和算法,对用户进行多维度的数据分析和挖掘,从而构建用户的详细描述和分析模型. 通过分析用户的 基本信息.消费行为.兴趣爱好.社交行为.地理位置 ...

  4. 网易大数据用户画像实践

    [与数据同行]已开通综合.数据仓库.数据分析.产品经理.数据治理及机器学习六大专业群,加微信号frank61822701 为好友后入群.新开招聘交流群,请关注[与数据同行]公众号,后台回复" ...

  5. 大数据用户画像系统架构设计

    文章目录 一.用户画像数据仓库搭建.数据抽取部分 二.大数据平台.用户画像集市分层设计.处理 三.离线计算部分 四.实时计算部分 五.Solr/ES搜索引擎部分 六.Java Web毫秒级实时用户画像 ...

  6. 大数据用户画像项目实战 ETL数据抽取

    一.课程介绍 一个基于规则的大数据用户画像项目为什么要选这样一个项目:1.典型的批量计算场景2.基于规则.涵盖大数据批量处理的各个典型场景3.可视化.所有控制流程全程可视化4.可扩展.通过集成更多的计 ...

  7. 看完秒懂大数据用户画像!

    来自:网络 什么是用户画像? 用户画像(User Profile),作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准.快速地分析用户行为习惯.消费习惯等重要信息,提供了足够的数据基础, ...

  8. 大数据杀熟的背后 -- 浅谈用户画像

    ​A有一天在某电商平台搜了"连衣裙",惊呼:"xx上的裙子好贵啊,怎么都要四五百?".B接话:"不能吧,我看看,哎?我这就两百多啊".胖里默 ...

  9. 什么是用户画像?金融行业大数据用户画像实践 [

    什么是用户画像?金融行业大数据用户画像实践 [复制链接]       电梯直达 楼主 发表于 昨天 14:36 | 只看该作者 | 只看大图 大数据系列零基础由入门到实战视频 本帖最后由 丫丫 于 2 ...

最新文章

  1. Educational Codeforces Round 84 (Rated for Div. 2) A~ ESZU cf集训
  2. pve rust 能拆家吗_RUST:2020年9月第四周:向上向上再向上!
  3. win10 64位SSDT函数索引动态查找
  4. linux下awk内置函数的使用(split/substr/length)
  5. 我学习Python的三个神级网站
  6. c语言编程一个象棋游戏,急求:C语言编写的中国象棋游戏一个
  7. DML,DDL,DCL,DQL的区别
  8. C BNF grammar
  9. Python写入文件,但是发现文件为空,竟然未写入!
  10. 数值分析(10)-数值微分
  11. 微软官方提供的免费正版 Windows 8.1/Win10/7/XP/Vista 操作系统虚拟机镜像下载
  12. Druid创始人Eric Tschetter详解开源实时大数据分析系统Druid
  13. JAVA我的世界怎么弄TNT大陆_《我的世界》爷爷的遗言:TNT大陆地图存档
  14. 2019五一联赛建模心得
  15. 俄罗斯方块中方块的旋转变形
  16. 复习330+天,我总结了一份对大多数人都适用的复习经验
  17. 寻找鲁菜——美食江山寻味记之三·胶东人家
  18. 链路预测 matlab,链路预测
  19. 基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_朴素贝叶斯为什么被称为“朴素”?...
  20. 递归求幂集(python)

热门文章

  1. BGP——路由抖动惩罚机制(讲解+配置)
  2. java 从键盘中读取字符流 自定义异常
  3. C#LeetCode刷题之#48-旋转图像(Rotate Image)
  4. C#LeetCode刷题-脑筋急转弯
  5. Linux入门学习(八)
  6. redis-Set集合操作SADD,SMEMBERS,scard,srem
  7. 使用peewee增删查改数据库
  8. 理解搜索引擎并且善用google
  9. python之质数判断
  10. 自助银行服务系统项目开发_自助服务时代即将结束