2019独角兽企业重金招聘Python工程师标准>>>

随着智能手机的普及和APP形态的愈发丰富,移动设备的应用安装量急剧上升。用户在每天使用这些APP的过程中,也会产生大量的线上和线下行为数据。这些数据反映了用户的兴趣与需求,如果能够被深入挖掘并且合理利用,可以指导用户的运营。若能提前预测用户下一步的行为,甚至提前得知用户卸载、流失的可能性,则能更好地指导产品的优化以及用户的精细化运营。

大数据服务商个推旗下的应用统计产品“个数”,可以从用户属性、使用行为、行业对比等多指标多维度对APP进行全面统计分析。除了基础统计、渠道统计、埋点统计等功能外,个数的一大特色能力是——可基于大数据进行用户行为预测,帮助运营者预测用户流失、卸载、付费的可能性,从而助力APP的精细化运营以及全生命周期管理。


开发者在实践的过程中,基于大数据进行用户行为预测会有两大难点:第一,开发者需要使用多种手段对目标问题进行分解;第二,数据在特定的问题上会有不同的表现。

“个数”利用数据分析建模,对用户行为进行预测的大概流程包括以下几点:

1、目标问题分解

(1)明确需要进行预测的问题;
(2)明确未来一段时间的跨度。

2、分析样本数据

(1)提取出所有用户的历史付费记录,这些付费记录可能仅占所有记录的千分之几,数据量会非常小;
(2)分析付费记录,了解付费用户的构成,比如年龄层次、性别、购买力和消费的产品类别等;
(3)提取非付费用户的历史数据,这里可以根据产品的需求,添加条件、或无条件地进行提取,比如提取活跃并且非付费用户,或者不加条件地直接进行提取;
(4)分析非付费用户的构成。

3、构建模型的特征

(1)原始的数据可能能够直接作为特征使用;
(2)有些数据在变换后,才会有更好的使用效果,比如年龄,可以变换成少年、中年、老年等特征;
(3)交叉特征的生成,比如“中年”和“女性”两种特征,就可以合并为一个特征进行使用。

4、计算特征的相关性

(1)计算特征饱和度,进行饱和度过滤;
(2)计算特征IV、卡方等指标,用以进行特征相关性的过滤。

5、选用相关的模型进行建模

(1)选择适当的参数进行建模;
(2)模型训练好后,统计模型的精确度、召回率、AUC等指标,来评价模型;
(3)如果觉得模型的表现可以接受,就可以在验证集上做验证,验证通过后,进行模型保存和预测。

6、预测

加载上述保存的模型,并加载预测数据,进行预测。

7、监控

最后,运营人员还需要对每次预测的结果进行关键指标监控,及时发现并解决出现的问题,防止出现意外情况,导致预测无效或预测结果出现偏差。


以上就是“个数”对用户行为进行预测的整体流程。总的来说,分析和建模的关键在于大数据的收集和对大数据细节的处理。在进行用户行为预测的整个过程中,可供技术人员选择的方法和模型都有很多,而对于实际的应用者来说,没有最好的选择,只有更合适的选择。

转载于:https://my.oschina.net/u/1782938/blog/2993073

基于大数据的用户行为预测相关推荐

  1. 大数据标签获取处理步骤_基于大数据的用户深层标签挖掘方法与流程

    本发明涉及大数据应用技术领域,尤其涉及一种基于大数据的用户深层标签挖掘方法. 背景技术: 用户画像建立的过程就是添加相应的标签,在数据挖掘领域称为标签化.标签是通过对用户信息分析而得到的高度精炼的特征 ...

  2. 基于大数据的用户画像构建小百科全书

    来源:http://suo.im/6aVjHQ 一. 什么是用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用 ...

  3. video 微信 标签层级过高_基于大数据的用户标签体系建设思路和应用

    在大数据时代,数据在呈现出海量化.多样化和价值化变化的同时,也改变了传统IT行业的市场竞争环境.营销策略和服务模式.如何在ZB级的海量数据中获取并筛选有价值的信息,是对IT企业的一大挑战,通过构建客户 ...

  4. 大数据 客户标签体系_基于大数据的用户标签体系建设思路和应用

    如何设计一个完善的用户标签体系?怎么打标签?打哪些标签?谁来打?怎么使用用户标签创建商业价值? 在大数据时代,数据在呈现出海量化.多样化和价值化变化的同时,也改变了传统IT行业的市场竞争环境.营销策略 ...

  5. 大数据 客户标签体系_基于大数据的用户标签体系建设思路

    如何在ZB级的海量数据中获取并筛选有价值的信息,是对IT企业的一大挑战.通过构建客户标签,支撑精准营销服务,是应对上述挑战的有效解决方案. 但是怎么设计一个完善的用户标签体系?怎么打标签?打哪些标签? ...

  6. 基于大数据的用户标签体系建设思路和实践

    在大数据时代,数据在呈现出海量化.多样化和价值化变化的同时,也改变了传统 IT 行业的市场竞争环境.营销策略和服务模式.如何在 ZB 级的海量数据中获取并筛选有价值的信息,是对 IT 企业的一大挑战, ...

  7. 基于大数据的用户画像构建(理论篇)

    什么是用户画像? Alan Cooper (交互设计之父)最早提出了 persona 的概念:"Personas are a concrete representation of targe ...

  8. 毕业设计 - 题目:基于大数据的用户画像分析系统 数据分析 开题

    文章目录 1 前言 2 用户画像分析概述 2.1 用户画像构建的相关技术 2.2 标签体系 2.3 标签优先级 3 实站 - 百货商场用户画像描述与价值分析 3.1 数据格式 3.2 数据预处理 3. ...

  9. SSM基于校园大数据的学业表现预测及行为分析 毕业设计-源码64653

    摘  要 科技进步的飞速发展引起人们日常生活的巨大变化,电子信息技术的飞速发展使得电子信息技术的各个领域的应用水平得到普及和应用.信息时代的到来已成为不可阻挡的时尚潮流,人类发展的历史正进入一个新时代 ...

最新文章

  1. placeholder
  2. 2020德勤面试开始了吗_2020下半年教师资格证面试时间已出!12月10日开始报名
  3. R 笔记 prophet
  4. 点击定位到指定位置_以三菱PLC来举例说明相对定位与绝对定位指令
  5. 小女子需要各位博友帮忙—— 一个关于JS 动态表格合并拆分问题
  6. java idea连数据库报错:Server returns invalid timezone. Go to 'Advanced' tab and set 'serverTimezone'时区错误
  7. ASP.Net防范XSS漏洞攻击的利器HtmlSanitizer
  8. [css] 如何取消从父级元素继承下来的CSS样式呢?
  9. 企业数字化转型过程中,如何真正把数据用起来、用的对、用的好?
  10. 使用arguments对象模拟函数重载
  11. hackmyvm之warez
  12. 2.74-写出具有如下原型的函数的代码:
  13. ubuntu 10.10 安装google拼音输入法 并实现光标跟随
  14. 软件开发工具【十】 之 调试程序
  15. 网络编程--探讨一些边界条件
  16. html怎么把字做成动画效果,用纯CSS实现文字的动态效果
  17. PyCharm 创建纯Python项目
  18. Failure [INSTALL_FAILED_UPDATE_INCOMPATIBLE]
  19. tableau连接MySQL
  20. c语言错误 243什么意思,c语言编译后[Error] stray apos;\243apos; in program

热门文章

  1. iptables 转发oracle端口
  2. C#中使用委托、接口、匿名方法、泛型委托实现加减乘除算法
  3. 选中文字改变默认颜色
  4. 160525、高并发之mysql主从复制(linux)
  5. DIV+CSS常见问题的14条原因分析
  6. Spring3 文件上传
  7. 关于在html中正常,在aspx中乱码的问题
  8. suse11.3下samba服务的配置
  9. Python任务调度模块 – APScheduler,Flask-APScheduler实现定时任务
  10. 记录一次无聊的(经历了Nodejs - Shell - C)的探索问题过程