说到数据分析,首先,我们要知道,什么叫数据分析。其实从数据到信息的这个过程,就是数据分析。数据本身并没有什么价值,有价值的是我们从数据中提取出来的信息。啤酒和尿布的例子大家应该都听腻了。再具体、深入一些的内容,往往因为数学就令很多人望而却步了。CPDA数据分析师给大家分享9个不带数学推导的数据分析方法,希望大家能喜欢~来一起学习数据分析方法吧!

1.分类

  分类分析的目标是:给一批人(或者物)分成几个类别,或者预测他们属于每个类别的概率大小。

  举个栗子:“京东的用户中,有哪些会在618中下单?”这就是个典型的二分类问题:买or不买。

  分类分析(根据历史信息)会产出一个模型,来预测一个新的人(或物)会属于哪个类别,或者属于某个类别的概率。结果会有两种形式:

  形式1:京东的所有用户中分为两类,要么会买,要么不会买。

  形式2:每个用户有一个“会买”,或者“不会买”的概率(显然这两个是等效的)。“会买”的概率越大,我们认为这个用户越有可能下单。

  如果为形式2画一道线,比如0.5,大于0.5是买,小于0.5是不买,形式2就转变成形式1了。

2.回归

  回归任务的目标是:给每个人(或物)根据一些属性变量来产出一个数字(来衡量他的好坏)。

  举个栗子:每个用户在618会为京东下单多少钱的?

  注意回归和分类的区别在:分类产出的结果是固定的几个选项之一,而回归的结果是连续的数字,可能的取值是无限多的。

3.聚类

  聚类任务的目标是:给定一批人(或物),在不指定目标的前提下,看看哪些人(或物)之间更接近。

  注意聚类和上面的分类和回归的本质区别:分类和回归都会有一个给定的目标(是否下单,贷款是否违约,房屋价格等等),聚类是没有给定目标的。

  举个栗子:给定一批用户的购买记录,有没有可能分成几种类型?(零食狂魔,电子爱好者,美妆达人……)

4.相似匹配

  相似匹配任务的目标是:根据已知数据,判断哪些人(或物)跟特定的一个(一批)人(或物)更相似。

  举个栗子:已知一批在去年双十一下单超过10000元的用户,哪些用户跟他们比较相似?

5.频繁集发现

  频繁集发现的目标是:找出经常共同出现的人(或物)。这就是大名鼎鼎的“啤酒和尿布”的例子了。这个例子太容易扩展,就不再举栗子啦。

6.统计(属性、行为、状态)描述

  统计描述任务的目标是最好理解的:具有哪些属性的人(或物)在什么状态下做什么什么事情。

  举个栗子:5月份一个月内每个用户在京东7天内无条件退货的次数

  统计描述常常用户欺诈检测,试想一个用户一个月退货100+次,这会是一种什么情况?

7.连接预测

  连接预测的目标是:预测本应该有联系(暂时还没有)的人(或物)。

  举个栗子:你可能认识xxx?你可能想看xxx?

8.数据压缩

  数据压缩的目的是:减少数据集规模,增加信息密度。

  举个栗子:豆瓣想分析用户关于国外电影的喜好,讲国内电影的评分数据都排除掉

  大数据,也不是数据越多越好,数据多带来的信息多,但是噪声也会变多。

9.因果分析

  顾名思义,因果分析的目标是:找出事物间相互影响的关系。

  举个栗子:广告的效果提升的原因是广告内容好?还是投放到了更精准的用户?

  这里最常见的手段就是A/Btest啦,大家肯定都不陌生。

相信大家已经掌握了基础的数据分析方法,按照这个思路可以多做一些练习,就能熟练应用了。

生活中我们每天都在产生数据,数据,让一切有迹可循,让一切有源可溯。数据分析是非常强大的,不过当然还是要在具体的情景下,严格的选择假设,采用科学的分析方法才能产出有价值的结果。

人人都应该掌握的9种数据分析方法相关推荐

  1. 人人都应该掌握的9种数据分析思维

    说到数据分析,啤酒和尿布的例子大家应该都听腻了.再具体.深入一些的内容,往往因为数学就令很多人望而却步了.给大家分享9个不带数学推导的数据分析思路,希望大家能喜欢~ 1.分类 分类分析的目标是:给一批 ...

  2. CPDA|产品运营经常用到的几种数据分析方法

    产品运营的数据分析是最务实的,哪些些工具和方法能怎样优化转化率?哪些能真正带来业务和效率提升? 今天,小编来给大家分享产品运营经常用到的几种数据分析方法,希望对大家有所帮助. 用户分群 针对符合某种特 ...

  3. 首席新媒体黎想教程:产品运营必会的3种数据分析方法!

    "产品运营到底是何方品种?" "产品运营是负责做产品的吗?" "如果产品运营也负责产品工作的话,那么产品经理岗位又是干什么的?" " ...

  4. w ndows10怎么联网,windows10所有uwp应用都无法联网的两种解决方法

    使用win10系统的用户变得越来越多了,因为他们反馈的电脑问题也变多了.比如,近期一位使用win10系统的的用户遇到了电脑所有uwp应用全部无法联网的问题,桌面应用都可以正常上网,这是怎么回事呢?接下 ...

  5. 计算机桌面都有说明,电脑桌面上所有图标都消失了的四种处理方法

    有些小伙伴们还不会处理电脑桌面上所有图标都消失了的问题,今天小编就带来了关于电脑桌面上所有图标都消失了的四种处理方法.快来学习吧! 电脑桌面上所有图标都消失了的四种处理方法 方法一:首先我们要看桌面上 ...

  6. spss分析qpcr数据_实时荧光定量PCR的三种数据分析方法比较.doc

    窑128窑热带病与寄生虫学 圆园12 年第 10 卷第 3 期 允燥怎则灶葬造 燥枣 栽则燥责蚤糟葬造 阅蚤泽藻葬泽藻泽 葬灶凿 孕葬则葬泽蚤贼燥造燥早赠 圆园12援 V燥l 10. 晕燥 3 doi ...

  7. 大数据开发之常见九种数据分析方法

    今天老师给大家分享一篇关于大数据开发常见的9种数据分析方法,首先数据分析是从数据中提取有价值信息的过程,过程中需要对数据进行各种处理和归类,只有掌握了正确的数据分类方法和数据处理模式,才能起到事半功倍 ...

  8. 数据分析师必须会python_数据分析师必须掌握的9种数据分析方法

    数据分析师的核心工作在于数据挖掘.数据处理.数据分析以及总结汇报等.每个环节都体现数据分析师相对应的工作技能.对于核心的数据分析环节.都有哪些常用的方法呢?如何才能提高数据分析的效率呢?在此为大家提供 ...

  9. 数据包络分析方法与maxdea软件_SEM常用的4种数据分析方法,让你的优化工作事半功倍!...

    数据分析在 SEM 中是最为基础的技能,说得简单点,数据分析就是为了发现问题,并为解决问题提供数据参考. 有经验的 SEMer 都知道,尽信数据则不如无数据.数据就躺在哪里,关键在分析之前,你之前要 ...

最新文章

  1. 独家 | Python 3.10发布——你应该知道的五大新特性
  2. 深度学习和目标检测系列教程 9-300:TorchVision和Albumentation性能对比,如何使用Albumentation对图片数据做数据增强
  3. boost::hana::make_set用法的测试程序
  4. Java并发编程笔记之LinkedBlockingQueue源码探究
  5. VHDL中的分辨函数
  6. oracle+mybatis查询遇到CHAR类型字段
  7. JS闭包的简单理解。优缺点以及垃圾回收机制
  8. bootstrap 页面垂直居中_前端布局之——水平垂直居中
  9. odoo开发笔记 -- 翻译机制及导入.po文件
  10. matlab 中 diff 函数 cumsum 函数 logical 函数 tabulate 函数 使用方法
  11. windows安装使用SQLlite并在C#调用SQLlite开发
  12. 街头篮球服务器维护,街头篮球官方网站
  13. UCT(信心上限树算法)解四子棋问题——蒙特卡罗法模拟人机博弈
  14. 【软件定义汽车】-【架构篇】-迈向SOA软件架构,软件定义汽车成为现实
  15. 锐化pdf文件(图片形式)
  16. Esp32 spi slave配置
  17. SaaS Metrics 2.0 – A Guide to Measuring and Improving what Matters
  18. [附源码]java毕业设计小区物业管理系统论文
  19. sql新增字段语法报错:‘,‘ or PARTITION expected, got ‘COMMENT‘
  20. 京瓷晶振停产型号一览表

热门文章

  1. PyQt5系列教程(1)PyQt5常见模块
  2. 基于C语言实现简单的反向传播
  3. 软件测试之浦发银行面试题,来看看这些你都知道吗?
  4. 用C语言编写一个小游戏
  5. NC65合并报表公式设置举例
  6. openwrt 之 wifi选择编译
  7. acm算法有用吗?写给自己。
  8. 解决 [Errno 2] No such file or directory: ‘c:\\users\\user\\appdata\\roaming\\python\\python37\……等问题
  9. STM32的程序下载方式
  10. 任意汉字显示,给你的嵌入式系统(含MCU)装上字库