世界上最深入人心的数据分析工具,是Excel,在日本的程序员考试中,程序语言部分,是可以选择Excel表格工具作为考试选项的。可见其重要性。

数据分析的步骤:

  • 提出问题

  • 理解数据

  • 数据清洗

  • 构建模型

  • 数据可视化

Excel中的数据类型主要有:文本型,数值型,逻辑型。

如果右键单元格显示为常规型,表示和数据本身表示出的类型相同。

数值类型一般是右对齐的。

数据清洗

1. 选择子集

对列进行隐藏和再表示。

2. 列名重命名

直接对列名进行重新命名。

3. 删除重复值

数据选项卡,删除重复值,选择主键。

4. 缺失值处理

通过查看列的总数据数量进行比较是否缺失,如果发现缺失值,点击开始选项卡中的查找和选项,点击定位条件,选择空值找到缺失值。对其中的一个缺失值处进行填写,ctrl+enter使其他的空格也填入同样的值。

5. 一致化处理

进行单元格的复制和拆分处理,函数的运用。

几个重要的函数:

  • AVERAGE

  • FIND(要查找的字符串,字符串所在单元格)→返回一个数字,也就是位置。

  • LEFT/RIGHT(字符串所在的单元格,从左/右开始到要截取的字符数)

  • MID(字符串所在的单元格,开始位置数,截取长度)

  • LEN(单元格)→返回字符串的长度是个数字。

  • COUNT

  • IF(条件,条件成立值,条件不成立值)

  • VLOOKUP(查找目标,查找范围,返回列,精确0还是模糊1查找)

其他:

函数的复制:双击十字架

使用数据筛选功能,处理没有正确适应函数的单元格。

一般函数报错,可能是因为数值类型是文字类型的数字,因此无法计算。可以进行数据类型转换,或者使用单元格拆分处理进行转换。

6. 数据排序

排序可以使用开始菜单的排序和筛选功能。

数据透视表的原理:

Split(数据分组)→Apply(应用函数)→Combine(组合结果)

插入选项卡,选择数据透视表,选择新工作表,将需要进行数据分组的分析轴,拖入对应的行和列。

7. 异常值处理

找到不需要的数据,和异常的数据。

数据清洗后,将文本另存为清洗结果文本,方便后续使用。

构建模型

1. 使用数据透视表进行模型构建

构建后任意值右键,将值的显示方式设置为列汇总的百分比,可以改变显示方式。

2. 分析工具加载

文件选项卡,选项按钮,加载项按钮,选择跳转,加载宏中选择分析工具库,确定即可。

3. 描述统计分析

选择数据选项卡,选择数据分析按钮,弹出框中选择描述统计,输入选项即可生成新的统计表。

透视表中的值汇总依据,选择平均值。

日期处理

对日期的处理可以让我们提高工作效率。总结学习到的日期处理的小例子。

1. 购买年份和出生年份的差,求年龄。

A出生日期,B购买日期

=left(B1,4)-left(A1,4)

2. 日期差取整数。

=round((B1-A1)/365)

3. 如果业务要求取月份差,天数差,使用datedif函数。

又叫隐藏函数。Datedif(起始日期,结束日期,返回值)

返回年使用=datedif(B1,A1, "y"),其他还有返回月数的m和返回日数的d。

使用时,要注意,起始日期要小于结束日期,不然会返回错误。

动态计算到今天的天数等,可以再结束日期处使用today()。

电商数据分析

1. 重新熟悉一下数据字段

2. 对数据进行清理和整理

对商品购买表进行数据的简单清洗,主要是提取子集,对日期字段进行处理。

对婴儿信息表进行数据的简单清洗,主要是通过vlookup函数匹配购买日期,datedif函数算出年龄字段,以及对日期字段进行处理。

3. 描述统计分析

主要对购买量和婴儿年龄进行了统计。购买统计中的最大值为10000,暂做保留。

4. 使用数据透视表进行进一步分析

① 各个历史时间段内的购买数据分析

分年进行统计:可以看出2014年购买量达到峰值。

按照月份进行统计,可以看到各个年份11月12月购买量最大,推测是双十一双十二的影响。

② 对一级商品分类进行统计,可以看到编码为50018831的商品具有最高的购买量,可以针对此进行用户需求的分析。

③ 对婴儿年龄进行分析,可以看出,用户大部分集中在0~3岁,男性宝宝的用户量略微高于女性宝宝,少数用户没有记录年龄。

学习感悟

Excel是简单易于上手的分析工具,不需要复杂的安装,数据就可以在眼前通过各种形式表现出来,数据透视表更是功能强大堪比BI软件。简单一击就能将分析轴排布在右侧进行使用。

最初的印象是小看Excel的,对于自己不会的功能,总是以我不太懂Excel为借口蒙混过关,而通过学习发现,很多的大型公司也都在用Excel进行出色的分析。

另外关于数据分析的流程和思考方式,也非常实用,一切都要在实操中升华成自己的技能。遇到问题,发现问题,查找方法,积极交流,找到解决方案,无论是自己学习还是商业分析,都是很好用的方法论。

作者:SW字母妞
来源:简书

延伸阅读都说经典,同期群分析到底是个啥?    Pandas熟练?进来测测这50道题吧!    实战解读:数据分析,如何更进一步?
数据不吹牛读者群已经建立,后台回复“入群”,即可加入有趣讨论,交流数据干货
“还不错”

电商数据分析流程 | Excel实操相关推荐

  1. 电商数据分析--流程、方法

    1.通用型的数据分析入门思维,比如AARRR(海盗模型) 获取用户-->提高活跃度-->提高留存率-->获取营收-->自传播 2.实现数据分析的流程 深入业务-->构建指 ...

  2. 电商数据分析的方法、流程及场景

    电商数据分析的方法.流程及场景 数据分析流程:分析方向: 战略分析:根据行情.竞对.国家政策等外部因素制定战略. 业务分析:公司正常业务的数据分析. 产品分析:APP.平台.商品等分析. 增长分析:内 ...

  3. hive实训项目之电商数据分析

    hive实训项目---------电商数据分析 题干: 某大型电商公司从后台服务器收集到30W条的日志用户行为数据,经过数据初步清洗得到数据如下表sale_user.zip,假如你是该公司一员开发工程 ...

  4. EXCEL对电商数据分析

    EXCEL对电商数据分析 背景 ​ 随着互联网的发展,电商得利于科技的推动以一种线上交易通过快递邮件的方式来送到消费者手中达到最终的交易.电商平台的用户数量十分庞大,同时每天产生的数据也非常的多,对于 ...

  5. 电商数据分析--用户行为分析

    电商数据分析–用户行为分析 数据分析流程: 明确目的 获取数据 数据探索和预处理 分析数据 得出结论 验证结论 结果展现 用户行为是指用户在产品上产生的行为.(登陆.浏览.购买.加入购物车) 用户行为 ...

  6. Olist巴西电商数据分析(二)

    Olist巴西电商数据分析 上篇指路:https://blog.csdn.net/jlycd/article/details/113887419 文章目录 Olist巴西电商数据分析 项目背景 分析目 ...

  7. 电商数据分析常用报告指标

    大家好,我是小五???? 很多初入行的小伙伴们,学习了一堆的数据分析工具,如excel.sql.python.spss.r.tableau等. 工具用的很溜,但是对业务指标却不知情,面试的时候技术笔试 ...

  8. Spark 实时电商数据分析及可视化

    Spark 实时电商数据分析可视化系统是一个经典的大数据应用项目,技术栈主要有 Flume.Kafka.Spark Streaming.Flask 等,帮助大家了解和运用一些当前热门的大数据处理组件来 ...

  9. Amazon电商数据分析——数据获取

    最近一段时间主要重心在Amazon电商数据分析上,这是一个偏数据分析和可视化的项目.具体来说就是先获取Amazon的商品数据,数据清洗和持久化存储后作为我们自己的数据源.分析模块和可视化模块基于数据进 ...

最新文章

  1. Task03:青少年软件编程(Scratch)等级考试模拟卷(二级)
  2. python 试题答案_python试题答案
  3. [转] 没人把程序员当回事儿
  4. 【编程语言】Python-Pandas库中的透视表
  5. 轴承的Abaqus静态分析
  6. c语言偶数求和while,C语言中编程计算1至100以内的奇数和偶数并分别求和,求代码...
  7. 基于单片机的建筑工地降尘系统
  8. 翻译连载 | JavaScript轻量级函数式编程-第 8 章:列表操作 |《你不知道的JS》姊妹篇...
  9. win7 iis php mysql_windows7和iis配置的php phpinfo()中没有mysql组件
  10. Swift 语言的设计错误
  11. linux下repo文件的配置
  12. [shell脚本] realtek平台 Mifi初始化时候,初始化wifi的黑白名单的sh脚本
  13. 数据结构与算法之2-3-4树
  14. 用 Cloudreve 快速建设基于OSS的个人云盘
  15. draft伦理第三章
  16. 麦语言和python区别_GitHub - cedricporter/funcat: Funcat 将同花顺、通达信、文华财经麦语言等的公式写法移植到了 Python 中。...
  17. 看金融海啸是如何害死蚯蚓一家的(多图杀猫)
  18. 微信企业号开发三:主动调用模式之发送news消息
  19. 华南X79主板数码管数字说明
  20. 监听Redis 缓存过期(Key 失效)事件

热门文章

  1. Re:从零开始的DS学习之查找算法
  2. 正点原子stmf103zet6代码移植为stm32f103c8t6(库函数版)
  3. 文件Md5计算(C语言版)
  4. 广西行政村数据shp_广西自治区乡镇行政区划数据 精度1:10万
  5. SPI读取NRF24L01
  6. 惯性传感器实现全身姿态检测
  7. DLM 通讯初始化语句
  8. 安卓优质大作业 前后端 通讯+社区+志愿服务功能
  9. 从C/C++到Python(之二)(By Robinvane Suen)
  10. NOIP 2018 提高组初赛试题 题目+答案+简要解析