有这样一个小小的练习题:

卖电子商品的老板,每天记录了自己卖出的U盘,电脑支架,插座,电池,音箱,鼠标,usb数据线,手机充电线等数量,客户的需求是一方面,也可以通过客户购买关联性比较强的商品进行引导,以提高销量,比如:客户买了无线鼠标,你可以向他卖电池。

有些是可以通过我们的常识判断,但是怎么通过数据,客观地发现商品之间有没有相关性。机器学习可以通过关联规则Apriori算法挖掘,没有机器学习算法基础,怎么用统计学知识解决,本案例分享给大家。

目 录

1、问题描述

2、导入外部包,加载数据

3、相关性分析

4、绘图展示

1、问题描述

(1)使用pandas读取文件"销售记录.xlsx"中的数据;

(2)对各产品之间的销售情况做相关分析;

(3)找出相关系数最大的两类产品;

(4)画出相关系数最大的两类产品销售情况的拆线图(一张图内,不同颜色);

(5)实验报告内容包括:问题描述、代码、运行结果以及实验感想;

2、导入外部包,加载数据

加载数据

可以按到,数据总共29行,每天一行,11列,包括10中在售商品。数据很整齐,没有缺失,全部是数值型。

3、相关性分析

相关性,可以通过计算两个变量之间的相关性系数分析,两个变量之间的协方差和标准差的商。X和Y的相关性系数,数学计算公式如下:

相关系数,是一个介于1和-1之间的值,其中,1表示变量完全正相关,0表示无关,-1表示完全负相关:

0.8-1.0 极强相关

0.6-0.8 强相关

0.4-0.6 中等程度相关

0.2-0.4 弱相关

0.0-0.2 极弱相关或无相关

而Python有专门的函数计算相关性系数corr()函数。

相关性系数绘制的热力图如下,颜色越深表示相关性越强:

可以看出,相关性最强的是“鼠标”和“键盘”,中等程度相关,数据量如果足够大,可能更加准确。

如果不靠肉眼看,通过程序,如何选出相关性最强的产品?

如上,我们通过处理,同样得到,相关性最强的是“鼠标”和“键盘”。

4、绘图展示

通过上面相关性系数的计算,得出相关性最强的是“鼠标”和“键盘”,但是形象直观的呈现出来,两种产品销量是不是相关,需要绘制折线图。

通过绘制的折线图可以看出,两种产品的销量基本是同步变化的,一种增长(下降)的时候另一种也增长(下降)。

本例的数据仅有29条,如果增加数据量(样本数量),可能更具说服力。也符合业务场景,鼠标和键盘捆绑销售,或者买了键盘打折促销鼠标。^!^

python数据分析实验报告_Python数据分析综合小练习:销售数据分析相关推荐

  1. python数据分析实验报告_Python 数据分析入门实战

    本训练营中,我们将学习怎么样使用 Python 进行数据分析.课程将从数据分析基础开始,一步步深入讲解.从 Python 的基础用法到数据分析的各种算法,并结合各种实例,讲解数据分析过程中的方方面面. ...

  2. python股票数据分析实验报告_Python实验报告

    一. 实验原理 ( 要求.任务等 ) (一).Python的开发环境 Python诞生于20世纪90年代初,是一种解释型.面向对象.动态数据类型的高级程序设计语言,是最受欢迎的程序设计语言之一. 编写 ...

  3. python爬虫实践报告_Python 爬虫实践:浅谈数据分析岗位

    原标题:Python 爬虫实践:浅谈数据分析岗位 转自:法纳斯特 讲道理,pyspider确实是一款优秀的爬虫框架,我们可以利用它快速方便地实现一个页面的抓取. 不过带来便捷性的同时,也有它的局限性, ...

  4. 基于python的药店管理系统_Python实践案例:药店销售数据分析

    Python中用于处理大量数据的包主要是numpy和pandas,常用于提取以及分析大量数据的有用指标.而Python只是工具,最重要的是分析者对数据的分析思维及对业务指标的理解,利用有用工具对具体数 ...

  5. python爬虫实验报告_python爬虫实验

    原博文 2013-06-28 13:30 − 那天在新浪微博上看到北北出的题目,由于最近也在做类似的爬虫研究,所以就有了这个实验. 后来在QQ上和北北说了下,要求是啥都抓,就抓乌云的... 然后就开始 ...

  6. python万年历实验报告_Python编程——万年历

    2017年五月份日历 万年历这个题目几乎是不论学哪种编程语言必要尝试的一个小知识,综合了循环,逻辑关系判断等各编程语言的基础知识.今天我们一起用Python实现简单的万年历功能(查看某年各个月份日历和 ...

  7. python 销售数据分析输出表格_Python处理Excel数据实例--销售数据分析

    数据分析笼统来说,大概分为五个步骤:提出问题.理解数据.数据清洗.构建模型.数据可视化.在数据分析中,很基础又关键的一步就是数据清洗,对原始数据的处理会花掉整个分析过程的很大一部分时间,这是因为如果前 ...

  8. python外星人实验报告_Python 项目实践一(外星人入侵)第一篇

    python断断续续的学了一段实践,基础课程终于看完了,现在跟着做三个小项目,第一个是外星人入侵的小游戏: 一 Pygame pygame 是一组功能强大而有趣的模块,可用于管理图形,动画乃至声音,让 ...

  9. python投资分析实验报告_Python的实验报告怎么写?

    以面向对象程序设计实验为例: 一.实验目的了解面向对象程序设计思想 了解对象.类.封装.继承.方法.构造函数和析构函数基本概念 掌握定义类.成员变量.成员函数.静态变量和静态方法 掌握通过类定义实现继 ...

最新文章

  1. MySQL慢查询日志分析(二)
  2. The Swift Code之UITextField的使用,及事件委托
  3. hive值乘以0.01保留一位小数_Hive窗口函数01-SUM、MIN、MAX、AVG
  4. python 最小硬币数_程序以找到要在Python中达到目标的硬币组合数量
  5. mysql 四舍五入
  6. 【洛谷】【动态规划/二维背包】P1855 榨取kkksc03
  7. linux inode详解
  8. Gym 101775J Straight Master(差分数组)题解
  9. MYSQL 添加外键报错
  10. 当我谈跑步时我谈些什么——村上春树
  11. 企业数字化转型的加速引擎 — 2019年中国数字中台行业研究报告
  12. 亮度 调整_摄影后期必备!如何用亮度蒙版技术精准调整照片影调
  13. pycharm remote 远程项目 同步 本地_手把手教你Pycharm远程连接服务器端项目进行本地开发调试...
  14. Mac上设置图片或视频的默认打开软件的方法
  15. vue 时间插件_Vue插件丨vxe-table初体验
  16. CodeForces 621C Wet Shark and Flowers
  17. 周立功arm linux教程,极速搭建周立功IMX287A ARM Linux开发环境
  18. 常见的肾囊肿症状有哪些?
  19. postgresql中patroni集群备库手动还原后,hac启动日志比主库多1
  20. 第三章:fog(恐惧感 fear,责任感obligation,罪恶感guilty)

热门文章

  1. ASP.NET基本学习路线
  2. 3.3 Matplotlib Contours 等高线图
  3. linux入门教程[转贴]
  4. 【爬虫入门】股票数据爬取
  5. 简单几步优化你的windows,加快开机速度(重装windows之后要做的几件事)
  6. 血杀英雄为什么不显示服务器,不怕被禁吗?《血杀英雄》竟有这种东西
  7. Win11系统待机时总是蓝屏重启无效怎么解决?
  8. 中国兰炭市场现状分析与投资前景方向研究报告2022-2028年
  9. 武器系统软件测试,基于国产CPU及OS的装备软件测试设备开发平台ETestDev简介
  10. 批改网作文不允许粘贴