2023年泰迪杯数据挖掘挑战赛B题--产品订单数据分析与需求预测(2.数据探索性分析)
前言
继续上一片数据预处理进行续写,利用预处理之后的数据进行数据分析并且解决问题一相关的问题。问题一主要目的是让研究各种因素对于需求量的影响,然后找到确定影响需求量的主要因素并且进行数据分析和主要特征抽取。
对于问题提出的八个小问,可以以具体几个问题进行分析,后续都可以采用一样的分析流程
1.不同变量之间的线性相关性分析
根据上图可以得到销售总价与需求量有0.85的相关,线上销售与所在地区0.64的相关,销售产品类型与销售量有0.1相关线下与所在地区-0.64相关。
整体上需求量主要和产品价格,产品销售总价,是否工作日,产品大类等存在显著的线性相关关系
1.产品价格对需求的影响
根据上面的相关性分析已经可以得到产品需求与产品价格存在显著的线性负相关关系,也就是价格越高,需求越低,下面利用双变量分析法来进一步分析
利用线性回归模型来研究产品需求随着价格的变化趋势。
根据上面的相关性分析已经可以得到产品需求与产品价格存在显著的线性负相关关系,也就是价格越高,需求越低,线性回归以及双变量分析结果都可以很好的描述这种负相关关系
2.产品所在区域对于需求的影响
利用单因素方差分析法来定量研究不同区域对于需求量是存在显著性差异的,这种差异可以从总量和均值两个方面来阐述。
后面的几个分析小问题都可以采用上面的一些可视化+定量分析的模式来阐述各种影响因素对于需求量的影响,从而可以确定出主要的影响变量进行分析。文章待续。。。,后续进行预测模型的训练和对比分析
3.源码分享
附上2023年泰迪杯数据挖掘挑战赛B题全部源码(包括预测模型的训练)连接如下:
2023年泰迪杯b题全部源码
2023年泰迪杯数据挖掘挑战赛B题--产品订单数据分析与需求预测(2.数据探索性分析)相关推荐
- 2023年泰迪杯数据挖掘挑战赛B题--产品订单数据分析与需求预测(1.数据处理)
1. 前言 本题相对来说比较适合新手,包括针对数据的预处理,数据分析,特征提取以及模型训练等多个步骤,完整的做下来是可以学到很多东西的. 2.问题一思路分析 本题要求利用附件中的训练数据进行深入的分析 ...
- 泰迪杯数据挖掘挑战赛C题 通用论坛正文提取
参与第五届泰迪杯,侥幸获得二等奖,简单记录一下. 一.问题的背景 在当今的大数据时代里,伴随着互联网和移动互联网的高速发展,人们产生的数据总量呈现急剧增长的趋势,当前大约每六个月互联网中产生的数据总量 ...
- 第八届“泰迪杯”数据挖掘挑战赛C题“泰迪杯”奖论文(基于卷积神经网络及集成学习的网络问政平台留言文本挖掘与分析)
目 录 第一章 引言 1.1挖掘背景 1.2挖掘意义 1.3问题描述 第二章 群众留言分类 2.1数据准备 2.1.1数据描述 2.1.2数据预处理 2.2特征提取 2.3建立模型 2.3.1卷积神经 ...
- 【第十一届“泰迪杯”数据挖掘挑战赛】泰迪杯c题爬虫采集数据(源码+数据)
["第十一届"泰迪杯"数据挖掘挑战赛-- C 题:泰迪内推平台招聘与求职双向推荐系统构建(采集数据)] 问题: 数据详情: 根据工作id获取详细数据(1571条).csv ...
- 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 23页论文及实现代码
[2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 23页论文及实现代码 相关链接 (1)建模方案 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预 ...
- 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一
相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 ...
- 【2023年第十一届泰迪杯数据挖掘挑战赛】C题:泰迪内推平台招聘与求职双向推荐系统构建 建模及python代码详解 问题一
相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]C题泰迪内推平台招聘与求职双向推荐系统构建 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]C题泰迪内推平台招聘与求职 ...
- 【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题二
相关链接 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一 [2023年第十一届泰迪杯数据挖掘挑战赛]B题:产品订单的数据分析与需求预测 ...
- 【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码
[2023年第十一届泰迪杯数据挖掘挑战赛]A题:新冠疫情防控数据的分析 32页和40页论文及实现代码 相关链接 (1)建模方案 [2023年第十一届泰迪杯数据挖掘挑战赛]A题:新冠疫情防控数据的分析 ...
最新文章
- 实例理解q—learning-Python强化学习
- 限制服务器访问指定网站,如何允许或限制某一国或地区的用户访问网站
- P6139-[模板]广义后缀自动机(广义 SAM)
- WPF Slider设置整数
- 百度普通收录正式下线,大量草根站长收录难
- 惠普HP Photosmart C4200 打印机驱动
- 制作粉色少女系列 生日快乐祝福网页(HTML+CSS+JS)
- python傅里叶谐波分析_利用傅里叶谐波分析法的时序数据周期迭代辨识算法
- 水果忍者 java_水果忍者v1.7.2
- STM32硬核DIY机械键盘|蓝牙USB双模|灯控
- 安卓平台模拟软件绑定的手机(号码)以及地理位置
- Arduino学习笔记——IED界面和设置
- 极客”一词,来自于美国俚语“geek”的音译,一般理解为性格古怪的人
- Tomcat - 解决which must be escaped when used within the value错误
- 学一点Wi-Fi: CCMP
- 统计员工业绩app_统计员工业绩app
- Apache ShardingSphere 5.0.0-alpha版本发布
- win7电脑台式机如何调整屏幕亮度
- 熊猫TV王者荣耀主播人气TOP10
- java中t_java中的'\t'是什么意思?