2021 年“泰迪杯”数据分析技能赛 B 题 肥料登记数据分析 (视频讲解+解题源码)、数据挖掘、数据分析实战

前言:

整理了2021 年“泰迪杯”数据分析技能赛 B 题,代码丰富,pyecharts画图、k-means聚类、re正则匹配等,加上难度最大的任务4的视频讲解,是数据分析挖掘入门后具有实践意义的实战锻炼项目,备战11月的泰迪杯数据分析技能赛的利器。

源码下载:

代码获取: https://mianbaoduo.com/o/bread/Yp2Tk5tp

题目:

任务 1 数据的预处理

任务 1.1 附件 1 的产品通用名称存在不规范的情况。请按照复混肥料(掺 混肥料归入这一类)、有机-无机复混肥料、有机肥料和床土调酸剂这 4 种类别 对附件 1 进行规范化处理。请在报告中给出处理思路、过程及必要的结果,同时 将完整的结果保存到文件“result1_1.xlsx”中。

任务 1.2 计算附件 1 中各肥料产品的氮、磷、钾养分百分比之和,称为总 无机养分百分比。请在报告中给出处理思路、过程及必要的结果,同时将完整的 结果保存到文件“result1_2.xlsx”中,结果保留 3 位小数(例如 1.0%,即 0.010)。

任务 2 肥料产品的数据分析

任务 2.1 从附件 2 中筛选出复混肥料的产品,将所有复混肥料按照总无机 养分百分比的取值等距分为 10 组。根据每个产品所在的分组,为其打上分组标 签(标签用 1~10 表示),将完整的结果保存到文件“result2_1.xlsx”中。分析复 混肥料产品的分布特点,在报告中绘制产品登记数量的直方图,给出处理思路及 过程,并按登记数量从大到小列出登记数量最大的前 3 个分组及相应的产品登记 数量。

任务 2.2 从附件 2 中筛选出有机肥料的产品,将产品按照总无机养分百分 比和有机质百分比分别等距分为 10 组,并为每个产品打上分组标签 (1,1), (1,2), ⋯, (10,10),将完整的结果保存到文件“result2_2.xlsx”中。请在报告中给出处理 思路及过程,并根据分组情况绘制有机肥料产品的分布热力图,其中横轴代表总 无机养分分组,纵轴代表有机质分组。在此基础上,分析有机肥料产品的分布特 点,并按登记数量从大到小列出登记数量最大的前 3 个分组及相应的产品登记数 量。

任务 2.3 从附件 2 中筛选出复混肥料的产品,按照氮、磷、钾养分的百分 比,使用聚类算法将这些产品分为 4 类。根据聚类结果为每个产品打上聚类标签 (标签用 1~4 表示),并将完整的结果保存到文件“result2_3.xlsx”中。请在报 告中给出处理思路及过程,根据聚类标签绘制肥料产品的三维散点图和散点图矩 阵,并通过绘制聚类结果的雷达图分析每个聚类的特征。

任务 3 肥料产品的多维度对比分析

任务 3.1 从文件“result2_1.xlsx”中提取发证日期中的年份,分析比较复混 肥料中各组别不同年份产品登记数量的变化趋势。请在报告中给出处理思路及分 析过程,使用合适的图表对结果进行可视化。

任务 3.2 从文件“result2_2.xlsx”中提取 2021 年 9 月 30 日仍有效的有机 肥料产品,将完整的结果保存到文件“result3_2.xlsx”中。从有效产品中分别筛 选出广西和湖北(根据正式登记证号区分)产品登记数量在前 5 的组别,分析两 个省份上述组别的分布差异。请在报告中给出处理过程及分析结果。

任务 3.3 从附件 3 中提取产品登记数量大于 10 的肥料企业,给出这些企业 所用到的原料集合(发酵菌剂除外)。以各企业用到的原料作为特征,计算企业 之间的杰卡德相似系数矩阵,并将结果(保留4位小数)保存到文件“result3_3.xlsx”

任务 4 肥料产品的多维度对比分析

任务 4.1 设计算法或处理流程,从附件 4 技术指标中提取出氮、磷、钾养 分和有机质的百分比,以及肥料含氯的程度。请在报告中给出处理思路及过程, 并将结果保存到文件“result4_1.xlsx”中。 注 如果技术指标中只给出总养分百分比(“≥”按照“=”处理)而无明 细数据,则氮、磷、钾养分的百分比按照总百分比的 1/3 来计算,结果保留 3 位 小数(例如 1.0%,即 0.010)。复混肥料属于无机肥料,它的有机质百分比设定 为 0。含氯情况分为“无氯”、“低氯”、“中氯”和“高氯”4 种。如果肥料 产品的技术指标中没有给出含氯情况,则视为“无氯”;如果注明“含氯”,则 视为“低氯”。

任务 4.2 设计算法或处理流程,从附件 4 原料与百分比中提取各种原料的 名称及其百分比。请在报告中给出处理思路及过程,并将结果保存到文件 “result4_2.xlsx”中

资源包预览:

2021 年“泰迪杯”数据分析技能赛 B 题 肥料登记数据分析 (视频讲解+解题源码)、数据挖掘、数据分析实战相关推荐

  1. 2021泰迪杯数据分析技能赛B题-肥料登记数据分析

    调用模块: import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns p ...

  2. 2022泰迪杯数据分析技能赛B题方案及赛后总结:银行客户忠诚度分析

    第五届"泰迪杯"数据分析技能赛(B题)『一等奖』,@队友:东可在编程.好同志歪歪 B题题目为"银行客户忠诚度分析",题目给出了短期客户产品购买数据"s ...

  3. 2022第五届“泰迪杯”数据分析技能赛-B题-银行客户忠诚度分析(下)

    2022第五届"泰迪杯"数据分析技能赛-B题-银行客户忠诚度分析(上)链接:https://blog.csdn.net/weixin_60200880/article/detail ...

  4. 2022第五届“泰迪杯”数据分析技能赛-B题-银行客户忠诚度分析(上)

    新手参加比赛,不足之处敬请谅解 题目链接:链接:https://pan.baidu.com/s/1x1U-kobvPjNMm8xnvS9Gdg  提取码:7id3 目录 任务1 数据探索与清洗 任务1 ...

  5. 2022年”泰迪杯“数据分析技能赛B题:银行客户忠诚度分析

    A题和B题我们小组都做了,最终A题二等奖,B题一等奖.总结写在最前面,泰迪杯技能赛不像数学建模比赛,所有的问题具有引导性,但一天完成建模和论文也不是一件容易的事,如果想要通过Python实现分析,需要 ...

  6. 2022第五届“泰迪杯”数据分析技能赛-B题-银行客户忠诚度分析

    目录 任务1 数据探索与清洗 任务1.1 任务1.2 任务2 产品销售数据可视化分析 任务2.1 任务3 客户流失因素可视化分析 任务3.1 任务3.2 任务3.3 任务3.4 任务4 特征构建 任务 ...

  7. 泰迪杯挑战赛优秀论文-A题-基于数据挖掘的上市公司高送转预测

    目 录 第 1 章 绪论 1.1问题背景 1.2问题重述 1.3本文主要工作与创新点 1.4模型假设 1.5本文研究意义 第 2 章 相关理论 2.1高送转相关知识介绍 2.1.1高送转的实质 2.1 ...

  8. 第五届“泰迪杯”数据分析技能赛 经验代码分享

    第五届"泰迪杯"数据分析技能赛 经验/代码分享 品牌:"泰迪杯"数据分析技能赛 组织单位:泰迪杯数据分析技能赛组织委员会.广东泰迪智能科技股份有限公司.广东省工 ...

  9. 第五届“泰迪杯”数据分析技能赛

    为推广我国高校数据分析实践教学,培养学生数据分析的应用和创新能力,增加校企交流合作和信息共享,提升我国高校的教学质量和企业的竞争能力,"泰迪杯"数据分析技能赛(以下简称竞赛)于20 ...

最新文章

  1. java 执行 cmd 命令(转)
  2. 图像五值化与基于三值图像的车牌识别(1)
  3. 【django】项目开发准备【1】
  4. bzoj4665: 小w的喜糖
  5. 什么是服务器的SSL PSE
  6. python3.7.1使用_使用python3和pytorch1.7.1运行dface
  7. docker集群搭建(k8s)
  8. 尝试改写新浪网分类资讯爬虫2
  9. 力扣529.扫雷游戏
  10. UI模板素材|教你App中的页面指示器要如何设计
  11. Android TextView 实现文字大小不同和文字颜色不同
  12. 机器学习知识体系 (强烈推荐)
  13. 04 分布式文件系统以及MapReduce入门程序
  14. 虚拟机的显示屏幕修改大小
  15. 〖Python零基础入门篇(60)〗 - 随机模块 - random
  16. 易语言json置入_易语言取置JSON文本使用方法-易语言学习-猴子技术宅
  17. 高光谱遥感数值建模技术及在植被、水体、土壤信息提取领域中的应用
  18. 极验滑块轨迹生成 3、4通用
  19. XBEE XCTU 简易说明
  20. POJ 1094拓补排序

热门文章

  1. 简单一步,轻松下载B站视频 | 实用技能get
  2. 目标检测-YOLO算法实现
  3. sqlplus命令无需监听服务就可以登录本地数据库的登录方式的研究
  4. 美元下跌加速多头反攻 黄金收涨成功突破1800
  5. 计算机毕设太简单会不会过不了 SSM公司设备管理系统 企业员工工资管理系统 公司员工工资管理系统Java
  6. 【算法】25匹马,每次最多赛5匹,最少几次可以赛出前三名?
  7. R语言统计分析:bootstrap方法
  8. Python技法之简单递归下降Parser的实现方法
  9. VL19-使用38译码器实现逻辑函数!L=(~A)·C+A·B
  10. Python可变数据与不可变数据类型