课程编号:400802020课程名称:数据分析与预测课程设计

考试形式:大作业设计答辩(非笔试)

一、设计考核说明

运用所学的机器学习知识,基于Python或R或C编程环境,根据下面给出的要求,选择相关分析设计内容,完成一个数据分析与预测案例实现,最终提交设计文档。提交的设计文档内容必须包括:数据预处理、模型构建、代码实现、结果分析。学生必须提前完成案例的实现与设计文档的撰写,并参加上机演示答辩。没能完成案例实现与设计文档撰写的同学,取消答辩资格。本次设计答辩考核作为该课程的考试考核。

二、具体要求:

  1. 学生在选题范围中选择设计题目(学生亦可自选择相关设计题目,但要求难度相当)。
  2. 学生必须单独完成设计工作。
  3. 要求按照数据分析与预测设计规范来撰写设计文档。文档每人一份。
  4. 设计文档要求内容完整,结构清晰,最终提交电子文档。电子文档命名参照以下规范:例如:【B08082021**张三数据挖掘设计文档】,要求保存为word 或wps文档。

三、设计题目选题表(数据以电子档给出)

题目1:心脏病的预测

心脏病是人类健康的头号杀手,每年全世界有1/3的死亡人口是由心脏病引起的,在我国每年有几十万人死于心脏病,通过体检数据建立一套心脏病预测系统是非常实用的。

本题研究的数据是真实的心脏病患者体检数据,为了能更好的预测,请分析数据(按照heart-disease.names中说明,用76个特征中的14个指定特征构建模型。以cleveland.data作为训练数据,以new.data作为测试数据),针对预测的目标及要求,构建合适的模型。

请根据提供的数据实现以下目标:

(1) 挑出指定特征的数据存储为新的文件(训练数据和测试数据都需处理);

(2) 利用(1)的数据构建心脏病预测模型;

(3) 该模型进行预测时准确率能达到75%以上。

题目2:雾霾天气成因分析

近几年国家和人民非常关心的一个话题是环境,大家都意识到环境的重要性,如今天气预报都包含了空气质量的信息。雾霾不光影响了人们的出行和娱乐,对人们的健康也有很大危害。如果人们能通过技术的手段找出引发雾霾天气的真凶,这将对治理雾霾有特别大的帮助。

国家气象局每天都会公布当日的天气状况,每个地区的各种污染物的指标,只需找出哪些污染物指标跟雾霾天气关联度最大,就可以找到引发雾霾天气的原因,从而可以有针对地治理。

本题要求如下:

(1) 采集某城市某年全年的空气指标;

(2) 依据采集数据挑选特征,构建模型挑选出影响雾霾成因的关键因素。

404 (csdn.net)

题目3: 混凝土的强度预测

在工程领域中,对建筑材料的性能有精确的估计至关重要。这些估计是必需的,以便制定安全准则来管理用于楼宇、桥梁和道路建设中的材料。

估计混泥土的强度是一个特别有趣的挑战。尽管混泥土几乎要用于每一个建设项目,但由于它各种成分的使用以复杂的方式相互作用,所以它的性能变化很大。因此,很难精确地预测它最终产品的强度。

本题给定一份材料成分清单,要求:

(1)挑选合适的模型预测混泥土强度;

(2)考虑预测值与真实值的相关性,评估模型性能并进行优化。

混凝土的强度预测原始数据-数据库文档类资源-CSDN下载

题目4:口红销量预测

美容界曾有一个著名的调查:“假如你只能拥有一个化妆品,你想要的的是什么产品?”95%以上的亚洲女性都选择了口红。为了让商家生产出更符合消费者的口红,提高其销售量,本题提供在京东网站上爬取的1600多条销售数据。在这诸多影响口红销量的影响因素中,分析哪些因素对口红销量至关重要,根据这些因素预测商家的销售量。

本题要求如下:

  1. 对提供的数据进行数据预处理(数据清洗,处理缺失值等等)
  2. 挑选合适的预测模型来预测商家的口红销售量。

404 (csdn.net)

题目5:钻石价格预测

年轻人在“钻石恒久远,一颗永流传”的广告营销下,在选择结婚戒指的时候,则不由自主的考虑钻石戒指。有需求就会有市场,于是钻石的价格也水涨船高。

  1. 在R中的ggplot2包中提取数据diamonds;
  2. 分别探讨克拉、颜色、切割等属性跟价格的关系
  3. 讨论多个属性跟价格的关系
  4. 预测carat为1.01,cut为ideal,color为E,clarity为VS2的钻石的价格,置信区间为0.95.

四、考核成绩构成

设计文档撰写:30%(考核点:问题需求的分析、文档撰写的结构层次、原理知识阐述、实验过程描述等)

上机演示答辩:70%(考核点:功能演示、原理分析、问题回答)

大作业文档结构参考

数据分析与预测课程设计

题目:****************

学号:****************

姓名:****************

一、任务背景

二、数据分析与预测目标

三、数据预处理及分析

四、模型构建与评价

五、总结

数据分析与预测课程设计相关推荐

  1. 淘宝双11数据分析与预测课程案例—步骤四:利用Spark预测回头客行为代码报错

    在练习林子雨老师的"淘宝双11数据分析与预测课程案例-步骤四:利用Spark预测回头客行为"章节时出现了代码报错. 具体在执行"val model = SVMWithSG ...

  2. 【机器学习和数据分析与可视化课程设计】基于天气预报的数据分析与可视化课程设计(Python实现)

    前言 天气预报我们每天都会关注,天气情况会影响到我们日常的增减衣物.出行安排等.每天的气温.相对湿度.降水量以及风向风速是关注的焦点.数据可视化方面,使用matplotlib.numpy.pandas ...

  3. 淘宝双11数据分析与预测课程案例:实验环境搭配

    1 软件安装清单 安装Hadoop 安装MySQL 安装Hive 安装Sqoop 安装Eclipse 安装ECharts 2 hadoop安装 hadoop在centos的伪分布式安装 3 MySql ...

  4. 大数据-11-案例演习-淘宝双11数据分析与预测

    主要摘自 http://dblab.xmu.edu.cn/post/8116/ 案例简介 Spark课程实验案例:淘宝双11数据分析与预测课程案例,由厦门大学数据库实验室团队开发,旨在满足全国高校大数 ...

  5. 淘宝双11数据分析与预测

    淘宝双11数据分析与预测 一. 案例简介 Spark课程实验案例:淘宝双11数据分析与预测课程案例,由厦门大学数据库实验室团队开发,旨在满足全国高校大数据教学对实验案例的迫切需求.本案例涉及数据预处理 ...

  6. Python课程设计大作业:获取比赛数据并进行机器学习智能预测NBA的比赛结果

    前言 该篇是之前遗漏的大三上的Python课程设计.刚好今天有空就补发了一篇文章.全部的代码在最后附录中.爬虫类的代码直接全部放到一起了,读者可以自行研究.百度网盘可以私聊我进行获取. 一.课程设计项 ...

  7. Python数据处理课程设计-房屋价格预测

    注:可能有些图片未能成功上传,可在文档处进行下载 链接:Python数据处理课程设计-房屋价格预测-机器学习文档类资源-CSDN下载 课程设计报告 课程名称 Python数据处理课程设计 项目名称 房 ...

  8. 转:大数据处理与开发课程设计——纽约出租车大数据分析

    ​​​​​​大数据处理与开发课程设计--纽约出租车大数据分析_LHR13的博客-CSDN博客_出租车大数据分析 一.设计目的 综合应用所学的Hadoop/Spark/Storm/Mongdb等技术,设 ...

  9. 数据可视化课程设计——北京新发地官网数据分析与可视化展示【内容在jupyter notebook里面展示】包含数据爬取与可视化分析详解

    目录 一.课题说明 1.1.设计原因: 1.2.设计目标: 1.3.开发环境: 1.4.爬取网站链接 二.准备工作 2.1.数据获取: 2.2.爬取的数据说明: 2.3.爬虫程序设计的思路: 三.详细 ...

  10. 【毕业设计_课程设计】基于Spark网易云音乐数据分析

    文章目录 0 项目说明 1 系统模块 2 分析内容 3 界面展示 4 项目工程 0 项目说明 基于Spark网易云音乐数据分析 提示:适合用于课程设计或毕业设计,工作量达标,源码开放 1 系统模块 包 ...

最新文章

  1. labuladong的算法小抄pdf_推荐两个学算法的 GitHub 项目
  2. ueditor1.4.3jsp版成功上传图片后却回显不出来与在线管理显示不出图片的解决方案...
  3. 仍在警告:配置“编译”已过时,并已由“实现”代替
  4. 华为P30Pro国外采用4根天线设计,为何国内却只有2根?
  5. 《计算机组成原理》课程设计报告——TEC-2实验系统——微程序设计
  6. java 创建文件夹的方法_Java创建文件夹的方法
  7. 计算机图形学跳一跳_“跳一跳”刷不到第一?试试这几个微信小游戏!
  8. 计算机公共基础知识实验报告,20140902413 李雪瑞 计算机工程系实验报告345.docx...
  9. linux下查看某软件是否已安装, ubuntu安装deb包
  10. 云南科软信息科技有限公司
  11. 顺序表的简单操作代码(c++实现)
  12. python 过采样算法_类不平衡数据分类准确率的提升算法smote过采样方法
  13. 360校招 求立方体表面积
  14. 如何修改PDF,怎么给PDF加页码
  15. 数据分析可视化- 十三朝古都西安
  16. Mac动画交互设计软件Principle
  17. Vue实例--音乐播放器:歌单数据接口分析
  18. 微博图片去水印,自动去处微博图片水印方法
  19. 关于iTunes connect审核“Missing or invalid signature”的问题
  20. Vi下编辑和退出编辑方法

热门文章

  1. VS配置OpenCV教程(超详细)
  2. 资源收集:2020年11月行政区划代码
  3. OneNote for win10防止英文自动切换字体工具
  4. 信息与通信工程学科面试准备——信号与系统
  5. html动态线条背景鼠标,动态背景线条鼠标移动线条汇聚---背景特效
  6. 计算机系统结构——考题
  7. 其他干货——如何做科学报告(oral, poster, eLightning)
  8. 各省简称 拼音 缩写_中国省会城市拼音名称及缩写
  9. 无法加载oracle驱动程序998,无法加载oracle in oradb10g_home2 odbc驱动程序的安装例程,因为存在系统错误代码998 解决方法...
  10. 研磨设计模式--简单工厂