.

'.

数据预处理

一、

实验原理

预处理方法基本方法

1

、数据清洗

去掉噪声和无关数据

2

、数据集成

将多个数据源中的数据结合起来存放在一个一致的数据存储中

3

、数据变换

把原始数据转换成为适合数据挖掘的形式

4

、数据归约

主要方法包括

:

数据立方体聚集,维归约,数据压缩,数值归约,离散化和概念分层等

二、

实验目的

掌握数据预处理的基本方法。

三、

实验内容

1

R

语言初步认识(掌握

R

程序运行环境)

2

实验数据预处理。

(掌握

R

语言中数据预处理的使用)

对给定的测试用例数据集,进行以下操作。

1

)

、加载程序,熟悉各按钮的功能。

2

)

、熟悉各函数的功能,运行程序,并对程序进行分析。

对餐饮销量数据进统计量分析,求销量数据均值、中位数、极差、标准差,变异系

数和四分位数间距。

对餐饮企业菜品的盈利贡献度(即菜品盈利帕累托分析)

,画出帕累托图。

3

)数据预处理

缺省值的处理:用均值替换、回归查补和多重查补对缺省值进行处理

对连续属性离散化:用等频、等宽等方法对数据进行离散化处理

四、

实验步骤

1

R

语言运行环境的安装配置和简单使用

(

1

)

安装

R

语言

R

语言下载安装包,然后进行默认安装,然后安装

RStudio

工具

(

2

)

R

语言控制台的使用

1.2.1

查看帮助文档

基于python的数据挖掘实验报告_数据挖掘实验报告一相关推荐

  1. python毕业设计开题报告-基于python爬虫的影评情感分析研究开题报告

    论文(设计)题目 基于python爬虫的影评情感分析研究开题报告 选题的背景.意义及研究现状: 研究现状: 文本情感分析又称倾向性分析.情感挖掘,主观分析或评论挖掘,是对带有情感色彩的评论文本内容进行 ...

  2. 基于Python个人博客系统设计与实现 开题报告

      本科生毕业论文 基于python个人博客系统Django框架 开题报告 学    院: 专    业: 计算机科学与技术 年    级: 学生姓名: 指导教师: 黄菊华   XXXX大学本科生毕业 ...

  3. 基于python分析航空公司客户价值《数据挖掘》 课程实验报告

    一.实验目的 1)了解K-Means 聚类算法在客户价值分析实例中的应用. 2)利用pandas快速实现数据z-score(标准差)标准化以及用scikit-learn 的聚类库实现K-Means聚类 ...

  4. 基于python的毕设难吗_毕设做个小程序 毕业设计做小程序难吗

    打算用Python做毕业设计,可以做哪些方面的? Python做毕业设计,我想谈谈我的看法,供大家参考: 1.Python web前端.您可以使用python开发网站. 2.Python网络爬虫.您可 ...

  5. 基于Python小说电子书阅读系统设计与实现 开题报告

      本科生毕业论文 基于Python电子书阅读系统Django框架 开题报告 学    院: 专    业: 计算机科学与技术 年    级: 学生姓名: 指导教师: 黄菊华   XXXX大学本科生毕 ...

  6. 基于Python运动场地预约系统设计与实现 开题报告

      本科生毕业论文 基于Python校园运动场地预约系统(Django框架) 开题报告 学    院: 专    业: 计算机科学与技术 年    级: 学生姓名: 指导教师: 黄菊华   XXXX大 ...

  7. 基于Python企业公司网站设计与实现 开题报告

      本科生毕业论文 基于Python校园网站系统(Django框架) 开题报告 学    院: 专    业: 计算机科学与技术 年    级: 学生姓名: 指导教师: 黄菊华   XXXX大学本科生 ...

  8. 基于Python点餐外卖系统设计与实现 开题报告

      本科生毕业论文 基于python在线外卖点餐系统(Django框架) 开题报告 学    院: 专    业: 计算机科学与技术 年    级: 学生姓名: 指导教师: 黄菊华   XXXX大学本 ...

  9. 光纤传感器实验模块_光纤传感器实验报告.doc

    <传感器原理>课程实验 光强调制型光纤位移传感器测量位移和粗糙度实验 一.实验目的: 了解光纤位移传感器的工作原理 了解光纤位移传感器的输出特性 加深对传感器一些主要静态性能指标的理解 二 ...

  10. 基于Python实现对情感极性判断分析实验

    资源下载地址:https://download.csdn.net/download/sheziqiong/85734418 资源下载地址:https://download.csdn.net/downl ...

最新文章

  1. 神经科学家为视力受损的人研发新技术
  2. 腾讯DCI上线基于集中控制的SR-TE方案
  3. PostgreSQL 统计信息pg_statistic格式及导入导出dump_stat - 兼容Oracle
  4. 《飞秋2010下载》的开头说
  5. 【elasticsearch】xpack exporter failed to flush export bulks
  6. STM32工作笔记0008---TFT显示屏和LCD显示屏的区别
  7. 感谢微软BPOS4China技术支持组
  8. 2013中国微信公众平台用户研究报告
  9. [Jscript]Js导出Excel
  10. 网络编程----观察进程的启动与停止
  11. VBScriptVBS(二)变量、数组变量的应用与理解
  12. Pymol教程--Caver插件 研究蛋白通道
  13. 教你如何设置电脑保护色来保护眼睛
  14. android opencv hu 不变矩,图像的矩(含hu不变矩)
  15. java 保龄球游戏开发_保龄球游戏 编程
  16. 使用 Go 进行 iOS 和 Android 编程
  17. 摩登兄弟:参加《歌手》压力很大,在准备下一期歌曲
  18. 2021年金属非金属矿山支柱考试题库及金属非金属矿山支柱找解析
  19. qpython 3h和oh_**python中的类和他的成员
  20. 第五十七篇 Django-CRM系统-1登录,注册,修改密码

热门文章

  1. 仇人与恩人- 挺有意义的
  2. Transact-SQL编程
  3. 网络攻防——网络攻击技术分类
  4. 基于Java毕业设计服务管理系统源码+系统+mysql+lw文档+部署软件
  5. 谈谈算法的时间复杂度
  6. npm install 报错 Failed at the XXX install script
  7. ubuntuv20启动界面美化_玩转Reno4手机,ColorOS 7.2界面清爽更贴心_手机通讯
  8. Linux Shell查找下一个
  9. 【超强干货】蘑菇街App的组件化之路
  10. LAN8720A芯片