R语言与数据挖掘最佳实践和经典案例

作者:赵彦昌

出版日期:2014年09月

文件大小:24.66M

支持设备:

¥30.00在线试读

适用客户端:

言商书局

iPad/iPhone客户端:下载 Android客户端:下载PC客户端:下载更多详情:查看

?对图书下载、阅读卡购买有疑问:立即进入帮助中心>>

图书简介

目录

本书主要介绍如何使用r工具进行数据挖掘,提供了r用于数据挖掘应用的案例、代码示例和数据,涵盖了最常用的数据挖掘技术。《r语言与数据挖掘最佳实践和经典案例》讲述简洁、内容实用,配有现实应用案例和代码示例以及数据,在线资源丰富,适合数据挖掘方向的研究生、数据挖掘领域的研究人员,以及数据挖掘工程师和分析师阅读。

出版者的话

译者序

缩写词表

第1章 简介

1.1 数据挖掘

1.2 R

1.3 数据集

1.3.1 iris数据集

1.3.2 bodyfat数据集

第2章 数据的导入与导出

2.1 R数据的保存与加载

2.2 .CSV文件的导入与导出

2.3 从SAS中导入数据

2.4 通过ODBC导入与导出数据

2.4.1 从数据库中读取数据

2.4.2 从Excel文件中导入与导出数据

第3章 数据探索

3.1 查看数据

3.2 探索单个变量

3.3 探索多个变量

3.4 更多探索

3.5 将图表保存到文件中

第4章 决策树与随机森林

4.1 使用party包构建决策树

4.2 使用rpart包构建决策树

4.3 随机森林

第5章 回归分析

5.1 线性回归

5.2 逻辑回归

5.3 广义线性回归

5.4 非线性回归

第6章 聚类

6.1 k-means聚类

6.2 k-medoids聚类

6.3 层次聚类

6.4 基于密度的聚类

第7章 离群点检测

7.1 单变量的离群点检测

7.2 局部离群点因子检测

7.3 用聚类方法进行离群点检测

7.4 时间序列数据的离群点检测

7.5 讨论

第8章 时间序列分析与挖掘

8.1 R中的时间序列数据

8.2 时间序列分解

8.3 时间序列预测

8.4 时间序列聚类

8.4.1 动态时间规整

8.4.2 合成控制图的时间序列数据

8.4.3 基于欧氏距离的层次聚类

8.4.4 基于DTW距离的层次聚类

8.5 时间序列分类

8.5.1 基于原始数据的分类

8.5.2 基于特征提取的分类

8.5.3 k-NN分类

8.6 讨论

8.7 延伸阅读

第9章 关联规则

9.1 关联规则的基本概念

9.2 Titanic数据集

9.3 关联规则挖掘

9.4 消除冗余

9.5 解释规则

9.6 关联规则的可视化

9.7 讨论与延伸阅读

第10章 文本挖掘

10.1 Twitter的文本检索

10.2 转换文本

10.3 提取词干

10.4 建立词项-文档矩阵

10.5 频繁词项与关联

10.6 词云

10.7 词项聚类

10.8 推文聚类

10.8.1 基于k-means算法的推文聚类

10.8.2 基于k-medoids算法的推文聚类

10.9 程序包、延伸阅读与讨论

第11章 社交网络分析

11.1 词项网络

11.2 推文网络

11.3 双模式网络

11.4 讨论与延伸阅读

第12章 案例Ⅰ:房价指数的分析与预测

12.1 HPI数据导入

12.2 HPI数据探索

12.3 HPI趋势与季节性成分

12.4 HPI预测

12.5 房地产估价

12.6 讨论

第13章 案例Ⅱ:客户回复预测与效益最大化

13.1 简介

13.2 KDD Cup1998的数据

13.3 数据探索

13.4 训练决策树

13.5 模型评估

13.6 选择最优决策树

13.7 评分

13.8 讨论与总结

第14章 案例Ⅲ:内存受限的大数据预测模型

14.1 简介

14.2 研究方法

14.3 数据与变量

14.4 随机森林

14.5 内存问题

14.6 样本数据的训练模型

14.7 使用已选变量建立模型

14.8 评分

14.9 输出规则

14.9.1 以文本格式输出规则

14.9.2 输出SAS规则的得分

14.10 总结与讨论

第15章 在线资源

15.1 R参考文档

15.2 R

15.3 数据挖掘

15.4 R的数据挖掘

15.5 R的分类与预测

15.6 R的时间序列分析

15.7 R的关联规则挖掘

15.8 R的空间数据分析

15.9 R的文本挖掘

15.10 R的社交网络分析

15.11 R的数据清洗与转换

15.12 R的大数据与并行计算

R语言数据挖掘参考文档

参考资料

通用索引

包索引

函数索引

r语言与数据挖掘最佳实践和经典案例数据_R语言与数据挖掘最佳实践和经典案例...相关推荐

  1. onloadsuccess: function获取不到表格数据_R语言输格式技巧系列(二),再精细一点,定制包含亚组的表格...

    本系列第二篇 主角还是flextable这个包,还是定制表格,本期在上回的基础上再介绍一些 其他的功能,错过了上期的筒子们请先阅读上期内容,这样会有利于理解. 上期内容链接在此: R输出格式系列(一) ...

  2. rstudio中读取数据_R语言数据分析(2)——数据读入与写入

    这一节介绍数据的读入和写入,要在R中做数据分析,首先需要将相关的数据读入,读入的方法多种多样,即使同一个文件,加载不同的包都有不同的读入方法,这里介绍一些比较常见的. 直接编辑 可以通过直接输入的方式 ...

  3. 【数据库基础知识二】数据库DataBase(简称DB),数据库基本概念、DDL:数据定义语言,用来操作数据库对象、DML:数据操作语言,用来操作表中的数据

    14天阅读挑战赛 目录 数据库基本概念 数据库DataBase(简称DB) 数据库管理系统Database management system(简称DBMS) 如何操作DBMS? 连接数据库的方式: ...

  4. r语言读取excel数据_R语言操纵Excel进行数据透视与批处理

    作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量.机器学习.数据可视化.应用统计建模.知识图谱等,著有& ...

  5. r语言worldclim数据_R语言空间数据分析(五):栅格数据处理

    作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量.机器学习.数据可视化.应用统计建模.知识图谱等,著有& ...

  6. r语言中mpg数据_R语言数据筛选整理包dplyr

    dplyr软件包是R中功能最强大,最受欢迎的软件包之一.该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等.本文包括一些示例和如何 ...

  7. r语言读取excel数据_R语言 | 更快的表格文件读取方法!

    友情提示:蓝色下划线字体为引文,请保持警惕! 使用R语言读取 Affymetrix Human Exon 1.0 ST Array 芯片平台探针注释文件: https://www.affymetrix ...

  8. r语言中mpg数据_R语言数据分析系列之五

    R语言数据分析系列之五 本节来讨论一下R语言的基本图形展示,先来看一张效果图吧. 这是一张用R语言生成的,虚拟的wordcloud云图,详细实现细节请參见我的github项目:https://gith ...

  9. python与r语言处理excel数据_R语言 | 读写txt、csv、excel文件

    前段时间看到plotnine库(封装的R语言ggplot2)作的图太美了,有点想重新拾起R语言^_^ R语言代码略带凌乱,讲真的还是更喜欢Python代码简洁.不过好几年不琢磨R语言,对R语言代码的凌 ...

  10. r语言中mpg数据_R语言数据实战 | 统计检验

    原标题:R语言数据实战 | 统计检验 1.单个总体均值的t检验 1. 什么是检验? 检验(test)是统计学中最重要的概念之一,在科学研究和实际业务中都有着广泛的应用.用一句话来概括就是:人们希望通过 ...

最新文章

  1. tomcat限制用域名访问 禁止 ip访问
  2. Sum of Even Numbers After Queries
  3. java cancel_java – Future.cancel(boolean)方法的实用程序
  4. 标准误计算机excel公式,excel标准误差怎么算
  5. 支持视频语音通话的免费远程管理软件-Rd远控
  6. 计算二叉树叶子结点数目(C语言)
  7. R语言Kmeans聚类分析
  8. linux的bridge,Linux Bridge 详解
  9. 运行ug软件需要什么样的配置?
  10. 无法打开匿名级安全令牌解决方法
  11. 人事代理行业 薪酬福利外包市场:老树发新芽,数字 化转型提质增效
  12. mysql udal_mysql分表分区
  13. p9官方root,p9官方包198网盘分享
  14. 华为gt3智能跑步计划体验:心率监测、gps轨迹、训练计划
  15. linux软件 mac地址,Linux MAC地址
  16. 基于kettle的数据集成平台(三)
  17. break 跳出两层甚至多层 for 循环
  18. iOS设备管理工具iExplorer for Mac
  19. JavaScript制作简易单词测试题库
  20. 淘宝运营 降低跳失率的方法 优化主图 优化详情页 优化评论

热门文章

  1. 通达信服务器在哪个文件里,通达信“指标模块”存放在哪个文件夹里
  2. Python爬取广州链家二手房数据
  3. python2.7中文手册下载_python 2.7.12中文文档下载|
  4. ATmega328芯片-“变身”-温度计-,附示例教程
  5. Android sdk 环境变量配置无效
  6. 软件测试佣金问题等价类,测试用例设计白皮书--等价类划分方法
  7. Cmake入门(1)cmake安装,创建第一个工程,引入头文件
  8. 怎么把录音导入库乐队_库乐队导入电脑版 苹果库乐队怎么导入歌
  9. android 拼音搜索
  10. project.management.cattle.io not found