本节书摘来自华章计算机《数据科学:R语言实现》一书中的第1章,第1.1节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第1章

R中的函数

1.1 引言

R语言是数据科学家的主流编程语言。基于著名的数据分析网站KDnuggets的民意测验,3项(2012年到2014年)的调查显示,R语言在数据分析、数据挖掘和数据科学领域中是最受欢迎的语言。对许多数据科学家来说,R语言不仅是一门编程语言,而且相关软件还提供了交互式的开发环境,支持运行各种数据分析任务。

R语言在数据操作和分析方面有许多优势。下面是3个最显著的优势。

这些优势使得复杂的数据分析变得更加简单易行。对此,R语言用户都深信不疑。而且,R语言尤其适合基础用户或者开发人员。对于一名R语言用户,我们只需知道函数如何工作,而不需要知道函数实现的具体知识。类似于SPSS,我们可以通过R语言的交互式shell,运行各种类型的数据分析任务。另外,作为一名R语言开发人员,我们可以编写函数来创建新的模型,甚至可以把实现的函数封装在包中。

本书并不会讲解如何从零开始编写R程序。相反,本书的目标是要讨论如何成为一名R语言开发人员。本章的主要目的是向用户展示如何定义函数,从而加速分析过程。我们首先介绍如何创建函数,然后介绍R环境,接着讲解如何创建匹配参数。 本章的内容还会涵盖如何执行R语言函数式编程,如何创建高级函数,例如中缀操作符和替代,以及如何处理错误和调试函数。

《数据科学:R语言实现》—— 第1章 R中的函数 1.1 引言相关推荐

  1. R语言实战-第十七章 R in action-chapter17

    本章目的:基于一组预测变量预测一个分类结果 (如:根据关键词.图像.来源等判断一份邮件是否是病毒邮件) 本章用到的package: #rpart rpart.plot party 实现决策树模型及其可 ...

  2. r语言写内曼最优分配_R中最优化函数optim

    最优化函数optim 目标函数: $$f(x_1,x_2)=(1-x_1)^2+100(x_2-x_1^2)^2$$ 该函数全局最小值在($x_1=1,x_2=1$)时取到. 下面这种写法是因为有多个 ...

  3. 为何python攀上数据科学巅峰?调查显示Python超越R

    根据KDnuggets 2017年最新调查,Python生态系统已经超过了R,成为了数据分析.数据科学与机器学习的第一大语言.本文对KDnuggets的此项调查结果做了介绍,并补充了一篇文章讲解为何P ...

  4. R语言基础题及答案(二)——R语言与统计分析第二章课后习题(汤银才)

    R语言与统计分析第二章课后习题(汤银才) 题-1 用函数rep( )构造一个向量x, 它由3个3, 4个2, 5个1构成. x<-rep(c(3,2,1),times=c(3,4,5));pri ...

  5. R语言实战笔记--第九章 方差分析

    R语言实战笔记–第九章 方差分析 标签(空格分隔): R语言 方差分析 术语 组间因子,组内因子,水平:组间因子和组同因子的区别是,组间因子对所有测试对象进行分组,而组内因子则把所有测试对象归为同一组 ...

  6. sas和python哪个好学_从全方位为你比较3种数据科学工具的比较:Python、R和SAS(附链接)...

    原标题:从全方位为你比较3种数据科学工具的比较:Python.R和SAS(附链接) 本文约3000字,建议阅读5分钟. 关于三种数据科学工具Python.R和SAS,本文从8个角度进行比较分析并在文末 ...

  7. R语言小白学习笔记3—R语言读取数据

    R语言小白学习笔记3-R语言读取数据 笔记链接 想说的话 学习笔记3-R语言读取数据 3.1 读取CSV文件 3.1.1 read_delim函数 3.1.2 fread函数 3.2 读取Excel数 ...

  8. R语言ggplot2可视化散点图、并使用geom_encircle函数自定义多边形圈定可视化图像中的指定区域、使用geom_smooth函数基于loess方法拟合数据点之间的趋势关系曲线

    R语言ggplot2可视化散点图.并使用geom_encircle函数自定义多边形圈定可视化图像中的指定区域(Scatterplot With Encircling).使用geom_smooth函数基 ...

  9. R语言ggplot2可视化:计算dataframe中每个数据列缺失值的个数、使用堆叠的条形图(Stacked Barplot)可视化每个数据列的缺失值的情况(自定义堆叠条形图的形式)

    R语言ggplot2可视化:计算dataframe中每个数据列缺失值的个数.使用堆叠的条形图(Stacked Barplot)可视化每个数据列的缺失值的情况(自定义堆叠条形图的形式) 目录

  10. R语言:第4章课后题及附加作业

    R语言:第4章课后题及附增作业 第4章课后题 1.求最值及中位数 2.绘制正态曲线 3.练习条件分支语句 4.判断101~200的素数个数 5.练习自定义函数 第4章附增作业 1.找3的倍数 2.编写 ...

最新文章

  1. 洛谷 2758 编辑距离
  2. 线程退出【Linux学习】pthread_create主线程与创建的新线程之间退出关系
  3. SAP 财务模块 FI-TV 差旅管理
  4. AI种番茄!腾讯xWUR智慧温室大赛预赛揭晓,农科院和三星等五队挺进决赛
  5. java 设置pdf 编码格式_Java如何设置PDF文档背景色详解
  6. C#新手该如何规划学习【学习路线指南】
  7. MySQL之IFNULL()、ISNULL、NULLIF用法
  8. file_get_contents('php://input') 和POST的区别
  9. mysql笔试_mysql笔试题
  10. Python爬虫解析htm时lxml的HtmlElement对象获取和设置inner html方法
  11. 再也回不去的 GitHub。。。
  12. 將字串轉換為日期型數據的例子
  13. 如何正确卸载天锐绿盾客户端
  14. c++静态成员变量和静态成员方法
  15. 输入身高体重测身材_身高体重测试(女人标准体重计算器)
  16. 《数字图像处理(第三版)》 第二章 数字图像基础 笔记1(视觉与电磁波谱)
  17. 《社交困境》:算法抓住了人类的弱点……
  18. 大蟒蛇:Python入门课程主要讲什么?
  19. DE-PPN:Document-level Event Extraction via Parallel Prediction Networks论文解读
  20. MySQL The server time zone value 'Öйú±ê׼ʱ¼ä' is unrecognized or represents more than one time zo

热门文章

  1. 自定义 Behavior - 仿新浪微博发现页的实现
  2. 关于直播,所有的技术细节都在这里了(三)
  3. mysql gtid 错误_MySQL 5.6 GTID常见错误解决一例
  4. vsan双主机配置_5千右预算,兼顾Pr剪辑、Ps修图、CAD制图的高性价比DIY主机配置...
  5. jquery上传 php,jQuery AJAX文件上传PHP
  6. go语言--正则表达式过滤数据--通过文件获取数据
  7. java 栈泛型_使用泛型实现栈结构
  8. python慢的原因_为什么 Python 这么慢?
  9. Java8 - Stream API快速入门
  10. springboot + redis(单机版)