两种最常用的数据科学语言R和Python之间存在着某种竞争。

刚接触机器学习的人都会选择其中一种语言来学习。人们的决定通常以他们可以访问的学习资源为指导,比如哪些资源在他们的工作领域中更常用,以及哪些是他们的同事正在使用的。尽管一些更先进的深度学习方法更容易通过使用Python来编写实现(它们倾向于先用Python编写,再用R语言实现),但是机器学习任务不可能只适用于一种或另一种语言。虽然非常适合数据科学,但Python是一种更通用的编程语言,而R语言专门针对数学和统计学的相关应用。这意味着使用R语言的人可以只关注数据,但是,如果他们需要基于自己的模型构建应用程序,他们可能会感到自己受到了限制。
       当R和Python在数据科学领域相互竞争时,确实没有哪一种语言是绝对的赢家(每个人都有自己喜欢的语言)。那么,本书为何选用R语言介绍机器学习呢?因为R语言有专门用于简化数据科学任务并使之易于人们阅读的现代工具,例如 tidyverse程序包中的工具(我们将在第2章深入介绍这些工具)。


       一般而言,使用R语言编写的机器学习算法存在于多个不同的程序包中。这意味着每次想应用新的算法时,都需要学习如何使用具有不同参数且实现不同功能的新函数。在这方面,Python的优势在于提供了著名的scikit-learn程序包,其中内置了大量的机器学习算法。R语言现在也有了改进,增加了caret和 mlr程序包。虽然mlr程序包在用途和功能上与caret程序包非常相似,但笔者认为mlr程序包更灵活、更直观。所以,我们选择在本书中使用mlr程序包。
        mlr程序包为大量的机器学习算法提供了一个接口,这样就可以使用很少的代码执行极其复杂的机器学习任务。

节选自《机器学习实战:使用R、tidyverse和mlr》一书

———————————————————————————————————————————基本信息

书名: 《机器学习实战:使用R、tidyverse和mlr》

IBSN:9787302578277

定价:118元

作者译者:[英]赫芬·I.里斯(Hefin Rhys) 著;但波,高山,韩建立 译

出版时间:2021年6月

京东链接:https://item.m.jd.com/product/13331454.html

———————————————————————————————————————————

试读样章

想了解更多关于《机器学习实战:使用R、tidyverse和mlr》内容,请点击京东链接:https://item.m.jd.com/product/13331454.html

使用R语言进行机器学习的原因相关推荐

  1. R语言基于机器学习算法进行特征筛选(Feature Selection)

    R语言基于机器学习算法进行特征筛选(Feature Selection) 对一个学习任务来说,给定属性集,有些属性很有用,另一些则可能没什么用.这里的属性即称为"特征"(featu ...

  2. R语言与机器学习学习笔记(分类算法)

    转载自:http://www.itongji.cn/article/0P534092014.html 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型.神经 ...

  3. R语言开发之我想要使用R语言进行开发的原因

    R语言是常用于统计计算,数据分析和科学研究的编程语言和环境,它是由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman创建的,目前由R Development Core Team开 ...

  4. predict函数 R_学习|R语言做机器学习的常用函数总结

    预测函数:predict() type="prob"判别该量度的昆虫归类为A.B和C的概率:type="response":判别该量度的昆虫的类别: 预测分类的 ...

  5. R语言caret机器学习(四):数据拆分

    [R语言数据科学]

  6. R语言caret机器学习(二):数据预处理上

    [R语言数据科学]

  7. R语言caret机器学习(一)数据可视化:绘制特征变量图

    [R语言数据科学]

  8. R语言caret机器学习(三):数据预处理下集

    [R语言数据科学]

  9. 如何用R语言在机器学习中建立集成模型?

    来源:拓端数据部落 本文约2400字,建议阅读5分钟 本文向您介绍集成建模的基础知识.另外,为了向您提供有关集合建模的实践经验,我们将使用R对hackathon问题进行集成. 1.什么是集成? 通常, ...

最新文章

  1. Dokku和Docker的完美配合
  2. 代码恒久远,GitHub 永流传
  3. postgresql关闭自动提交
  4. 53.连续分区分配vs分连续分区分配
  5. [云炬创业管理笔记]第二章测试5
  6. dsa java_将Java转换为python DSA签名
  7. 在vue-cli项目下简单使用mockjs模拟数据
  8. mysql创建表语句 cmd_MySQL 创建数据表
  9. Java开发者的十大戒律
  10. Weex中页面导航的实现
  11. Kubernetes v1.14.0 之 kube_scheduler 部署
  12. U盘刻录方式安装CentOS 7
  13. 面经个人向(算法岗)
  14. java编写自动化脚本生成apk_批处理脚本实现android应用程序自动化测试
  15. Altium Designer-Net has no driving source警告消除的方法
  16. 斯蒂文斯理工学院计算机专业应聘,斯蒂文斯理工学院回国认可度高不高
  17. 解决win10每次重启后桌面图标排列混乱的问题。
  18. Excel表格转到Word中,保持表格不变形,不超边缘纸张范围
  19. 使用Python下载MP3
  20. pageoffice在Edge浏览器、谷歌浏览器42及以上版本和火狐浏览器52及以上版本兼容处理

热门文章

  1. 这个得学起来!超实用的格式塔原理小科普
  2. 计算信号波形上升时间下降时间算法软件(Labview版)
  3. [Python 高德地图] API调用学习历程(一)
  4. tomcat原理简要分析,java
  5. R语言统计分析微生物组数据(第三章3)
  6. 【编写DockerFile构建自己的容器】
  7. 大过年的生产项目频繁fullgc
  8. 支持ipv6的各种服务器和客户端
  9. Altium Designer 超详细学习教程——前言
  10. java复制pdf_防止复制使用iText生成的pdf内容