作者:Lou Bajuk

翻译:黄小伟,资深数据从业者。目前就职杭州有赞数据分析团队,欢迎加入!

简历邮箱:huangxiaowei@youzan.com

从我们成立之初,RStudio就致力于几个关键的想法:如果用于数据科学的工具是免费和开放的,那么对每个人都更好;我们热爱并支持编码,认为这是解决数据科学问题的最有力途径。

编码使当前和有抱负的数据科学家有能力解决最复杂的问题,因为代码具有灵活性,可重用性,可检查性和可复制性。考虑到这一点,在RStudio中,我们不会判断您喜欢哪种语言。我们只是在乎您有能力进行出色的数据科学。正如RStudio的首席数据科学家哈德利·威克汉姆(Hadley Wickham)在最近对丹·科普夫(Dan Kopf)的采访中所言:“尽其所能使自己开心”。在以后的博客文章中,我们将更多地讨论数据科学编码的好处,但是在这篇文章中,我们将简要地探讨有关R与Python的争论,然后分享为什么我们相信R和Python可以,应该并且确实能很好地工作 一起。

R or Python for Data Science?

关于该主题有很多激烈的讨论,但是也有一些很棒的,深思熟虑的文章。一些人建议使用Python作为通用编程语言是可取的,而另一些人则建议使用专用语言和工具链更好地服务于数据科学,比较和对比了两种语言的起源和发展弧线,通常是为了支持不同的结论。对于单个数据科学家,需要考虑一些共同点:Python是一种很棒的通用编程语言,有许多专门用于数据科学的库;

许多(如果不是大多数)通用入门编程课程现在都开始使用Python进行教学;

Python是许多ETL和机器学习工作流程的首选语言;

现在,许多(如果不是大多数)统计学和数据科学入门课程都教R;

R已成为世界上最大的统计知识资料库,其中包含数千种(甚至数万种)经过专家审查的算法的参考实现。 许多R软件包的文档都包含有关该主题的主要文献的链接;

R进行探索性分析并将工作转化为出色的报告,仪表板或API的进入门槛非常低;

RStudio中的R通常被认为是进行探索性数据分析的最佳场所;

对于拥有数据科学团队的组织,需要牢记一些其他要点:对于某些组织,Python比R更易于部署、集成和扩展,因为组织中已经存在Python工具。另一方面,我们在RStudio与数以千计的数据团队合作,通过我们的开源和专业产品成功解决了这些问题,包括在多语言环境中;

R拥有来自不同背景的庞大的支持数据科学家社区。 例如,R-Ladies是一个致力于在R社区中促进性别多样性的全球性组织;

新型机器学习工具的大多数接口都是首先用Python编写并受支持的,而统计中的许多新方法首先是用R编写的;

试图强制一种语言将另一种语言排除在外,也许是出于对复杂性或支持这两种语言的成本的含糊不清的担心,这可能会导致以任何方式排除大量潜在的数据科学家候选人;

关于建立数据科学团队的建议经常强调让一支多元化的团队带来各种观点和互补技能的重要性,以使它更有可能有效地找到针对特定问题的“最佳”解决方案。 从这个角度来看,R用户倾向于来自范围更广的领域专业知识(生态,经济学,心理学,生物信息学,政策分析等);

因此,专注于“ R还是Python?”可能会失去将两者带给单个数据科学家和数据科学团队的优势。因此,这些文章中的许多最终都得出了相当细微的结论,类似“你们都需要”或“这取决于”。在上面引用的Hadley Wickham的采访中可以找到这种观点的一个很好的例子:

通常,有很多人谈论R与Python,就像R或Python必胜之战。我认为这没有帮助,因为这实际上不是一场战斗。这些东西独立存在,并且以不同的方式都很棒。

R and Python for Data Science!

因此,现实是两种语言都很有价值,而且两种语言都将保留下来。 我们的经验证明了这一点。 在与客户交流时,我们发现当今许多数据科学团队都是双语的,他们在工作中充分利用了R和Python。 秉承Hadley的“使用一切使您快乐”的精神,我们努力使这种时时刻刻艰难的关系变得更加幸福。我们为个人数据科学家以及他们所参与的数据科学团队和组织提供了一条更流畅的途径,使其可以并排使用这两种语言,并解决IT团队在支持这两种语言时可能涉及的复杂性或成本问题。

例如:我们的开源软件包reticulate和RStudio IDE使在单个数据科学项目中轻松组合R和Python变得很容易;

我们的专业产品使跨双语数据科学环境的管理和协作变得更加容易。 例如,RStudio Server Pro可以启动和管理Jupyter Notebook和JupyterLab,而RStudio Connect可以轻松地与利益相关者共享Jupyter Notebook,以及您在R中的工作以及R和Python混合项目;

作为改善跨语言协作的一项长期投资,我们正在孵化Ursa Labs,为该行业资助的专注于开源数据科学工具的开发小组提供运营支持和基础架构。Python的pandas软件包的作者Wes McKinney,与Hadley Wickham进行了很多交谈。 Ursa Labs项目的目标无非就是创建一个现代数据科学运行时环境,该环境可以利用过去20年的计算优势,并可以在包括R和Python在内的多种语言中使用;

要了解有关RStudio如何在同一数据科学团队上支持使用R和Python的更多信息,请查看我们的R and Python Love Story(https://rstudio.com/solutions/r-and-python/),我们在其中为数据科学家、数据科学带头人和DevOps / IT领导者提供了信息和资源,以应对混合R 和Python环境。

r语言和python爬虫谁厉害_R vs Python: 谁是最好的数据科学语言?相关推荐

  1. r语言和python爬虫谁厉害_R语言中,RCurl优势在哪儿,做爬虫的话用Python还是RCurl效率高?...

    由于电商网站的数据的实时性要求,数据分析时一般直接从网页爬取.因此使用爬虫的方法显得十分重要.R作为数据分析的软件,可以直接对爬取的数据进行后续处理,加上上手快的特点,是电商网站数据爬取和分析的好工具 ...

  2. 数据挖掘r语言和python知乎_Hellobi Live |R语言爬虫实战案例分享:网易云课堂、知乎live、今日头条、B站视频...

    课程名称 R语言爬虫实战案例分享:网易云课堂.知乎live.今日头条.B站视频 网络数据抓取是数据科学中获取数据中的重要途径,但是一直以来受制于高门槛,都是专业程序员的专属技能.直到R语言和Pytho ...

  3. r语言和python-R语言和Python一块学习会弄混吗

    原标题:R语言和Python一块学习会弄混吗 感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答.求职一站式搞定 ...

  4. r语言和python-r语言和python的详细对比

    r语言和python的对比,两者各有千秋,究竟要学哪一个,可根据自己的实际需求来作出选择,当然,最好是两者都学. 01 开发目的 R语言 R是由统计学家开发的,它的出生就肩负着统计分析.绘图.数据挖掘 ...

  5. R语言和python语言的区别在什么地方,各自的应用场景是什么

    R语言和Python语言都是广泛使用的数据分析和科学计算语言,但它们有一些不同之处. R语言是一种专门用于数据分析和统计建模的编程语言.它提供了许多内置的数据结构和函数,可以方便地进行数据处理.可视化 ...

  6. r语言和python-r语言和python

    广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! r的取值范围是,r=1表示完全正相关! r=-1表示完全负相关! r=0表示完全 ...

  7. R语言和Python连接hive

    连接原理:R语言和Python连接,R中读取的数据可以传递到python中进行处理,同理python中的结果可以传递到R语言中进行,二者满足双向传递.而Python连接hive的方法较多且简单,因此采 ...

  8. 生物学经典blast比对算法,R语言和Python如何实现?

    Blast比对算法原理与实现方式 做生物的同学肯定听说过blast比对这个方法,一般在NCBI等网站上可以在线进行比对,也可以在本地服务器进行比对,那么blast算法究竟是怎么实现对不同序列的比对呢? ...

  9. r语言和python-r语言和python学哪个?

    经常有读者问我们,在数据科学领域里,到底是该选 Python 呢,还是选 R 更好?诚然,对于数据科学家来说,R 和 Python 都很重要.但是对于一个新人数据科学家来说,又该如何取舍呢?同时学习 ...

最新文章

  1. 在VS2010中创建自定义的代码段
  2. 国防科大计算机考研大纲,2022年国防科技大学F1003计算机操作系统考研大纲及参考书目...
  3. 密码学基础(1)-前言
  4. MyBatis延迟加载和缓存(4)
  5. oracle 插入timestamp
  6. EXCEL 图表 只在拐点的时候显示数字
  7. 再译《A *路径搜索入门》之四
  8. 英语期末复习unit 1-2课后习题第一题及背诵段落
  9. C:02---scanf、printf
  10. T-SQL 中ON和WHERE的区别
  11. pytorch利用rnn通过sin预测cos 利用lstm预测手写数字
  12. Java并发编程实战~生产者-消费者模式
  13. huffman python_Python huffman包_程序模块 - PyPI - Python中文网
  14. C++/QT:获取当前路径并通过相对路径读取文件
  15. 遗传算法编码方式整数编码_如何编码卫星算法并从头开始烹制西班牙海鲜饭
  16. HTML认识数字游戏,小班数学游戏教案《认识数字》
  17. 极路由1S HC5661A 刷入不死u-boot(breed)加刷潘多拉固件教程
  18. use mysql命令_mysql命令-use
  19. HTML5前端基础知识
  20. GreatRiver研讨会 | ARINC 818的应用及发展

热门文章

  1. 微信服务商如何申请?
  2. cancase lin管脚_cancase
  3. DXC Technology Company旗下公司Luxoft完成对CMORE Automotive的收购
  4. TL431应用和原理,TL431应用的注意事项
  5. win10如何打开计算机端口,win10系统开启计算机端口的操作方法
  6. Prism Dialog
  7. 咖说丨一文说清“链上”和“链下”
  8. 数组c语言抓小偷,警察抓小偷C语言源码
  9. 毛大庆:跑步治好了我的抑郁症
  10. 能取代90%人工作的ChatGPT到底牛在哪?