目录

介绍

这就是为什么

摘要

介绍

虽然说Python比R更好对我而言是正确的,但对您来说可能并非如此。 当然,您可能会因为各种原因认为R比Python更有用。 即使您反对我的声明,我仍然希望开始进行对话,以便大家都能看到两种编程语言的好处。 对于数据科学家来说,我相信Python比R具有更多的好处。 我确实意识到R有一些独特而强大的统计库,很可能使Python库黯然失色。 借助使用Python与数据工程师,软件工程师和机器学习工程师进行扩展,整个数据科学过程可以带来更多的积极效果。

下面,我将讨论五个为什么我认为Python比R更好的主要原因。这些原因包括:可伸缩性,Jupyter Notebook,库软件包,集成以及具有成为跨职能团队成员的能力。

这就是为什么

可扩展性

可伸缩性是在数据科学中采用的巨大好处。 由于大多数数据科学家通常会与工程部门的其他员工一起工作,因此建模以及模型的总体流程可以更容易部署。 例如,典型的数据科学家可能只专注于执行建模,甚至可能是一次性输出。 但是,在建模之前有一个步骤很可能需要在训练机器学习模型之前要做。 该步骤是数据工程部分。 在过程的这一部分中,您可以从SQL数据库自动读取新数据,以便在训练时模型始终是最新的。 流程的另一方面是部署方面。 第一次部署模型可能会非常令人生畏,尤其是因为在学校中所讲授的模型不及建模过程那么多。

由于Python,软件工程师和机器学习工程师可以与您并肩工作。

您可以创建气流定向非循环图(DAG),当在特定时间表上有新数据或满足某些参数时,它可以自动训练模型(例如,仅当我们获得100条新的传入数据记录时才训练该模型)。 训练模型后,它可以评估新数据,然后可以通过使用Python将其输出到SQL表中。

Jupyter笔记本

或另一个类似的数据科学可视化工具,能够解释Python。 您可以运行代码单元,注释,创建标题以及添加可改善笔记本功能的小部件。 您在此处编写和共享的代码是Python。 对于您的数据科学家来说,能够在Jupyter Notebook中使用这种编程语言进行编码是一个巨大的胜利。

第三方库

有几个功能强大且常用的软件包可以使用Python访问。 想到的一些是sklearn(也称为sci-kit学习)和TensorFlow。

Sklearn[2]

这个功能强大的数据科学库具有打包的分类模型和回归模型,可随时用于您的数据集。

—分类

Sklearn对分类的定义是:标识对象所属的类别。 一些流行的算法包括支持向量机(SVM),最近邻居和随机森林。 Sklearn还概述了垃圾邮件检测和图像回归作为其最受欢迎的应用程序使用案例。

—回归

Sklearn对回归的定义是:预测与对象关联的连续值属性。 流行的回归算法包括支持向量回归(SVR)和最近的邻居,其应用包括药物反应和股票价格。

TensorFlow [3]

对于深度学习,该库是我为更复杂的情况建模的必备工具。 这个流行而强大的库可以处理的一些主要项目是:神经网络,通用对抗网络和神经机器翻译。

整合方式

因为我在大多数数据科学项目中都使用Python,所以我成功地将模型.py文件集成到了面向对象的编程格式中。 这些文件以模块化方式有条不紊地开发。 用Python调用API有点简单,因为网站上有太多文档可以帮助获取网站/公司数据。

跨功能

该原因在某种程度上是可伸缩性和集成的结合。 如果您想在本地执行数据科学过程并将输出交给利益相关者,那很好,但是使用Python,您可以与来自工程学的其他专家一起做更多的事情。

当我第一次开始编码时,它是在R中的,当我将我的过程和代码展示给数据工程师和软件工程师以进行部署时,要花一些时间才能准确地描述代码背后的数据科学。

我还将发现与我一起工作的大多数工程师将帮助我部署模型,而他们已经在使用Python,因此即使他们不完全了解该模型的工作原理,他们也可以轻松转换我的数据科学代码。 。

摘要

> Photo by Chris Ried on Unsplash [4].

如您所见,对于选择使用Python的数据科学家来说,有很多好处。 尽管这两种编程语言都非常有用和成功,但从我的个人经验中发现,Python比R更好。这些主要原因包括但不限于:可伸缩性,Jupyter Notebook,库软件包,集成和跨功能。 最终,选择哪种语言取决于数据科学家,但是您的目标是展示我如何在数据科学家项目中使用Python,以及为什么使用Python比R编程更好。

【编辑推荐】

【责任编辑:未丽燕 TEL:(010)68476606】

点赞 0

比python好_这就是为什么Python比R更好的原因相关推荐

  1. 2018年python薪资_最好的Python:2017和2018年至今我最喜欢的文章集

    2018年python薪资 我打算发布此收藏集 (My intention with publishing this collection) Last year I only used Medium ...

  2. python股市_如何使用python和破折号创建仪表板来主导股市

    python股市 始终关注大局 (Keep Your Eyes on the Big Picture) I've been fascinated with the stock market since ...

  3. python 切片_全面解读Python高级特性切片

    大家好,欢迎来到Crossin的编程教室! 众所周知,我们可以通过索引值(或称下标)来查找序列类型(如字符串.列表.元组-)中的单个元素,那么,如果要获取一个索引区间的元素该怎么办呢? 切片(slic ...

  4. 学习python课程_想学习Python吗? 这是我们的免费4小时互动课程

    学习python课程 Python is a popular, versatile and easy-to-learn language. It's the go-to language for AI ...

  5. aws python库_如何使用Python,AWS和IEX Cloud创建自动更新股市数据的Excel电子表格

    aws python库 Many Python developers in the financial world are tasked with creating Excel documents f ...

  6. 有趣的超短python代码_有趣的python精短程序

    python可以简单优美,也很有趣,下面是收集的例子: 1.一句话开始一个http的文件服务器: $ python -m SimpleHTTPServer Serving HTTP on 0.0.0. ...

  7. 少儿编程python教材_少儿编程|Python环境安装

    一.为什么要学Python? 小学 山东,浙江,北京地区小学已将Python内容纳入教材 高中 浙江省已将信息技术教材编程语言替换为Python 大学 计算机二级考试加入"Python 语言 ...

  8. 微软发布的python教程_微软发布Python 教程《Develop with Python on Windows》

    微软近日上线了一套 Python 教程<Develop with Python on Windows>,文档内容包括设置 Python 开发环境.在 Windows 与 WSL 子系统中安 ...

  9. python竞赛_浅谈Python在信息学竞赛中的运用及Python的基本用法

    浅谈Python在信息学竞赛中的运用及Python的基本用法 前言 众所周知,Python是一种非常实用的语言.但是由于其运算时的低效和解释型编译,在信息学竞赛中并不用于完成算法程序.但正如LRJ在& ...

最新文章

  1. 如何高效地逛Github?
  2. java 返回值判断_在Java中判断方法重载的条件除了参数外,还可以通过返回值类型判断。_学小易找答案...
  3. LSTM之父撰文,纪念这位图灵奖遗珠、“AI理论之父”
  4. 杂谈--DML触发器学习
  5. MobileNetV3
  6. request和response的setCharacterEncoding()方法
  7. 构建空列表的两种法是_Python 基础3之列表
  8. 数据迁移,不停机上线的正确姿势
  9. C#反射Assembly 具体说明
  10. 莫烦Matplotlib可视化第四章多图合并显示代码学习
  11. php 获取object_PHP反射机制实现自动依赖注入
  12. HTML5应用程序网站视差模板下载
  13. django-模型类管理器
  14. 说说windows下64位程序和32位程序
  15. 编程 ul 不能一行显示 跳到下行_史上最全的数控G代码编程详解
  16. 维纳滤波器matlab程序,维纳滤波原理及其matlab实现
  17. ROS 教程之navigation: 用程序设定导航目标点
  18. 快快编程kkcoding/太戈编程Tiger AI答案库 (每月更新)第三期 答案仅供参考,不能保证100%的准确性
  19. 计算机版本过低如何解决,win7系统ie浏览器提示版本过低的解决方法
  20. 【四足机器人--控制器统筹controlFSM(复杂度2)】HFSM四足机器人步态运行有限状态机fsm_manager代码解析【包括FSM_control、FSM_statelist两层】

热门文章

  1. html中foreach遍历list,foreach遍历----for(object o: list)
  2. ubuntu不会自动休眠_关机、睡眠、休眠有啥区别?微软说非特殊情况不要关机
  3. esp8266 rtos 开发环境 ubuntu_esp8266/32~资源帖[持续更新]
  4. 电脑亮度多少对眼睛好_电脑显示器亮度多少合适呢??
  5. Linux之HugePages快速配置
  6. 【警惕】大量未修复WebLogic WSAT组件RCE漏洞的主机被挖矿程序攻击
  7. 用IoT放羊养牛,不出门也能知道它们的动向
  8. 云小课|VMware备份上云学习专列来了,快加入吧~
  9. 【华为云技术分享】Linux内核源码结构(1)
  10. 大型情感剧集Selenium:3_元素定位 #华为云·寻找黑马程序员#