R语言有很强大的统计绘图函数,python的开发能力强,数据处理速度比R快。在平时使用python处理数据,使用R统计分析。于是想着怎么使用python来调用R,毕竟python还不能取代R,它们是相辅相成的,看到网上很多辩论python好还是R好的,就不多说了。

python调用R的模块是rpy2。
安装:注意 rpy2 的版本和 python 的版本要对应,也要和 R 的版本对应,比如3.4的版本,32位的版本

下载 http://www.lfd.uci.edu/~gohlke/pythonlibs/#rpy2

下载 rpy2-2.7.6-cp34-none-win32.whl,对应python3.4且32位版本

安装

pip install D:\360极速浏览器下载\rpy2-2.7.6-cp34-none-win32.whl

需要在python中调用R,实在是一种无奈的选择。如果能在一门语言中独立完成课题,是一个比较理想的做法。但是,这种想法也不太现实,毕竟每一种语言都有自己的长处。如果能取长补短,综合使用各种语言,也能起到不错的效果。

现在遇到的问题是,如何在python中调用R?这其中包括了如何调用R的对象(函数和包),R和python的对象如何互相转换,以及如何调用R的脚本(外界参数的输入)。python提供了一个模块rpy2,可以较好地完成这项工作。

1.安装rpy2
rpy2的网址:http://rpy.sourceforge.net/index.html
可以使用easy_install安装,# easy_install rpy2

注意事项:
1.如果是源代码编译安装R,需要在configure步骤加入后缀 –enable-R-shlib
2.需要安装python-devel包

python调用R对象
使用rpy2.robjects包的r对象
调用方法如下,以下robject.r的调用方法实际上是开启了一个R的交互进程,只需要将R的代码写入一个字符串内(注1),接着调用R即可

import rpy2.robjects as robjects

此时,有三种方法调用R对象:
第一种:robjects.r['pi']
第二种:robjects.r('pi')
(这种方法从某种程度上讲是万能的,因为可以将任意大小和长度的R代码写成一个python字符串,之后通过robjects.r(‘Rcode’)调用执行。)
第三种:robjects.r.pi
(这种方法对于名称中有“点号”的变量会出问题,比如data.frame/read.csv等,所以推荐使用第一种方法)

以下是一个创建和使用R函数(自己创建的函数或者R内置函数)。注意:最后一种方法,对于对付一些特殊的格式很管用。

#creat an R function
robjects.r('''f <- function(r){pi * r}''')
>>> robjects.r['f'](3)
[9.424778]
# internal function in R
>>> robjects.r['ls']()
# another internal function
>>> l = robjects.r['letters']
>>> len(l)
>>> robjects.r['paste'](l, collapse = '-')
# an alternative way of getting 'paste' function in R
# eval the R code
>>> coder = 'paste(%s, collapse = "-")' % (l.r_repr())
>>> robjects.r(coder)

对于一些特殊的R对象比如list和matrix,如果python要调去其中的部分数据,可以通过其rx()和rx2()方法操作。对于list,可以查看其name属性,以获得列表个个元素名称。rx()和相当于”[“操作(注意取出的是R的list对象),而rx2()相当于”[[“操作。一个例子:

>>> tmp = r("list(a = matrix(1:10, nrow = 2), b = 'Hello')")
>>> print tmp
$a[,1] [,2] [,3] [,4] [,5]
[1,]    1    3    5    7    9
[2,]    2    4    6    8   10$b
[1] "Hello">>> tmp.names
<StrVector - Python:0x8afdc8c / R:0x8ce0a70>
['a', 'b']>>> tmp.rx('a')
<ListVector - Python:0x8afd86c / R:0x8cf71c0>
[Matrix]a: <class 'rpy2.robjects.vectors.Matrix'><Matrix - Python:0x8b013cc / R:0x97de388>
[       1,        2,        3, ...,        8,        9,       10]>>> tmp.rx(1)
<ListVector - Python:0x8b010cc / R:0x8cf7100>
[Matrix]a: <class 'rpy2.robjects.vectors.Matrix'><Matrix - Python:0x8b017cc / R:0x97de388>
[       1,        2,        3, ...,        8,        9,       10]
>>> tmp.rx2(1)
<Matrix - Python:0x8b01b4c / R:0x97de388>
[       1,        2,        3, ...,        8,        9,       10]
>>> tmp.rx2('a').rx(1, 1) # first element of 'a'
<IntVector - Python:0x8b01acc / R:0x8cf6fa0>
[       1]
>>> tmp.rx2('a').rx(1, True) # first row of 'a'
<IntVector - Python:0x8b01f2c / R:0x965ffd8>
[       1,        3,        5,        7,        9]

注意事项:
1.如果函数有警告(warnings),在ipython等IDE上能够执行,但是如果是脚本或者与网页服务器交互,则会产生错误。解决办法:1. 鲁莽的解决很简单,强行忽略R的警告,options(warn = -1)或者R代码放入函数中suppressWarnings()。2. 第二种办法,如果是自己代码中使用了warning()函数,则将warning信息换成字符串,之后单独输出。
2.如果R的函数参数用到向量,有两种解决办法:1. 使用robject.**Vector()函数(见下)先将python对象转换成R对象,然后带入函数;2. 直接使用python对象,一个例子:

>>> from rpy2.robjects import r
>>> a = r['matrix'](range(10), nrow = 2)
>>> print a
     [,1] [,2] [,3] [,4] [,5]
[1,] 0    2    4    6    8
[2,] 1    3    5    7    9

python对象转换成R对象
通常,可以将python的list对象,转换成为R的vector对象,之后直接使用R函数调用。相应的函数是
robjects.StrVector()
robjects.IntVector()
robjects.FloatVector()
robjects.complexVector()
robjects.FactorVector()
robjects.BoolVector()

,这些函数将python列表转化成R的字符/整数/浮点/复数/因子/布尔向量。robjects.ListVector()将python的字典转换成R的列表。
具体转换可见
http://rpy.sourceforge.net/rpy2/doc-2.2/html/vector.html#creating-vectors

比如:

>>> testmatrix = robjects.IntVector([1, 2, 3, 4])
>>> robjects.r['matrix'](testmatrix, nrow = 2)
# another dynamic arguments example
>>> x = robjects.IntVector(range(10))
>>> y = robjects.r.rnorm(10)
>>> kwargs = {'ylab': 'foo/bar', 'type': 'b', 'col': 'blue', 'log': 'x'}
>>> robjects.r.plot(*args, **kwargs)

注意事项:
1. 使用vector系列函数时,输入的只能是python的列表,而不能是数字或者字符串。

载入和使用R包
使用rpy2.robjects.packages.importr对象,调用方法是

>>> from rpy2.robjects.packages import importr>>> base = importr('base')
>>> stats = importr('stats')
>>> affy = importr('affy')
#使用导入的包函数
>>> stats.rnorm(10)

如果想引用一个包中的隐变量,也很简单,只要载入包,然后所有r命令化成成字符串,之后引用即可(这种方法是万能的),比如

>>> from rpy2.robjects.packages import importr
>>> importr('hwriter')
>>> a = r('hwriter:::hwrite.table(matrix(1:10, 2))')
>>> print(a)
[1] "<table border="1">n<tr>n<td>1</td><td>3</td><td>5</td><td>7</td><td>9</td></tr>n<tr>n<td>2</td><td>4</td><td>6</td><td>8</td><td>10</td></tr>n</table>n"

导入R脚本
使用R的source函数:

from rpy2.robjects import r
r.source('testrscript.r')

2.5 转换R对象为全局变量
因为使用函数robjects.globalenv()将对象转换成全局变量,特别是遇到python找不到一个R对象时(此时R对象可能通过r(‘Rcode’)调用),留意将R对象转变成全局变量。

3.R对象转换成python对象
推荐使用tuple( )或者list( )函数,将R对象转换成tuple或者list。

>>> a = r('c(1, 2, 3)')
>>> a
<FloatVector - Python:0x904746c / R:0x9114978>
[1.000000, 2.000000, 3.000000]
>>> str(a)
'[1] 1 2 3n'
>>> tuple(a)
(1.0, 2.0, 3.0)
>>> list(a)
[1.0, 2.0, 3.0]
>>> b = r('matrix(1:6, 2, 3)')
>>> b
<Matrix - Python:0x9039c6c / R:0x9114710>
[       1,        2,        3,        4,        5,        6]
>>> print b[,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6
>>> tuple(b)
(1, 2, 3, 4, 5, 6)
>>> list(b)
[1, 2, 3, 4, 5, 6]

参考文献和注释:
注释1:对于R代码,即便是将一段R代码写成一行(尽管看起来很丑陋而且不推荐),一样可以执行。但是,反过来,对于python代码则没有这么简单。因为,python代码是靠缩进来划分代码的区域,假若一段代码中有两个循环嵌套,如果此时将所有代码写成一行,执行起来就要麻烦的多(很可能要依赖空格的多少进行解释)
1. http://www.jeffkit.info/2010/02/475/
2. 官方文档:http://rpy.sourceforge.net/rpy2/doc-2.2/html/introduction.html

python调用R语言相关推荐

  1. python调用r语言加载包错误_Python调用R语言

    网络上经常看到有人问数据分析是学习Python好还是R语言好,还有一些争论Python好还是R好的文章.每次看到这样的文章我都会想到李舰和肖凯的<数据科学中的R语言>,书中一直强调,工具不 ...

  2. python调用r语言加载包错误_Python中调用R语言包指南.docx

    Python中调用R语言包指南R语言是非常强大的做统计分析和建模方面的开源软件,它有非常丰富的统计软件包,做统计可以说只有你想不到的,没有R办不到的.Python又是当下最流行的编程软件之一,Pyth ...

  3. r语言调用python_小众做法,通过python调用R语言的第三方包

    原本的意思只想在anaconda上把所有代码一股脑的写好,实在不想转战不同的平台.为此无意间发现python可以调用R,于是饶有兴致的挖了个坑. 网上的教程基本都很老,下载的费官方whl包都已经没地方 ...

  4. python调用R语言,关联规则可视化

    首先当然要配置r语言环境变量什么的 D:\R-3.5.1\bin\x64; D:\R-3.5.1\bin\x64\R.dll; D:\R-3.5.1; D:\ProgramData\Anaconda3 ...

  5. python r语言 结合 部署_Win10 下安装R,rpy2,Rstudio 安装与配置 并实现Python 调用 R语言...

    1.下载安装 R语言 先去https://cran.r-project.org/bin/windows/base/ ;去下载 Download R 3.4.3 for Windows (62 mega ...

  6. python调用r语言_【Python调用第三方R包】【环境变量设置】Python 通过rpy2调用 R语言...

    [github有完整的软件包 ] 系统环境 python 2.7.4  32bit R 3.0.1  i386-w64-mingw32/i386 (32-bit) rpy2 2.3.7  32bit ...

  7. python调用c语言内核计算,在Linux上实现Python调用C语言函数

    一般思路 Python中内置ctypes库,需调用c编译成的.so文件来实现函数调用. 假设我们所需调用的c文件名为test.c,文件里有我们需要的函数func(x,y). 将.c文件编译成 .so文 ...

  8. python r语言 结合 部署_(转)python中调用R语言通过rpy2 进行交互安装配置详解...

    python中调用R语言通过rpy2 进行详解 1.R语言的安装: 大家进行R语言的安装,在安装好R后,需要配置环境变量R才能进行使用. 对此电脑右键->选择高级设置->环境变量-> ...

  9. r语言和python-R VS Python:R语言是否真的过时了?

    ​自从CDA数据分析师开设了Level1 业务数据分析师 R专题之后,很多学生对此产生了疑惑.特别是在挖掘建模工具的选择上,甚至出现了选择恐惧症.在此,摘抄了 浩彬老撕 的文章,以及之前零零散散看的一 ...

最新文章

  1. 云原生网络代理(MOSN)的进化之路
  2. 编写程序定义一个有 10 个 int 型元素的数组,并以其在数组中的位置作为各元素的初值。
  3. π!到底蕴藏了多少不为人知的秘密?|今日最佳
  4. 有哪些皮一下就很开心的句子?
  5. mysql学习【第2篇】:基本操作和存储引擎
  6. java循环隔行变色_c:foreach标签详解----(隔行换背景颜色的问题)
  7. c++ []是什么意思
  8. Python数据结构与算法(3.3)——队列
  9. 每天一个小技巧(新建桌面)
  10. 世界标准时间(日期带T)转北京时间
  11. C++ map通过key获取value
  12. 荣耀30sr升级鸿蒙,华为荣耀30怎么升级鸿蒙系统?
  13. 维夏英语暑期调研小分队——第二天
  14. python另存为_python 将word另存为txt
  15. 面试-操作系统-进程管理-进程-进程调度-死锁
  16. SQL Server Check检查约束用法
  17. js股票K线图,比较专业的K线图插件
  18. 求职材料准备-入门导读
  19. 河南大学计算机类的专业排名,河南大学王牌专业有哪些及专业排名
  20. 子弹散射——Unity随手记(2021.2.4)

热门文章

  1. cse7761电能计量芯片驱动程序
  2. python如何将图片分成不同颜色的区域——三通道彩色图片
  3. html中美元符号$转义字符是 #36;
  4. Had I not seen the Sun(如果我不曾见过太阳)
  5. 新手小白学吉他,如何掌握基础快速入门
  6. 【Zynq UltraScale+ MPSoC解密学习7】Zynq UltraScale+的PMU
  7. Nirvana-Nevermind
  8. HTML一条线匀速一定区域运动,通用的匀速运动框架如何打造
  9. QQ群关键字提醒设置
  10. 站内文案编辑seo关键词优化技巧