每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~

———————————————————————————

R语言·文本挖掘︱Rwordseg/rJava两包的安装

笔者:文本挖掘中这两个包可谓是“老顽固”,做文本挖掘必须要过的关卡,今天倒腾了一天,桌面下了一堆东西,终于弄出来了。故此,赶紧记录下来,以后可用:

关于这两个包的安装问题,有很多很多教程,很多方法,我就不一一介绍,如果我介绍的方法你安装不了,那你就得去下面的参考链接找找其他的方式。

只有RJava配置成功了,Rwordseg安装才可能成功,前者是后者的依赖包。

某神的观点,总结出以下两点经验,供后来人参考:

1、rJava在安装后除了对path配置正确外,还有个容易忽略的细节,即R版本的选择,如果JRE是64位的,那么R也应该要64位的版

本,否则肯定会报错。如果是在Rstudio中启动R,那么要检查下启动的R的版本是哪个,方法是看Tools-Global option的默认项。

2、Rwordseg放在Rforge而非CRAN上,因此如果直接install.packages,基本都会失败告终。正确方法是下载源码,本地安装,而

且打破一个传言,即Rwordseg只能在R3.0.2版本上安装成功,实际上,如果本地安装的化,R 3.1.0也可以安装成功。

(参考于:http://www.dataguru.cn/thread-503455-1-1.html)

———————————————分割线———————————————

一、Rwordseg包——文本分词(建议数据量<1G)

1、常用下载方式——语句执行法

网上盛行这样的方式:

install.packages("Rwordseg", repos="http://R-Forge.R-project.org")

用这一语句的前提是已经布置好rJava包,而布置好rJava包,还得布置java环境,

所以第一种语句执行法在一开始是行不通的。

会出现以下的报错:

trying URL 'http://R-Forge.R-project.org/src/contrib/Rwordseg_0.2-1.tar.gz'
Content type 'application/x-gzip' length 5445754 bytes (5.2 Mb)
opened URL
downloaded 5.2 Mb* installing *source* package 'Rwordseg' ...
** R
** demo
** inst
** preparing package for lazy loading
警告: package 'rJava' was built under R version 3.1.3
Error : .onLoad failed in loadNamespace() for 'rJava', details:call: inDL(x, as.logical(local), as.logical(now), ...)error: 无法载入共享目标对象‘D:/Program Files/R/R-3.1.2/library/rJava/libs/x64/rJava.dll’::LoadLibrary failure:  %1 不是有效的 Win32 应用程序。Error : package 'rJava' could not be loaded
ERROR: lazy loading failed for package 'Rwordseg'
* removing 'D:/Program Files/R/R-3.1.2/library/Rwordseg'
Warning in install.packages :running command '"D:/PROGRA~1/R/R-31~1.2/bin/x64/R" CMD INSTALL -l "D:\Program Files\R\R-3.1.2\library" C:\Users\Lance\AppData\Local\Temp\Rtmpgd2sAT/downloaded_packages/Rwordseg_0.2-1.tar.gz' had status 1
Warning in install.packages :installation of package ‘Rwordseg’ had non-zero exit statusThe downloaded source packages are in‘C:\Users\Lance\AppData\Local\Temp\Rtmpgd2sAT\downloaded_packages’

也会出现以下的错误:

错误于read.dcf(file.path(pkgname, "DESCRIPTION"), c("Package", "Type")) : 无法打开链结
此外: 警告信息:
1: In download.file(url, destfile, method, mode = "wb", ...) :下载的长度23091不等于报告的长度5470730
2: In unzip(zipname, exdir = dest) : 从zip文件中抽取1时出了错
3: In read.dcf(file.path(pkgname, "DESCRIPTION"), c("Package", "Type")) :无法打开压缩文件'Rwordseg/DESCRIPTION',可能是因为'No such file or directory'

2、手动下载安装包

(参考于:http://bbs.pinggu.org/thread-2989656-1-1.html)

第一步:先从官网下载安装包:https://r-forge.r-project.org/R/?group_id=1054

第二步:手动下载

把下载好的zip文件,用如图的方式打开即可。

———————————————分割线———————————————

二、rJava包

这个包是最麻烦的,要下载很多东西,R语言虽然可以通过install.packages("rJava")下载,但是会出现以下的报错:

载入需要的程辑包:rJava
Error : loadNamespace()里算'rJava'时.onLoad失败了,详细内容:调用: fun(libname, pkgname)错误: JAVA_HOME cannot be determined from the Registry
In addition: Warning message:
程辑包‘rJava’是用R版本3.2.3 来建造的
Error: 无法载入程辑包‘rJava’

第一步:下载java

可从官网下载:http://www.java.com/zh_CN/

直接安装。

但是我在安装的时候会出现以下的错误:

安装 JAVA 时提示,“在使用当前internet连接情况下,安装程序无法继续。”

于是乎可以用以下的链接去下载离线的版本,然后我的电脑就可以顺利下载了,

http://www.java.com/zh_CN/download/help/connect_proxy.xml

下载按照步骤来一路自定义,没改目录地址。

第二步:下载Java环境——JDK 1.7 安装包

我是在这个网址下载到的,可以用的:http://download.csdn.net/download/jczmdeveloper/8064891

(PS:这个的重要性在于,我换了一台新电脑,虽然把rJava拷贝过来了,但是library不起来,需要JDK的环境才能library)

PS:我在官方网址(http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html)下载的,会报错,在下载最后一步出现问题,而且不能忽略。

第三步:就可以直接library了。

———————————————分割线———————————————

三、贴一些其他报错情况下的解决方案

1、注意保存的工作目录

java&jdk安装-去java官网下载安装即可

(1)java-http://www.java.com/zh_CN/

(2)jdk-http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

注意:

(1)看电脑系统配置选择Windows x86/...跟R一致

(2)java&jdk安装到同一个文件夹下面,跟R同一个目录,比如 R的工作目录是"D:/Program Files/RStudio";java&jdk的工作目录是“D:\Program Files\Java”&“D:\Program Files\Java\jdk1.8.0_66”

(3)尤其要注意的点:安装jdk过程中,会提示jdk安装目录及jre安装目录,记住别都安装在java根目录下,比如把jre安装在java根目录下子文件夹中即可。参考:http://jingyan.baidu.com/album/6dad5075d1dc40a123e36ea3.html?picindex=1。

jdk环境配置

http://jingyan.baidu.com/article/f96699bb8b38e0894e3c1bef.html

注意:目录是jdk安装的目录,比如“D:\Program Files\Java\jdk1.8.0_66”

参考于:http://blog.sina.com.cn/s/blog_6676d74d0102w39h.html

2、JRE的路径设置错误等导致jvm.dll加载失败

出现以下的问题:

载入需要的程辑包:rJava
Error : loadNamespace()里算'rJava'时.onLoad失败了,详细内容:
调用: inDL(x, as.logical(local), as.logical(now), ...)
错误: 无法载入共享目标对象‘C:/Program Files/R/R-3.1.2/library/rJava/libs/x64/rJava.dll’::
LoadLibrary failure: 找不到指定的模块。错误: 无法载入程辑包‘rJava’

在R语言里运行下面的命令:

Sys.setenv(JAVA_HOME='C:/Program Files/Java/jdk1.6.0_33/jre')

原来运行xlsx包需要rJava,而rJava需要JAVA环境,问题主要是JAVA环境变量引起的,如果不愿意在外面设置JAVA_HOME、PATH和CLASSPATH之类的环境变量,直接在R环境里设置就行了。不过这样每次启动时都要设置一次,可以保存在R的启动环境中。

参考于:http://www.cnblogs.com/speeding/p/4159264.html

3、检查JAVA是否符合R的版本

1.是否安装JAVA,如果已经安装请检查JAVA是否符合R的版本。建议从新安装下JAVA:http://www.java.com/en/download/manual.jsp
2.不工作,在加载包之前,手动配置下java的位置
Sys.setenv(JAVA_HOME='C:\Program Files\Java\jre7') # for 64-bit version
Sys.setenv(JAVA_HOME='C:\Program Files (x86)\Java\jre7') # for 32-bit version library(rJava)

请注意,64位得JAVA,一定要安装在Program Files之中,不然会一直报错。

(参考于:http://www.zhihu.com/question/21584334)

每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~

———————————————————————————

R语言·文本挖掘︱Rwordseg/rJava两包的安装(安到吐血)相关推荐

  1. R语言︱文本挖掘之中文分词包——Rwordseg包(原理、功能、详解)

    笔者寄语:与前面的RsowballC分词不同的地方在于这是一个中文的分词包,简单易懂,分词是一个非常重要的步骤,可以通过一些字典,进行特定分词.大致分析步骤如下: 数据导入--选择分词字典--分词 但 ...

  2. R语言︱文本挖掘——词云wordcloud2包

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者看到微信公众号探数寻理中提到郎大为Chif ...

  3. R语言︱文本挖掘套餐包之——XML+SnowballC+tm包

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- R语言︱文本挖掘套餐包之--XML+tm+Sn ...

  4. R语言ggplot2可视化:使用patchwork包将两个ggplot2可视化结果图像垂直堆叠排列进行组合构图(vertically stack the plots)

    R语言ggplot2可视化:使用patchwork包将两个ggplot2可视化结果图像垂直堆叠排列进行组合构图(vertically stack the plots) 目录

  5. 随笔7:R语言绘图黑白印刷风格芯片包

    R语言绘图黑白印刷风格芯片包 1.基本说明 1.1本包的目标 让使用者将注意力集中在参数设定与调整上,而不是代码使用的细节,类似于一个芯片封装的过程.对几个常用的绘图函数进行了封装,并调整为印刷风格供 ...

  6. R语言ggplot2可视化将两个dataframe可视化的结果组合在一起实战:combining two plots from different data.frames

    R语言ggplot2可视化将两个dataframe可视化的结果组合在一起实战:combining two plots from different data.frames 目录 R语

  7. R语言sys方法:sys.timezone函数返回当前系统时区的名称、system.File函数查找系统文件或者安装包的文件路径(例如查看R Base可安装路径、dplyr包的安装路径)

    R语言sys方法:sys.timezone函数返回当前系统时区的名称.system.File函数查找系统文件或者安装包的文件路径(例如查看R Base可安装路径.dplyr包的安装路径) 目录

  8. R语言可视化分别使用lattice包和ggplot2包可视化热图(heatmap)并绘制热力图对应的系统树图(dendrogram)实战

    R语言可视化分别使用lattice包和ggplot2包可视化热图(heatmap)并绘制热力图对应的系统树图(dendrogram)实战 目录

  9. R语言ggplot2可视化使用ggridges包可视化山脊图(Ridgeline Plots):山脊图(Ridgeline Plots)应用场景、受试者口服茶碱的之后观察茶碱的浓度变化的山脊图

    R语言ggplot2可视化使用ggridges包可视化山脊图(Ridgeline Plots):山脊图(Ridgeline Plots)应用场景.受试者口服茶碱的之后观察茶碱的浓度变化的山脊图(Rid ...

最新文章

  1. python Django 管理站点1.3
  2. lightingJS
  3. python多态_Python 简明教程 21,Python 继承与多态
  4. 《守望先锋》中的末日铁拳是怎么摧毁玩家体验的?
  5. hihoCoder #1445 : 后缀自动机二·重复旋律5
  6. HDU 1248 寒冰王座(完全背包问题另类解法)
  7. leetcode 26. 删除有序数组中的重复项
  8. c# excel导出png_批量导出Excel文件中的图片,用VBA代码其实很简单
  9. 如何理解halcon 算子get_grayval 、set_grayval 逐行读取和逐行写入
  10. 64位程序如何调用32位dll(简单解决方案 )
  11. 区块链在切实改变世界的35个让人惊艳的实例数据库
  12. tableview 修改单元格内容字体大小_如何修改一次代码就可以完成多种类型 cell 的 UITableView 增删修改...
  13. 计算机快捷指令ip,IP小技巧之如何使用DOS命令行快速修改电脑IP地址?
  14. suse linux安装rpm包,suse linux rpm 安装
  15. 电子信息工程考研方向计算机,电子信息工程考研方向
  16. 对冲策略及Python实现
  17. 单片机中的数据存储器ram
  18. iOS-记一些官网地址
  19. Hadoop数据完整性与CheckSum校验原理
  20. 布莱恩.迪森 的发言稿

热门文章

  1. Linux下QT4.7.1静态编译过程
  2. C#中完美克隆引用类型的对象
  3. SQL Server Update:使用 TOP 限制更新的数据
  4. 我和EDAS这两年——阿里巴巴入职两年的小结
  5. 2016-2017中国房地产走势大数据报告亮相
  6. 解决Jquery Kendo.xxx is not a function 的方法
  7. DeveloperAppleHelp
  8. 【javascript激增的思考03】MVVM与Knockout
  9. JQuery学习笔记 [Ajax] (6-1)
  10. Pytorch学习笔记总结