作者:Joseph Rickert

翻译:黄小伟,10年资深数据矿工。目前就职杭州有赞数据分析团队,欢迎加入!


2019年7月份,176个R新包收录于CRAN(6月份收录136个,环比增长29.4%),累计收录14,808个R包!由于CRAN会不定时进行R包增删,所以具体数量会随时间略有变化。

此次整理了十二个类别,分别为数据、数据科学、金融、基因组学、机器学习、数学、医学、统计学、时间序列、拓扑数据分析、工具和可视化。

以下是本期(总第32期)R新包的功能简介:

一. 数据

1. eia: 提供API接口,支持访问美国能源信息管理局(EIA)的数据.

2. litteR: 支持以一致和可复制的方式分析垃圾数据,包括:海滩垃圾、河岸垃圾、漂浮垃圾、海底垃圾等.

3. rSymbiota: 实现Symbiota门户的接口,允许用户查询包含植物、动物和真菌的自然历史集合.

二. 数据科学

1. bdpar: 提供一种工具,可轻松构建自定义数据流,以处理来自不同来源的大量信息.

2. modeLLtest: 支持进行Desmarais和Harden(2014)的交叉验证平均值(CVDM)测试和Desmarais和Harden(2012)的交叉验证中位数拟合(CVMF)测试.

三. 金融

1. lazytrade: 利用算法交易的思想,提供一套学习和实践数据科学的功能和方法.

2. RPEIF: 计算Zhang and Martin (2017)以及Chen and Martin (2018)提出的风险和绩效指标回报的影响函数时间序列.

四. 基因组学

1. MGDrivE: 提供一个利用基因驱动干预蚊子传播疾病控制的试验平台.

2. PACVr: 提供可视化完整质体基因组覆盖深度的功能,以及与圆形、四部分基因组结构和单个基因位置相关的反向重复区域的相等性.

五. 机器学习

1. forestRK: 提供计算随机森林中用于分类问题的常见分裂标准类型的函数,以及基于单个树或Forest-R.K进行预测的函数.

2. greenclust: 实现一种迭代折叠列联表的行的方法(一次两行),方法是选择组合生成具有最小卡方损失的新表的类别对,如Greenacre(1988)所述.

3. imgrec: 实现与谷歌图像识别系统VISION AI的接口.

4. mlr3: 为机器学习任务提供R6面向对象的编程构建块.

六. 数学

1. odin: 提供使用特定领域语言(DSL)生成常微分方程(ODE)系统并将其集成的函数.

2. pCODE: 包含Ramsay,J.O.、Hooker,G.、Campbell,D.和Cao,J.(2007)的参数级联方法的实现,用于估计缺少或完整观测的常微分方程模型.

七. 医学

1. MBNMAdose: 通过模拟不同的剂量反应函数,提供适合Bayesian剂量反应、基于模型的网络荟萃分析(MBNMA)的功能,该分析将多种剂量合并到一种药剂中.

2. qMRI: 实现了Weiskopf等人(2013)描述的定量图的估算方法.

八. 统计学

1. borrowr: 提供函数,通过从补充数据源来估计主要数据源的总体平均治疗效果。因果估计可以选择用贝叶斯线性模型或贝叶斯加性回归树(BART)来调整混杂度.

2. emax.glm: 对一般线性模型实现期望最大化(EM)回归.

3. kosel: 支持使用重新访问的仿冒程序对许多类型的L1正则化回归执行变量选择.

4. mipred: 使用多重插补校正预测的广义线性模型和Cox回归模型,以解释预测因子中的缺失值.

5.MixMatrix: 使用EM算法为矩阵变量法向t和反向t分布提供采样和密度函数.

6. sdcSpatial: 提供创建隐私保护光栅地图的功能,可以从空间点数据创建光栅地图.

九. 时间序列

1. distanta: 提供评估多变量时间序列之间差异的工具.

2. samurais: 提供各种统计潜在变量模型和无监督学习算法,以分割和表示单变量和多变量时间序列数据.

3. simts: 实现了一个支持时间序列分析课程的工具系统,包括一种称为小波矩的广义方法(GMWM).

十. 拓扑数据分析

1. BallMapper: 提供使用dlotko(2019)中描述的算法以抽象图的形式计算拓扑上精确的数据汇总的函数.

2. kernelTDA: 提供在标准统计学习算法中利用拓扑信息的工具,实现在持久性图空间上定义的内核,并为基于C ++ LIBSVM的内核支持向量机提供解算器,并使用C ++ HERA库计算Wasserstein距离的函数.

十一. 工具

1. babelwhale: 提供与docker和singularity容器交互的统一接口,允许用户在容器内执行命令.

2. fastmap: 提供键值存储的快速实现,通过在C ++中使用数据结构来避免常见的内存泄漏问题.

3. modelsummary: 利用gt和broom包为统计模型创建可自定义的、可发布的汇总表.

4. readwritesqlite: 提供向SQLite数据库读取和写入数据帧的功能.

5. rolldown: 提供基于JavaScript库的R Markdown输出格式.

6. rray: 提供一个工具包,通过使用广播和新的数组类,以一致、强大和直观的方式操作数组.

7. wyz.code.offensiveProgramming: 如攻击性编程手册中所述,提供代码以简化从防御性编程到攻击性编程的过渡.

十二. 可视化

1. altair: 实现Altair的接口,Altair本身是Vega-Lite的Python接口.

2. animint2: 提供在R代码中定义动画、交互式数据可视化以及在网页上呈现的功能.

3. apexcharter: 为apexcharts.js提供htmlwidgets接口,apexcharts.js是一个现代JavaScript图表库,可使用简单的API构建交互式图表和可视化.

4. ggparty: 将ggplot2功能扩展到partykit包,该包提供了为类方的树对象创建结构化和高度可定制的可视化的工具.

5. metadynminer3d: 提供从Plumed读取,分析和可视化Metadynamics 3D HILLS文件的工具.

说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~

往期Top 40 R包介绍:

精选| 2019年6月R新包推荐(第31期)

精选| 2019年5月R新包推荐(Top40)

精选| 2019年4月R新包推荐(Top40)

—————————————

往期精彩:

  • 真正的善良,在于收钱办事

  • 奥巴马买了部纪录片,介绍中国企业家开了一间《美国工厂》

  • 小红书,“黄”了

精选| 2019年7月R新包推荐(第32期)相关推荐

  1. 精选| 2020年5月R新包推荐(第42期)

    译:黄小伟,资深大数据分析从业者.目前就职杭州有赞数据分析团队,欢迎加入! 知乎专栏:中国R语言社区 |10000+关注(Top 1) 知乎圈子:数据分析圈 |5000+关注(Top 1) 2020年 ...

  2. 精选| 2021年6月R新包推荐(第55期)

    翻译:黄小伟,资深大数据分析从业者.目前就职杭州有赞数据分析团队! 知乎专栏:中国R语言社区.R语言中文社区 |26,000+关注.150万+阅读 知乎圈子:数据分析圈|11,000+加入 岗位招聘: ...

  3. 精选| 2021年9月R新包推荐(第58期)

    翻译:黄小伟,目前就职有赞数据分析团队! 知乎专栏:中国R语言社区.R语言中文社区 |27,000+关注.160万+阅读 岗位招聘:招聘|商业分析.数据分析... (可点击)欢迎加入我们 2021年9 ...

  4. 精选| 2021年5月R新包推荐(第54期)

    翻译:黄小伟,资深大数据分析从业者.目前就职杭州有赞数据分析团队! 知乎专栏:中国R语言社区.R语言中文社区 |26,000+关注.150万+阅读 知乎圈子:数据分析圈|11,000+加入 2021年 ...

  5. 精选| 2021年2月R新包推荐(第51期)

    译:黄小伟,资深大数据分析从业者.目前就职杭州有赞数据分析团队! 知乎专栏:中国R语言社区.R语言中文社区 |25,000+关注 知乎圈子:数据分析圈|11,000+加入 2021年2月,243个R新 ...

  6. 精选| 2020年12月R新包推荐(第49期)

    翻译:黄小伟,资深大数据分析从业者.目前就职杭州有赞数据分析团队! 知乎专栏:中国R语言社区 |11000+关注 知乎圈子:数据分析圈|10000+加入 2020年12月,123个R新包收录于CRAN ...

  7. 精选| 2020年8月R新包推荐(第45期)

    生物信息学习的正确姿势 NGS系列文章包括NGS基础.在线绘图.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞 ...

  8. 精选| 2022年1月R新包推荐(第62期)

    翻译:张珮珮,台湾清华大学工业工程学士,美国普渡大学工业工程硕士,目前就职于有赞数据分析团队 (微信号:peipei-chang) 知乎专栏:中国R语言社区.R语言中文社区 |27,000+关注.20 ...

  9. 精选|2018年7月R新包推荐

    作者 |  Joseph Rickert 翻译 |  黄小伟,先后从事游戏.社交及金融数据研究及应用,目前就职于网易杭州 来源 |  公众号:R语言中文社区 7月份,大约有251个R新包收录于CRAN ...

  10. autobagging r语言_快讯| 2017年7月R新包推荐

    7月份R官方在CRAN上发布了224个新包,以下为其中40个R包,涉及7个类别,诸如机器学习.统计.可视化.工具等.以下为各个R包的简要功能介绍,希望有助于大家快速了解其中功能. 一.机器学习 1. ...

最新文章

  1. 网格搜索后返回的就是最佳的模型
  2. php json和数组,php数组和json数组之间的互相转化
  3. layui templet格式化_layui数据表格日期如何格式化成2012-12-30这样的?
  4. cesium html源码,Cesium源码的本地运行及调试
  5. (pytorch-深度学习)批量归一化
  6. Cloud一分钟 | 华为云发布云数据安全白皮书;OPPO携手阿里云举行天池OGeek算法挑战赛...
  7. python火柴人打架代码_python火柴人
  8. [BZOJ 2594] [Wc2006]水管局长数据加强版 【LCT】
  9. 主管问我:你以为单元测试,只是测试吗?
  10. 阿里技术参考图册-研发篇
  11. 留个脚印,证明我来过~!
  12. 网站性能优化——雅虎14条
  13. 小米平板4刷机win10或linux,小米平板2中Win10/MIUI系统互刷终极教程
  14. 金蝶K3供应链单据套打设置(以采购订单为例)
  15. Notepad++汉化教程
  16. 爬虫BeautifulSoup库学习-小猪短租网
  17. 【自学】张量、维度、多维矩阵、dim、torch.argmax()
  18. Youtube字幕下载转SRT字幕
  19. Margin对span无效
  20. elementUI Drawer 抽屉打开时表单自动聚焦问题解决

热门文章

  1. 我的十年创作之路(三)——书稿创作经验谈
  2. 取出大文件里面的一部分数据
  3. 一篇 CPU 占用高,导致请求超时的故障排查
  4. Linux内核4.14 LTS发布:那些最新最好的功能特性
  5. 年薪 80w 的程序员被鄙视了!
  6. “等我干 IT 发财了,就和你离婚”
  7. 【C#】C#获取本地的内网(局域网)和外网(公网)IP地址的方法
  8. R语言--字符串操作
  9. #1062 – Duplicate entry ‘1’ for key ‘PRIMARY’
  10. Java-JDK:JDK百科