为什么80%的码农都做不了架构师?>>>   

ddply()函数位于plyr包,用于对data.frame进行分组统计,与tapply有些类似

准备数据

# 使用stringsAsFactors=F来防止data.frame把向量转为factor
apache = data.frame(httpCode=c(200,200,200,404,404,500),time=c(100,111,210,10,10,500),api=c('index','index','logout','show','show','index'),stringsAsFactors=F)

统计每个api的请求数

ddply(apache,.(api),summarize,number=length(api))api number
1  index      3
2 logout      1
3   show      2

统计每个api的各个httpCode的请求数:

a <- ddply(apache,.(api,httpCode),summarize,number=length(api))api httpCode number
1  index      200      2
2  index      500      1
3 logout      200      1
4   show      404      2

下面这个复杂些,根据上面的统计结果a,统计每个api所占比例

b <- ddply(a, .(), .fun=function(x){transform(x, percentage=with(x,ave(number,api,FUN=sum)/sum(number)))}).id    api httpCode number percentage
1 <NA>  index      200      2      0.333
2 <NA>  index      500      1      0.167
3 <NA> logout      200      1      0.167
4 <NA>   show      404      2      0.333

这就是说你可以根据需要写自己的统计函数

用ggplot画api占比图

ggplot(b,aes(x=reorder(api,percentage),y=percentage,fill=factor(httpCode))) + geom_bar() +scale_y_continuous(labels = percent_format()) +coord_flip() +

转载于:https://my.oschina.net/enyo/blog/162595

R语言利器之ddply相关推荐

  1. R语言函数总结(转)

    R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字. 基本命令要么是表达 ...

  2. 【转】R语言函数总结

    原博: R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头, ...

  3. 转载 | R语言总结

    R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字. 基本命令要么是表达 ...

  4. 【R笔记】R语言函数总结

    R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字 ...

  5. R语言之离群点检验(part1)--利用箱线图原理检测离群点

    学习笔记 参考书目:<R语言与数据挖掘>.<统计学> 利用箱线图原理检测离群点 箱线图 箱线图是由数据的最大值.最小值.中位数.两个四分位数这五个特征值绘制而成的,它主要用于反 ...

  6. R语言基础之第六部分 分类(史上最全含ddply、aggregate、split、by)

    R语言基础之第六部分 分类(史上最全含ddply.aggregate.split.by) 数据: 某市2014年-2018年空气质量指数日数据,需要按年分类计算每年 warm值为1和 0的均值. 数据 ...

  7. 常用分类器之R语言篇

    本文介绍了四种分类器在R语言中的应用,包括数据预处理.分类器建立以及准确性评估. 1.数据预处理 本文选择的数据样本包括正常组织或癌症组织,每个样本都有若干个基因数据.数据预处理大致分为3个步骤:(1 ...

  8. (转载)R语言ARIMA时间序利

    原链接: https://www.cnblogs.com/silverangel/p/10132361.html 基于R语言的时间序列分析预测 数据来源: R语言自带 Nile 数据集(尼罗河流量) ...

  9. R语言ggplot2可视化

    R语言数据可视化必备利器之ggplot2包 由于最近学习必要画图较多,所以对R语言ggplot2包的使用较多,在此分享一下自己的心得以及体验,如有错误请小伙伴即时更正. ggplot2有着自己的语法, ...

  10. 价值1143元的《R语言统计分析微生物组数据(Statistical Analysis of Microbiome Data with R)》系列图书

    文章目录 <R语言统计分析微生物组数据> 本书简介 作者简介 章节简介 猜你喜欢 写在后面 <R语言统计分析微生物组数据> Statistical Analysis of Mi ...

最新文章

  1. 从oracle中读取图片,从oracle数据库中读取图片,在jsp?
  2. C#-数组定义及使用数组的好处 046
  3. colab长时间处于正在连接
  4. 命令行输入mysql不行_MySQL命令行无法插入中文数据
  5. 【机器学习实践】Jupyter Notebook安装 侧边导航栏功能 操作及其他常用扩展功能介绍...
  6. inner join 与 left join 、right join之间的区别
  7. OAuth2.0认证服务器之授权码存放
  8. 饿了么商品排序怎么实现PHP,PHP实现桶排序算法
  9. sql casewhen
  10. 【语音信号处理课程设计】基于MATLAB的隐马尔可夫和矢量量化的语音识别研究
  11. 用C语言输入半径求球体的体积
  12. kali中清除历史命令
  13. 美团也玩大数据杀熟?
  14. java树型结构数据根据条件移除节点(递归方式)
  15. 黑客攻陷'360安全论坛' 偷窃网游和QQ帐号
  16. 外部中断----高低电平触发,(边沿触发)上升沿触发和下降沿触发区别
  17. 【weblogic】WTC配置(Weblogic Tuxedo Connector)
  18. 什么牌子的护眼灯最好?分享四款护眼灯合格的品牌
  19. codeforces 711 C. Coloring Trees (dp)
  20. 如何将python项目部署到服务器_怎么把python部署到服务器

热门文章

  1. Mac实用技巧:怎样使用终端在macOS Big Sur Finder中锁定文件!
  2. 喜大普奔,FL Studio终于出官方中文版了!
  3. 新手学习Linux——搭建个人论坛
  4. the database profile could not loaded. Check log for details
  5. webpack4入门笔记——loader
  6. declare-styleable中format详解
  7. oe7 安装财务模块后,科目表没有导入成功
  8. Memory Management (内存管理)
  9. [Node] 基础知识
  10. 关于win32程序如何共享数据