1_Data wrangling

gapminder:An excerpt of the data available at Gapminder.org. For each of 142 countries, the package provides values for life expectancy, GDP per capita, and population, every five years, from 1952 to 2007.
pipe: %>% 超级超级好用!!!!
R默认升序
filter: == character:""
arrange:排列整理 desc
mutate:改变or新增列

2_Data visualization

scale_x_log10(…)
scale_y_log10(…)
scale_x_sqrt(…)
scale_y_sqrt(…)
scale_x_reverse(…)
scale_y_reverse(…)
数据对数化:可以使得数据的绝对规模缩小

aes: x y size color
facet:把数据分行分列
facet_grid(x~y)

facet_grid(facets, margins = FALSE, scales = “fixed”, space = “fixed”,shrink = TRUE, labeller = “label_value”, as.table = TRUE, drop = TRUE)
facet_wrap(facets, nrow = NULL, ncol = NULL, scales = “fixed”, shrink = TRUE, as.table = TRUE, drop = TRUE)
其中facet_wrap和facet_grid不同在于facet_wrap是基于一个因子进行设置,facets表示形式为:变量(单元格)
而facet_grid是基于两个因子进行设置,facets表示形式为:变量变量(行列),如果把一个因子用点表示,也可以达到facet_wrap的效果,也可以用加号设置成两个以上变量
具体的参数(把两个函数参数和在一起):
nrow,ncol 分面索要设置成的行和列,参数为数值,表示几行或者几列
scales 参数fixed表示固定坐标轴刻度,free表示反馈坐标轴刻度,也可以单独设置成free_x或free_y
shrink 也和坐标轴刻度有关,如果为TRUE(默认值)则按统计后的数据调整刻度范围,否则按统计前的数据设定坐标。
drop 表示是否去掉没有数据的分组,默认情况下不显示,逻辑值为FALSE
as.table 和小图排列顺序有关的选项。如果为TRUE(默认)则按表格方式排列,即最大值(指分组level值)排在表格最后即右下角,否则排在左上角。
margins 通过TRUE或者FALSE表示否设置而一个总和的分面变量,默认情况为FALSE,即不设置
space 表示分面空间是否可以按照数据进行缩放,参数和scales一样
https://www.cnblogs.com/wkslearner/p/5715095.html

scales:根据x或者y进行调整,可以有fixed free
shrink:调整分区面积
margins:加不加all的总视图
summarize:mean sum median min max

3_Grouping and summarizing

gapminder %>%
filter(year == 2007) %>%
summarize(meanLifeExp = mean(lifeExp),
totalPop = sum(pop))


最终结果就是:group_by为前几列,summarize紧跟其后

ggplot(by_year, aes(x = year, y = totalPop)) +
geom_point() +
**expand_limits(y = 0)**  //把y轴设置为0开始

4_Types of visualizations

geom_point()
geom_bar()
geom_col()

There are two types of bar charts: geom_bar makes the height of the bar proportional to the number of cases in each group (or if the weight aesthetic is supplied, the sum of the weights). If you want the heights of the bars to represent values in the data, use geom_col instead. geom_bar uses stat_count by default: it counts the number of cases at each x position. geom_col uses stat_identity: it leaves the data as is.

bar条和条之间有分隔线,histogram每个条都紧紧挨着

这是我个人问题:
stat_count() must not be used with a y aesthetic.
原因:需要将stat = stat_count(在geom_bar()中的默认值)更改为标识。

正确答案:

geom_bar(stat="identity")

geom_histogram
只需要X轴(aes(x=))

labs(x=“x”,y=“y”,title = “geom_line”)

Conclusion

好啦,这一章学习也结束了。学习效率不高,虽然说疫情期间待在家里受到烦扰要素很多,但自己的学习积极性也不高。其实很惭愧。之前断断续续学了R,这两门课都是反复看过的。其实目前最大的障碍反而是英文orz!!!不过随着学的时间增加,对于datacamp的英文授课很习惯了。还是想说一句datacamp国内网是真的慢!!!好想要梯子呜呜呜~

Datacamp_Introduction to the Tidyverse相关推荐

  1. r语言 整理、处理数据步骤_R语言万能数据清洗整理包Tidyverse(一)

    数据整理和清洗是任何统计分析的前提,也是最为困难的一个环节,很多软件也提供了数据整理和清洗的功能.甚至连我们常用的EXCEL也可以做这个工作,但是效率很低,而且容易出错,且无法完整保存清洗过程.R语言 ...

  2. R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程

    1. 数据分析的开端,Tidyverse? tidyverse 是一个清晰的 R 包集合,在数据操作.探索和可视化领域提供统一的数据科学解决方案,这些解决方案具有共同的设计理念.它是由 RStudio ...

  3. R语言tidyverse数据处理建模案例

    管道%>% 左连接left_join() 筛选行 filter(条件) 行排序arrange() 选择列select() 修改(计算)列mutate() 分组汇总group_by().%> ...

  4. r语言提取列名_玩转数据处理120题之P1-P20(R语言tidyverse版本)

    前言 今天在微信公众号[早起Python],看到有篇文章叫做[玩转数据处理120题],最初来自[Pandas进阶修炼120题],作者刘早起开始是用pandas实现的,后来又加入了中山大学博士陈熹的R语 ...

  5. r语言 悲观剪枝_《R语言编程—基于tidyverse》新书信息汇总

    我之前预告过的 R 语言新书,起名为<R语言编程-基于tidyverse>,本书的目的是为了在国内推广 R 语言和 R 语言最新技术,电子版将始终跟踪最新并免费分享.本书非常适合新手 R ...

  6. tidyverse笔记——tidyr包

    tidyverse笔记--tidyr包 tidry:Tidy Messy Data 常用函数及其功能 tidyr--Reshape Gather Spread pivot_longer & p ...

  7. tidyverse及其子包

    tidyverse   tidyverse包中有八个常用包,主要有ggplot2/tibble/tidyr/readr/purrr/dplyr/stringr/forcat,如果需要其他包,我们只能还 ...

  8. r 字符串转化为数值_【R语言】tidyverse之一:读写数据

    一. 相关包简介 (1) tibble包 R 数据框的更先进的替代,不将字符串转化为因子型,不重命名列,输出内容更智能,选择 tibble 子集仍是 tibble(Base R 中,1列返回向量) 查 ...

  9. DataCamp课程 <Tidyverse> Chapter.3 分组和概括

    Tidyverse课程目录 Chapter 1. 数据整形 Chapter 2. 数据可视化 Chapter 3. 分组和概括 Chapter 4. 可视化类型 Chapter 3. 分组和概括 用s ...

最新文章

  1. cisco 核心交换机连接两个路由器_CISCO、H3C、华为三层交换机端口二三层切换命令对比...
  2. Angular2.0 基础: Form
  3. Win10解决无法访问其他机器共享的问题
  4. Linux列出安装过的程序
  5. EF中执行Sql语句
  6. 最最牛的SQL客户端软件
  7. 史上最全的 iOS测试工具集锦(自动化、性能)
  8. 计算机科学与ICT技术书籍、资料推荐
  9. 每日一词20190313——地图矢量化
  10. 基于MATLAB的车牌识别系统
  11. 超市选址c语言程序,谈谈超市选址的重要性
  12. iis 值不在预期的范围错误解决办法
  13. 豆瓣的robots内容分析
  14. 阿里P8大牛手把手教你!15个经典面试问题及回答思路,全套教学资料
  15. 关于win7不识别maxon驱动器的解决办法
  16. python做数据库管理系统_python+mysql做一个图书管理系统?
  17. 医院网站推广的基本策略
  18. 二十九、搜索与图论——克鲁斯卡尔算法(Kruskal 算法,稀疏图)
  19. Xposed入门教程
  20. 电商交易系统核心技术

热门文章

  1. B12专访 | 袋鼠云拖雷:未来十年是数据中台的黄金年代
  2. c语言复制粘贴快捷键_windows复制粘贴快捷键,windows系统复制粘贴快捷键
  3. 每日一书丨地表最强:iOS安全黑宝书中文版来袭
  4. [经验栈]C#与泰克示波器(Tektronix oscilloscope)MSO64通信操作
  5. 用js判断字符串的字节长度(区分汉字和英文)@莫成尘
  6. C语言中fopen的详细用法
  7. 前端开发:JS中exec()和match()的对比使用
  8. 基于c语言实现的对代码的同源性检测
  9. Centos8常用软件安装
  10. 我国AGV工业编年史(图谱)从1975年第一台磁导航AGV开始