1 数据抽样
(1) 简单随机抽样

sample(x,size,replace=FALSE,prob=NULL)

其中,x表示待抽取对象,一般情况下以向量形式表示;size为非负整数,表示想要抽取样本的个数;replace表示是否为可放回抽样,默认不放回;prob用于设置各个抽样样本的抽样概率,默认等概率抽样。

例子:

library(MASS)
data(Insurance)
sub1=sample(nrow(Insurance),10,replace=T)
sub2=sample(nrow(Insurance),10)
sub3=sample(nrow(Insurance),10,replace=T,prob=c(rep(0,nrow(Insurance)-1),1))
#设置最后一个样本的抽样概率为1,其他样本被抽到的概率为0

备注:sample为自带函数

(2) 分层抽样

strata(data, stratanames=NULL, size, method=c(“srswor”,”srswr”,”poisson”,”systematic”), description=FALSE)

其中,data为待抽样数据集;stratanames中放置进行分层所依据的变量名称;size用于设置各层中将要抽出的观测样本数,其顺序应该与数据集中变量各水平出现顺序一致,且在使用该函数前,应当首先对数据集按照该变量进行升序排列;method参数用于选择抽样方法,分别对应于无放回、有放回、泊松、系统抽样,默认无放回;pik用于设置各层中各样本的抽样概率;description参数用于选择是否输出含有各层基本信息的结果。

sub4=strata(Insurance,stratanames="District",size=c(1,2,3,4),method="srswor")
#按照街区进行分层,且1~4个街区中无放回抽取1-4个样本

(3) 整群抽样

cluster(data, clustername, size, method=c(“srswor”,”srswr”,”poisson”,”systematic”), description=FALSE)

与分层抽样稍微不同的是,clustername指用来划分群的变量的名称,而size不再为分层抽样中的一个向量,这里仅为一个正整数,表示需要抽取的群数。

sub5=cluster(Insurance,clustername="District",size=2,method="srswor")

备注:strata和cluster函数需要加载sampling包

2 概率分布
R中提供了18个分布函数

对于所给的分布名称,加前缀“d”(代表密度函数, density)就得到R的密度函数(对于离散分布, 指分布律); 加前缀“p”(代表分布函数或概率, CDF)就得到R的分布函数; 加前缀“q”(代表分位函数, quantile)就得到R的分位数函数; 加前缀“r”(代表随机模拟, random)就得到R的随机数发生函数.

基于R统计分析——样本与分布相关推荐

  1. 基于R统计分析——探索性数据分析

    数据的统计分析分为描述性统计分析和统计推断两部分, 前者又称为探索性统计分析, 它是通过绘制统计图形.编制统计表格.计算统计量等方法来探索数据的主要分布特征, 揭示其中存在的规律. 探索性数据分析是进 ...

  2. 李倩星r语言实战_《基于R的统计分析与数据挖掘》教学大纲

    <基于 R 的统计分析与数据挖掘>课程教学大纲 课程代码: 090542009 课程英文名称: R Language and Data Mining 课程总学时: 32 讲课: 32 实验 ...

  3. R语言构建logistic回归模型并评估模型:构建基于混淆矩阵计算分类评估指标的自定义函数、阳性样本比例(垃圾邮件比例)变化对应的分类器性能的变化、基于数据阳性样本比例选择合适的分类评估指标

    R语言构建logistic回归模型并评估模型:构建基于混淆矩阵计算分类评估指标的自定义函数.阳性样本比例(垃圾邮件比例)变化对应的分类器性能的变化.基于数据阳性样本比例选择合适的分类评估指标 目录

  4. 基于R语言、MaxEnt模型融合技术的物种分布模拟、参数优化方法、结果分析制图与论文写作

    详情链接 :基于R语言.MaxEnt模型融合技术的物种分布模拟.参数优化方法.结果分析制图与论文写作 内容介绍:  第一章 .理论篇 以问题导入的方式,深入掌握原理基础 : 什么是MaxEnt模型? ...

  5. 《数学建模:基于R》一一2.2 方差分析

    本节书摘来自华章计算机<数学建模:基于R>一书中的第2章,第2.2节,作者:薛 毅 更多章节内容可以访问云栖社区"华章计算机"公众号查看. 2.2 方差分析 方差分析是 ...

  6. 《数学建模:基于R》一一2.1 回归分析

    本节书摘来自华章计算机<数学建模:基于R>一书中的第2章,第2.1节,作者:薛 毅 更多章节内容可以访问云栖社区"华章计算机"公众号查看. 2.1 回归分析 在许多实际 ...

  7. 【转】时间序列分析——基于R,王燕

    <时间序列分析--基于R>王燕,读书笔记 笔记: 一.检验: 1.平稳性检验: 图检验方法: 时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列 自相关图检验:(acf函数)平稳序列 ...

  8. r语言 线性回归 相关系数_基于R语言的lmer混合线性回归模型

    原文 基于R语言的lmer混合线性回归模型​tecdat.cn 混合模型适合需求吗? 混合模型在很多方面与线性模型相似.它估计一个或多个解释变量对响应变量的影响.混合模型的输出将给出一个解释值列表,其 ...

  9. 【学习笔记】kaggle案例之泰坦尼克号(基于R)

    kaggle案例之泰坦尼克号(基于R) 泰坦尼克号案例 数据预处理 决策树模型建立 泰坦尼克号案例 泰坦尼克号数据集为1912年泰坦尼克号撞击冰山沉没事件中一些乘客和船员的个人信息及是否幸存的状况.可 ...

  10. 基于R语言混合效应模型(mixed model)案例研究

    全文链接: http://tecdat.cn/?p=2596 在本文中,我们描述了灵活的竞争风险回归模型.回归模型被指定为转移概率,也就是竞争性风险设置中的累积发生率(点击文末"阅读原文&q ...

最新文章

  1. python好学吗mooc中文网-Python学习第一课-MOOC嵩天
  2. GPUImage API 文档之GPUImagePicture类
  3. 【暴力】I Liked Matrix!
  4. 如何在linux上安装sqlite数据库
  5. 理解Java里面的必检异常和非必检异常
  6. Leetcode算法题(C语言)5--存在重复
  7. iRobot 公司招聘,机器人、SLAM、视觉感知、路径规划方向
  8. Git学习总结(3)——代码托管平台简介
  9. Struts2学习笔记(五) Action(下)
  10. 太阳能充电调节代码_永不插电!这款薄膜太阳能动力汽车可连续行驶一个月
  11. 索爱确认2月13日发布Xperia Play
  12. python常用的颜色英文表达_python常用颜色
  13. HTML 自动跳转代码
  14. java浏览器控件jxbrowser(简单demo模拟自动登录与点击)
  15. 扫雷——Windows上的经典小游戏
  16. 关于Android端模拟登陆教务系统
  17. mac右键文件夹,选择打开方式
  18. 纬创软件本社对日JAVA开发
  19. 手把手教你---猿如意之八大高效利器使用
  20. Win10版本太低更新不了怎么办

热门文章

  1. 力扣(LeetCode)244. 最短单词距离 II(2022.09.01)
  2. 能上QQ不能打开网页的情况之一
  3. Poco库使用:单元测试
  4. NDT-MCL定位算法论文解读
  5. STM32F103_study52_The punctual atoms(STM32 The running light experiment )
  6. 技术人生:高山仰止,景行观止,虽不能至,我心向往之
  7. 130 个相见恨晚的超实用网站
  8. 人物-胡玮炜:胡玮炜
  9. mac os操作系统如何降级
  10. 私有CA搭建并将HTTPS应用于Tomcat、Springboot