一、分享简单随机抽样的几种方法

1、抽样分析工具抽样

2、INDIRECT+RANDBETWEEN函数抽样

3、RAND+排序抽样

4、SAS抽样

二、分层抽样方法

1、Python分层抽样

2、SAS分层抽样

3、EXCEL函数及功能分层抽样

简单随机抽样的几种方法

方法一

抽样分析工具抽样

如果你的EXCEL尚未安装数据分析,采用以下方法调出“数据分析”工具:

EXCEL2013版:

“文件”——“选项”——“加载项”——“分析工具库”,然后确定,即可添加在EXCEL工具栏。

EXCEL2007版:

“选项”——“加载项”——“分析工具库”进行加载即可。

(以2013版为例:)

举例:某企业有客户10万,现需要通过电话回访的方式进行客户满意度调查,了解客户对企业产品和服务的评价。如果直接对10万客户进行回访,时间成本、人员成本都难以估算,经过专家论证、客户认可,现决定从10万名客户中抽取1000名作为调查样本进行回访,为了保证结果的客观性,采取随机抽样的方式进行抽查。

1、打开需要抽样的EXCEL表格

2、选“数据”——“数据分析”——“抽样”

3、根据要求选:

  • “输入区域”的数据

  • 抽样方法选“随机”

  • 输出选项选“输出区域”(以此为例)

4、结果如图:(从10万名客户里随机抽取1000名客户进行调研,抽取结果如下)

然后通过计算可得出抽样的情况,从而可以推断出总体情况。

备注:

1、抽样样本越多,所得的结果,越接近真实结果;

2、用抽样分析工具抽样,只能对数值型数据进行抽样,对于其他类型的抽样无法完成。

方法二

INDIRECT+RANDBETWEEN函数抽样

举例:某企业有客户2万,现需要通过电话回访的方式进行客户满意度调查,了解客户对企业产品和服务的评价。如果直接对2万客户进行回访,时间成本、人员成本都难以估算,经过专家论证、客户认可,现决定从2万名客户中抽取100名作为调查样本进行回访,为了保证结果的客观性,采取随机抽样的方式进行抽查。

1、 打开需要抽样的EXCEL表格

2、在EXCEL的空白区域写入,暂以E列为例,在E2写入

=INDIRECT("a"&RANDBETWEEN(2,20001)),下拉100个单元格,结果如下:

3、然后通过计算可得出抽样的情况,从而可以推断出总体情况。

方法三

用RAND函数加排序功能

举例:某企业有客户10万,现需要通过电话回访的方式进行客户满意度调查,了解客户对企业产品和服务的评价。如果直接对10万客户进行回访,时间成本、人员成本都难以估算,经过专家论证、客户认可,现决定从10万名客户中抽取1000名作为调查样本进行回访,为了保证结果的客观性,采取随机抽样的方式进行抽查。

1、在B1中输入“=RAND()”,向下填充至C1000000

2、选择C列,点击工具栏中的数据→升序,在弹出的窗口中选择“扩展选定区域”,再点击“排序”按钮

3、此时A列中的序号已经打乱了,直接看A2至A10001中的值就可以达成“随机抽查10个客户”的要求了,然后通过计算可得出抽样的情况,从而可以推断出总体情况。

方法四

利用SAS软件进行随机抽样

PROC SURVEYSELECT一般形式:

Proc surveyselect data=

Method=/*抽样方法选择*/

out=

n=(or samprate=抽样比例)

seed=n;

strata ;

id ;

run;

1.从数据集text.bclass中不重复随机抽取20条记录,保留所有变量

proc surveyselect data=text.bclass out=srsa1 method = srs

sampsize =20;

run;

2. 从数据集text.bclass中重复随机抽取20条记录,保留所有变量

proc surveyselect data=text.bclass out=srsa1 method= urs

sampsize =20;

run;

3. 随机抽取总体的10%作为样本,保留所有变量

proc surveyselect data=sashelp.prdsale out=srs415 method = srs

samprate = 0.1;

run;

简单随机抽样进阶——分层抽样方法

方法一

利用Python进行分层抽样

import pandas as pd

df = pd.read_excel(r"地址及名称.xlsx")

data = pd.DataFrame(df)

gbr = data.groupby("分层变量")

tdict={"变量1":1500,"变量2":1500,"变量3":1500,"变量4":1500,"变量5":1500,"变量6":1500,"变量7":1500}/*分层变量,及每个变量需要抽取的数量 */

def sampling(group,tdict):

name = group.name

n = tdict[name]

return group.sample(n=n)

resut = data.groupby("分层变量",group_keys=False).apply(sampl

ing,tdict)

resut.to_excel(r"输入地址及名称.xlsx")

方法二

利用SAS软件进行随机抽样

1、手工设置抽样比例或者抽样数

proc sort data=test1;

by 分层变量;

run;/*先用分层变量对总体样本进行排序*/

proc surveyselect  data=test1 out=results3 method=srs

samprate=(0.1,0.3,0.5,0.2);/*根据分层情况设置每一层要抽取的比例*/

strata 分层变量;

run;/*根据分层变量不等比例从总体中抽取样本*/

proc surveyselect  data=test1 out=results3 method=srs

sampsize=(30,20,50,40);/*根据分层情况设置每一层要抽取的样本数*/

strata 分层变量;

run;

2、根据抽样表进行不等比例抽样

proc sort data=test1;

by 分层变量;

run;/*先用分层变量对总体样本进行排序*/

proc surveyselect  data=test1 out=results3 method=SRS

samprate=samp_table;/*通过抽样比例数据集进行抽样,samp_table数据集中要包括分层变量,以及每一分层对应的抽样比例或者数量,如果按比例抽样变量必须用_rate_来命名抽样比例,如果是按数量抽样必须用_nsize_来命名抽样数量*/

strata 分层变量;

run;

方法三 

利用excel函数及相关功能进行分层随机抽样

1、利用rand()函数,添加辅助列随机

2、去除rand()函数公式,升序、降序排列都可以

3、利用countif(A$2$:A2,A2)添加辅助列,并去除公式

4、将每个类型需要抽取的数量放到任意区域

5、利用Excel中数据-高级功能进行随机抽取

作者:渠道研究部冯乙

Python方法:胡扬指导

SAS方法:杨家辉指导

点击在看,了解更多精彩内容

excel随机抽取_简单随机抽样及其进阶分层随机抽样方法展示相关推荐

  1. excel随机抽取_Excel条件格式,扮靓你的报表

    为一亿职场人士赋能 后台回复100 领取100节Excel课程 哈喽,大家好. 储君老师又来送书啦! 今天送出本周的第2本书 前1天送的书请见 一小时教你全面了解微软Office认证考试 8个实用Ex ...

  2. Mysql数据库的简单备份与还原_简单的MySQL备份与还原方法分享

    为了安全起见,需要经常对数据库作备份,或者还原.对于 MySQL 而言,最方便的方法可能就是用 phpMyAdmin 的导出.导入功能了,但如果你的数据库体积比较大,作为 Web 应用的 phpMyA ...

  3. vscode win10笔记本 蓝屏_遇到win10电脑蓝屏怎么办_简单解决win10蓝屏的方法

    Win10系统出现蓝屏现象属于比较常见问题之一,想必大家也不陌生了.如果电脑时不时出现蓝屏,会影响正常使用体验,引发win10电脑蓝屏的原因有很多,可能是系统问题,还可能是驱动问题,也有可能是硬件问题 ...

  4. excel随机抽取_Python自制班级点名器让Excel表格用起来

    Welcome to 巧乐希 Join us!学习Python! 小溪流 终将汇成大海 作者:小溪流(爱好科技教育的工程师.) 像孩子一样学习Python. 上课啦,点名回答问题 同时记录下每个学生的 ...

  5. 在envi做随机森林_简单粗暴 |土地利用遥感影像处理(从数据下载到ENVI与ArcGIS结合)...

    1数据获取 打开任何一个浏览器搜"地理空间数据云"或者在网页地址处输入网址: http://www.gscloud.cn ,注册账号登录进去,点击高级搜索,设定下载区域范围以及传感 ...

  6. python 获取excel文本框_简单使用python做excel多文件批量搜索(带图形界面)(已更新)...

    [Python] 纯文本查看 复制代码import xlwings as xw #引入xlwings处理excel from tkinter import * #引入tkinter处理界面 impor ...

  7. java将jsp页面表格导出excel表格数据_简单的POI导出JSP页面表格数据到excel

    数据库中的equipment表数据: 读取数据库中表数据的代码TestExcel.java public class TestExcel extends BaseAction{/** * @param ...

  8. 本地差分隐私 随机响应_局部差分隐私的新型实现方法

    董涛 刘芸菲 摘要:有效的隐私保护数据发布解决方案之一是局部差分隐私,随机响应是实现这种隐私保护模型的有效方式.对基于二次扰动的局部差分隐私实现方法进行了研究.为衡量D和D'的离散程度,在计算原始数据 ...

  9. ddos攻击工具_简单有效的ddos攻击防御方法

    做过网站的站长大多有被ddos攻击的经历,不少人面对竞争对手的网站就是直接雇人ddos攻击网站,导致对方网站长期打不开,最后无奈关闭网站,初尧今天就告诉大家一个最简单也是最有效的防御方法. 高防服务器 ...

最新文章

  1. .net平台性能很不错的轻型ORM类Dapper(转)
  2. 如何写出一个confirm组件
  3. (0066)iOS开发之UITableViewCell上子控件通过superView找对应的cell的探究
  4. Java程序员必备的Intellij插件
  5. OpenCV+python实现视频文件读写
  6. linux查看杀死进程
  7. android如何与服务器交互?
  8. Solving environment: failed with initial frozen solve.Retrying with flexible solve
  9. 美团将建新上海总部 斥资65亿元拿下上海杨浦商办地块
  10. java a%2==0_Java 初始化a=2 打印a+++a++为5
  11. 前端—每天5道面试题(九)
  12. js中数组常用的方法总结,包括ES6
  13. 【ROS】ros入门21讲(下)
  14. Vue.js05:vue内联样式
  15. 前端VUE完成截取当前页面转PDF,支持分页
  16. 记录小新pro13 Intel版(S540-13IML)安装hackintosh的一些要点
  17. Python实现批量网站URL存活检测
  18. 小米手机运行linux,在Linux系统下使用小米刷机工具:XiaoMiTool V2(XMT2)
  19. 人工智能技术的原理是什么,人工智能技术在实际应用中具有哪些优势?
  20. ibmr系列服务器怎么装架子,【R440/R540/R640/R740 R820 R930 DELL服务器导轨 滑轨 支架 理线架】价格_厂家 - 中国供应商...

热门文章

  1. 每个Java开发人员都应该知道的10个基本工具
  2. Nutshell中的Java 8语言功能-第2部分
  3. JDK 10:FutureTask获取一个toString()
  4. 使用Okta的单点登录保护您的Vert.x服务器
  5. jsf服务_使用JSF的面向服务的UI
  6. nosql的数据服务_使用NoSQL实现实体服务–第3部分:CouchDB
  7. 截止到2013年,核心Java帖子
  8. 使用Google GSON:额外的赠品:第二部分
  9. Neo4j Java REST绑定–第2部分(批处理)
  10. 单元测试技巧:创建描述性测试