一.基本规则

1.DATA步骤:定义数据和创建数据集,以DATA 开始,以DATALINES结束;PROC步骤:定义统计分析的类型,每个PROC过程后接一个run语句。

2.SAS变量名必须遵循以下原则:以字母或者下划线开头,不超过32个字符长度,不能使用空格或者特殊字符

3.注释:以*开头,分号结尾,中间不能有“;”存在,或者以/*开头,*/结尾。

二.例子解释

对一个数据集进行分析
学生编号 性别 测验1 测验2 家庭作业等级
10 M 80 84 A
7 M 85 89 A
4 F 90 86 B
20 M 82 85 B
25 F 94 94 A
14 F 88 84 C

1.计算两次测验平均成绩作为最终成绩;

2.根据最终成绩赋予等级,将学生按照ID号排序;
3.显示测验成绩、最终成绩和家庭作业等级、最终等级;
4.计算测验和期末成绩的班级平均分;
5.计算性别和作业等级的频数。
SAS输入过程:
*建立数据集EXAMPLE
DATA EXAMPLE;INPUT SUBJECT GENDER $ EXAM1 EXAM2 HW_GRADE $; *INPUT输入变量的名称和它们在数据列中的位置,字符变量后加美元符号$FINAL=(EXAM1 + EXAM2) / 2; *计算最终成绩IF FINAL GE 0 AND FINAL LT 65 THEN GRADE='F';ELSE IF FINAL GE 65 AND FINAL LT 75 THEN GRADE='C';ELSE IF FINAL GE 75 AND FINAL LT 85 THEN GRADE='B';ELSE IF FIANL GE 85 THEN GRADE='A'; *运用if-then语句将最终成绩赋予最终等级
DATALINES;
10 M 80 84 A7 M 85 89 A4 F 90 86 B
20 M 82 85 B
25 F 94 94 A
14 F 88 84 C
;
*按照ID排序,sort用来排序,data=后更进行处理的数据集,若数据缺失,则处理最近建立的数据集
PROC SORT DATA=EXAMPLE;BY SUBJECT;
RUN;

*title后跟输出结果的标题

ID变量的作用是让程序把变量SUBJECT打印在结果输出报告的第一栏,并删除OBS,OBS在缺少ID 变量时会自动呈现自然序列
VAR后面跟需要进行处理的变量
PROC PRINT DATA=EXAMPLE;
TITLE "Roster in student number order";
ID SUBJECT;
VAR EXAM1 EXAM2 FINAL HW_GRADE;
RUN;
输出结果为:

*计算平均分

PROC MEANS DATA=EXAMPLE N MEAN STD STDERR MAXDEC=1;
TITLE "Descriptive Statistics";
VAR EXAM1 EXAM2 FINAL;
RUN;
输出结果:

*计算频数,因为proc freq 可以生成多维表格,SAS使用TABLES而不是VAR来列出频数分布表

PROC FREQ DATA=EXAMPLE;
TABLE GENDER HW_GRADE GRADE;
RUN;

如果不需要呈现累加统计量,也可以使用nocum

PROC FREQ DATA=EXAMPLE;
TABLE GENDER HW_GRADE GRADE/NOCUM;
RUN;

sas统计分析学习笔记(一)相关推荐

  1. sas统计分析学习笔记(六)

    1.lag函数 LAG函数返回上次执行时的自变量值,而不是上一个观测值,下面例子能说明这个特点: DATA LAGGARD; INPUT X; IF X GT 5 THEN LAG_X=LAG(X); ...

  2. sas统计分析学习笔记(九)——方差分析

    1.简介 当数据多于两组时,T检验或者相应的非参数分析不再适应,这时需要使用方差分析. 2.单因素方差分析 零假设为所有组的均值相等,备择假设是不是所有平均数都相等.F=组间方差/组内方差=[组间平方 ...

  3. 概率与统计分析学习笔记

    注:该文是上了开智学堂数据科学基础班的课后做的笔记,主讲人是肖凯老师. 概率与统计分析 描述性分析 用一个数字描述一组数字的特征.用一个数字来归纳一组数字,这个数字称为统计量或统计指标. 均值.中位数 ...

  4. 空间统计分析学习笔记

    空间统计有别于经典统计学的两大特征:空间相关性和空间异质性,莫兰指数等可以用来量化空间相关性,地理加权回归等用来量化空间异质性. 潜在的(因为没有很明显的表现出来)的相互依赖性,就是所谓的" ...

  5. sas统计学习笔记(四)

    有时候列联表的情况很负责,比如某个因素的每个水平上都有一个2×2列联表,一种用于分析多层2×2表的方法是Mantel-Haenszel卡方统计量,这个技术有时也叫元分析.用sas软件计算分层表的卡方值 ...

  6. 利用python进行统计分析学习笔记 第7章

    第7章,基本功能部分,讲到了函数应用和映射 这里作者说了. ,将函数应用到由各列或行所形成的一维数组上.DataFrame 的apply方法即可实现此功能: 然后又说, 元素级的Python函数也是可 ...

  7. python客户画像_Python数据分析学习笔记05:用户画像

    Python数据分析学习笔记05:用户画像 一.用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而 ...

  8. 数据分析学习笔记(二)数据分析三思维七技巧

    数据分析学习笔记(二) What 三种核心思维 结构化 公式化 业务化 Why 数据分析的思维技巧 象限法 多维法 假设法 指数法 二八法 对比法 漏斗法 总结 How 如何在业余时间锻炼分析能力 好 ...

  9. 数据分析学习笔记——数据可视化

    数据分析学习笔记系列--数据可视化 总第45篇 ▼ 写在前面: 本篇来源于书籍<数据之美-一本书学会可视化设计>的学习后整理所得.全篇主要围绕数据可视化的5个步骤展开,其中重点内容是第三步 ...

最新文章

  1. 最新剑桥《AI全景报告》出炉:中国发表机器学习学术研究超过美国
  2. 【译】Using Machine Learning to Understand the Ethereum Blockchain
  3. 机器学习基础(1)——绪论
  4. 179. 最大数---LeetCode---JAVA
  5. 去除IE10自带的清除按钮
  6. 10.32/10.33 rsync通过服务同步 10.34 linux系统日志 screen工具
  7. 【渝粤教育】国家开放大学2018年春季 0007-21T文书档案管理 参考试题
  8. 帆软动态列之数据集实现动态列
  9. html半透明遮罩,div背景半透明 覆盖整个可视区域的遮罩层效果
  10. 话说Ctrl键的终极含义
  11. 初始化DirectX遇到的问题
  12. python练习吨和千克互相转换的程序
  13. 谷粒商城-04-P44-P60
  14. UI设计就业前景广阔无边,入门正当时!
  15. 《关键对话》如何高效沟通,营造无往不利的事业和人生?
  16. mhw跳过结尾_怪物猎人世界怎么刷珠子快 MHW刷珠子炼金SL大法
  17. MQTT心跳机制介绍
  18. python--原神抽奖程序
  19. 斗地主游戏Landlord
  20. android7 华为p9,华为P9 Emui5.0下载

热门文章

  1. python人脸识别神器_教你用Python人脸识别自动开机,值得收藏
  2. 指尖上行--移动前端开发进阶之路(读书笔记)----1.3常用库和框架
  3. js禁止右键,禁止复制,复制内容到剪切板
  4. java将数字转简体中文和繁体中文,支持金额模式
  5. hibernate.cfg.xml
  6. 通过百度简单获取本地 ip 地址
  7. Mvp-10隔膜泵串口编程
  8. M302A-JL、M302A-MQ、M302A-ZN_S905L2_通刷-当贝桌面线刷固件包
  9. 电脑显示器vga和dvi
  10. 机器学习(九)归纳总结DLC