数据分析与SAS学习笔记8
过程步:一个典型的SAS完整程序:
代码说明:
1)reg:回归分析;
2)model:因变量和自变量。
proc开头部分叫过程步。
常用过程:
SORT过程:
PRINT过程与FORTMAT过程:
MEANS过程:
TABULATE过程:
PLOT过程与GPLOT过程:
CHART与GCHART过程:
数据排序:SORT过程:在page 111页。
1)proc sort <选择项>:
DATA=数据集
OUT=数据集,若没有此项,缺省为覆盖原数据集;
BY语句用于指出排序变量名,及是否降序排序。
代码分析:
1)学生学号、和三科成绩;
2)CLAS变量是从num中截取第3位,截取2位长度。
3)TOT=sum(of s1-s3);这个语句还是很有特点的。
代码分析:
1)先根据CLAS进行升序排列;
2)然后在每个CLAS中再按TOT降序进行排列。例如:01班是从271到239进行降序排列。
3)Proc print语句:没有指定我们要打印输出的数据集,那就只打印我们当前操作的数据集CS1。
PRINT过程:
PROC PRINT <选项>:
VAR 变量表;
ID 变量表;
BY 变量表;
SUM 变量表;
代码说明:
1)proc sort;by reg wor; 这两条语句是进行排序,先reg后wor。
2)然后是proc print语句:
3)然后我们看到了求和;先各自求和,然后分区域求和,然后再汇总求和。
4)ID name:以前的输出结果都是obs,表示第几个观测值;我们用name来代替obs,来代表每行的标识。
5)PRINT语句中,BY语句要先对变量进行排序,所以先要进行SORT才行。要先排序,才能使用BY。
6)sum就是求和。分类求和、大类求和,最后再汇总。
过程步常用的语句:
1)VAR:定义分析的变量,缺省为全部变量;
2)ID:定义取代Obs用于识别观测的变量;
3)BY:表示分组的方法;
4)SUM:指出求和的变量。
代码说明:
1)format:自定义格式。
2)worddate万能时间。
3)视频学习的例子中,老师在PROC FORMAT语句中还包含了library=library,表示格式要保存在指定的逻辑库中;格式码要保存在逻辑库中; 当Library=被指定后,Format过程产生的所有格式都是永久的,这些格式存于逻辑由库名指出的永久目录文件中。
4)
WEIGHT语句:
在过程中规定了数据变量,并以它的值作为观测的相关权重。
各个变量在总结果中
FREQ语句:
代码说明:
1)var age: 指定分析的变量;对sex变量求平均。
2)by sex; 分组处理某数据集;
3)但是计算时没有考虑各个年龄组的人数。应该是在Means过程中加入表示各组频数的FREQ语句。
ID语句:
ID 变量表。
用来规定一个变量或几个变量,以便在输出或由该过程产生的SAS数据集中,不再使用obs,而是用这些变量值来识别观测。
数据分析与SAS学习笔记8相关推荐
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制...
SAS学习笔记之<SAS编程与数据挖掘商业案例>(4)DATA步循环与控制.常用全程语句.输出控制 1. 各种循环与控制 DO组 创建一个执行语句块 DO循环 根据下标变量重复执行DO和E ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理...
SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作
SAS学习笔记之<SAS编程与数据挖掘商业案例>(2)数据获取与数据集操作 1. SET/SET效率高,建立的主表和建表索引的查询表一般不排序, 2. BY语句,DATA步中,BY语句规定 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理
SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...
- 数据分析之pandas学习笔记(六)(层次化索引、重塑、轴向旋转、行列变换、合并表数据)
数据分析之Pandas学习笔记(六)(层次化索引.重塑.轴向旋转.行列变换.合并表数据) level层次化索引 unstack()与stack()进行重塑,即:行列索引变换 swaplevel()交换 ...
- Python预测 数据分析与算法 学习笔记(特征工程、时间序列)
微信公众号:数学建模与人工智能 GitHub - QInzhengk/Math-Model-and-Machine-Learning 第3章 探索规律 3.1 相关分析 相关关系是一种与函数关系相区别 ...
- SAS学习笔记1——基础知识(库、PDV、变量选择、观测值排序、创建新变量
SAS学习笔记1--基础知识 1.逻辑库.临时库.永久库 2.数据步 2.1数据步语法 2.2 数据步的编译和执行过程 2.3变量的选择 2.3.1 keep和drop语句 2.4变量的重命名rena ...
- Python爬虫、数据分析、可视化学习笔记(一、梦开始的地方)
系列文章持续更新中...... 文章目录 一.工具及环境配置 1.Python3.8(官网下载) 2.Pycharm(官网下载) 3.Anaconda(官网下载) 4.环境配置(传送门,感谢前人栽树) ...
- SAS 学习笔记(六)— SAS与属性数据分析
文章目录 列联表的生成 汇总表的数据录入 由现有的汇总表生成列联表 列联表的关联性检验 一般的关联性(独立性)检验: 有序变量的关联性检验: 列联表的一致性检验 创建统计图形 列联表的生成 汇总表的数 ...
最新文章
- 面试官:Java如何绑定线程到指定CPU上执行?
- 聊聊spring cloud的LoadBalancerAutoConfiguration
- 【摄像头与成像】长文详解RAW图的来龙去脉
- github push报 Unable to access ‘https://github.com/xxxx/xxxx.git/‘: OpenSSL SSL_read: Connection was
- 【机器学习算法专题(蓄力计划)】十一、特征数据预处理
- css媒体查询(手机、平板、PC)
- 服务器物理内存总是九十几,Solr总是使用超过90%的物理内存(Solr always use more than 90% of physical memory)...
- 容器安全 - 限制docker/podman只能使用有效签名的镜像
- oracle 安装的提示ntp,oracle rac 安装 PRVG-13606 ntp 同步报错解决过程
- el-tree多选获取选中的节点ID
- 重新认识fprint,sprint
- 汇编语言工具(DosBox、debug)下载与安装教程
- 迷宫算法,求解所有路径(DFS),(bug找了好久 )
- 银河麒麟linux找不到网卡,中标麒麟Linux v7系统下设置双网卡bond或team绑定详细过程-网卡设置...
- 【笔记】笔记本查看电池损耗,一句命令搞定!(附笔记本电池使用技巧)
- 过年了JAVA类编写烟花爆竹——学习分享下笔者的经验
- 如何建立一个网站?规划、设计、目的、原则、宣传(一)
- BootStrap工具使用
- viper读取配置文件
- JAVA个人记账本代码,Java的家庭记账本程序(L)