SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理...
SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理
1. SAS变量操作的常用语句
ASSIGNMENT 创建或修改变量
SUM 累加变量或表达式
KEEP 规定在数据集中保留的变量
DROP 规定在数据集中删除的变量
ARRAY 定义一个数组
RENAME 重命名数据集变量
LENGTH 定义变量长度
LABEL 定义变量标签
2. 连接符:||
compress:消除空格
RETAIN应用:一是需要对某一个变量值进行累加、比较等操作。二是需要保留之前的某一满足条件的变量值到指定的观测对应的变量。
3.维度函数:MID() DIM(MULT)等加于DIM(MULT,1)
LABEL:标签
4. SAS观测值操作
OUTPUT 输出当前在PDV中的观测,继续无条件自行下面的语句。
IF 如果满足条件,继续执行后面语句;否则,返回DATA步开头。
WHERE 观测进入PDV之前进行条件判断。
REPLACE 更新观测,但仅在MODIFY语句中适用。
REMOVE 删除观测,但仅在MODIFY语句中适用。
DELETE 如果满足条件,返回DATA步开头;否则继续执行后面语句。
STOP 停止输出当前PDV中的观测,并退出DATA步。WHERE语句在PDV之前执行。
5. 数据集管理主要包括数据集纵向拼接、转置、排序、比较、复制、重命名、删除等操作。通过SAS的过程步完成,常用过程步。
APPEND 把来自SAS数据集的所以数据添加到另外一个SAS数据集的后面。
SORT 对原有SAS数据集安装一个或多个变量进行排序。
TRANSPOSE 对原有的SAS数据集进行行列转置
CONTENTS 输出SAS逻辑库成员的描述信息
DATASETS 管理SAS逻辑库成员,可以完成对SAS逻辑库中的所有成员进行输出列表、复制、换名、添加和删除等操作。
实践:在PROC SORT中用了NODUPKEY后最好一同使用OUT,OUT可以保证原来的数据集不变,把NODUPKEY后的产生的观测输出到新的数据集中。(万一程序开发有误,有保障)
带OUT=选项的删除重复BY值
data a;input x y @@;cards;1 20 1 10 1 30 2 40 2 50;run;proc sort data=a nodupkey out=b;by x;run;
6. 行列转置实践
DATA比PROC效率高
对比:
6.1 列转置为行PROC步:
proc transpose data=chapt6.fishdataout=charpt6.fishlength(rename=(coll=measurement));var length1-length4;by location date;run;
DATA步:
data chapt6.fishlength2;set chapt6.fishdata(keep=location data length1-length4);array tr[1:4] length1-length4;do i=1 to 4;measurement=tr(i);output;end;keep location date measurement;run;
6.2 行转置列PROC步:
proc transpose data=chapt6.fishlengthout=chapt6.fishdata2;var measurement;by location date;id _name_;run;
DATA步:
data chapt6.fishlength(keep=location date measurement);do i=1 to 4;set chapter6.fishlength(keep=location date measurement);array tr[1:4] length1-length4;tr(i)=measurement;end;keep location date length1-length4;run;
转载于:https://www.cnblogs.com/lanzhi/p/6467898.html
SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理...相关推荐
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作
SAS学习笔记之<SAS编程与数据挖掘商业案例>(2)数据获取与数据集操作 1. SET/SET效率高,建立的主表和建表索引的查询表一般不排序, 2. BY语句,DATA步中,BY语句规定 ...
- 《SAS编程与数据挖掘商业案例》学习笔记之十八
接着以前的<SAS编程与数据挖掘商业案例>,之前全是sas的基础知识,现在开始进入数据挖掘方面笔记,本文主要介绍数据挖掘基本流程以及应用方向,并以logistic回归为例说明. 一:数据挖 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制...
SAS学习笔记之<SAS编程与数据挖掘商业案例>(4)DATA步循环与控制.常用全程语句.输出控制 1. 各种循环与控制 DO组 创建一个执行语句块 DO循环 根据下标变量重复执行DO和E ...
- 《SAS编程与数据挖掘商业案例》学习笔记之十九
继续<SAS编程与数据挖掘商业案例>学习笔记,本文侧重数据处理实践,包括:HASH对象.自定义format.以及功能强大的正则表达式 一:HASH对象 Hash对象又称散列表,是根据关键码 ...
- 《SAS编程与数据挖掘商业案例》学习笔记之十六
<SAS编程与数据挖掘商业案例>学习笔记,本次重点:sas宏变量 内容包括:宏变量.宏函数.宏参数.通配函数.字符函数.计算函数.引用函数.宏语句.宏应用 1.宏触发器: %name-to ...
- 《SAS编程与数据挖掘商业案例》学习笔记之十四
继续<SAS编程与数据挖掘商业案例>学习笔记系列,本次重点:常用全程语句 所谓全程语句,是指可以用在任何地方的sas语句,既可以用在data数据步语句里面,也可以用在proc过程步里面,甚 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理
SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...
- 《SAS编程与数据挖掘商业案例》学习笔记之十五
继续<SAS编程与数据挖掘商业案例>读书笔记,本次重点:输出控制 主要内容包含:log窗体输出控制.output窗体输出控制.ods输出控制 1.log窗体输出控制 将日志输出到外部文件 ...
- SAS学习笔记1——基础知识(库、PDV、变量选择、观测值排序、创建新变量
SAS学习笔记1--基础知识 1.逻辑库.临时库.永久库 2.数据步 2.1数据步语法 2.2 数据步的编译和执行过程 2.3变量的选择 2.3.1 keep和drop语句 2.4变量的重命名rena ...
最新文章
- mysql整理类型_Mysql 时间类型整理
- 机器学习、深度学习、自然语言处理、计算机视觉顶级期刊的论文资料分享(附顶会论文下载链接)...
- TextInputLayout
- Aruba发布全新集成资产追踪解决方案及核心交换机
- jQuery .attr() vs .prop()
- python生成伪随机数的扩展库_python模块介绍-random:生成伪随机数
- 织梦DEDECMS网站留言板提交时验证码错误返回空白页的解决办法
- paip.gui控件tabs控件加载内容的原理以及easyui最佳实现
- HDU 2444 The Accomodation of Students (二分图最大匹配+二分图染色)
- windows输入法打出的字母空隙很大怎么办?
- Altium Designer 10.0 使用教程
- 高端游戏计算机配置单,高端稳定有保障 6000元i7-7700配GTX1060游戏配置推荐
- 【html5期末大作业】基于HTML仿QQ音乐官网网站
- Fab-PIE(制程整合工程师)详细介绍
- esp32拍照传输到手机android,esp32-cam拍照上传云平台教程
- centos6的yum源
- GB2312介绍及字库使用
- SQL实现 模糊查询
- 利用WireShark抓包进行数据分析
- long和Long的区别
热门文章
- 腾讯王者荣耀AI论文首次曝光:五AI王者局开黑与人类战队打成平手
- 云从科技宣布B+轮融资,多家国有基金入股,累计获资35亿元
- 无人车公司May Mobility种子轮融资1150万美元,宝马丰田联合领投
- 《Java8实战》-第十章笔记(用Optional取代null)
- vue.js的学习中的简单案例
- 秋色园QBlog技术原理解析:性能优化篇:打印页面SQL,全局的SQL语句优化(十三)...
- 0831 - 每晚放松一刻
- mysql索引详解(转)
- 安装CleanMyMac 3提示软件已损坏
- Yii2的urlManager URL美化