SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作

1. SET/SET效率高,建立的主表和建表索引的查询表一般不排序,

2. BY语句,DATA步中,BY语句规定分组变量,用于控制SET,MERGE,UPDATE或MODIFY语句。

BY<DESCENDING>variable-1<...<DESCENDING>variable-n><NOTSORTED><GROUPFORMAT>;
其中:
Variable为分类、排序或索引的变量;
GROUPFORMAT为用格式化值分组;
NOTSORTED为未排序。

3. MERGE 多表的横向合并,关系为一对一,一对多,多对一。而多对多需用SQL。

    应用:1)根据某些需求条件更新特定变量2)对主数据的某些变量做历史累加

UPDATE语句后面只能跟两个数据集,最靠近UPDATE语句的是主数据集,随后是更新数据集。UPDATE在横向合并两个数据集时和MERGE相似,都是用更新数据集修改主数据集。
区别:MERGE,对更新数据集缺失值的处理,MERGE语句是不顾后果的,它会统统用远离MERGE语句数据集的数据覆盖靠近MERGE语句数据集的数据,即便是缺失值也会覆盖。
但是,有时候商业需求要求在更新数据集数据缺失的情况下用主数据集数据替代,这时候就是UPDATE语句、在使用SAS做数据仓库的ETL开发时就是如此。
MODIFY:每次更新非常庞大的数据集需要定期更新,但是每次更新对象都是动态的,可以比MERGE/UPDATE减少内存消耗。
MODIFY的四种数据集的访问机制:匹配访问、索引访问、观测访问、观测序列号访问、顺序访问。
@和@@的应用:@ 表示执行下一个操作时,指针移到下一个记录。@@表示执行下一个操作,指针保持在当前记录。
proc:过程步的开始是procedure的缩写。

4.输出观测的方法:4.1没有任何输出语句–输出PDV;4.2OUTPUT;REPLACE;REMOVE

5.put语句:可以输出变量信息到指定地点,包括:输出到SAS系统的日志窗口,输出到FILE语句规划的外部文件,输出到SAS系统的OUTPUT窗口。

        SAS系统使用PUT语句输出时,可以用指针控制,注意列指针控制的@要放在变量之前,行固定说明符的@要放在变量之后。PUT应用:输出结果到LOG窗口,调试程序运行过程中变量产生的中间值。输出结果到外部文件。

6.@和@@应用/单尾符和双尾符

一般单尾符应用在PUT,双尾符应用在INPUT。
单尾符:一个数据行用多个PUT语句输出数据,或多个INPUT语句输入数据。
双尾符:一个输入数据行含有多个观测的值,用INPUT语句读入,或者把多个观测输出到一个数据行,用PUT。

7.FIEL语句

FILE语句用于规定当前的输出文件,并且该文件一定是一个不同于SAS文件的外部文件。且与PUT配合使用。
INFILE语句    INFILE file-specification<options><host-options>;独有常用项:DSD dlm='',FRISTOBS,LENGTH,MISSOVER,_INFILE_

转载于:https://www.cnblogs.com/lanzhi/p/6467901.html

SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作相关推荐

  1. SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制...

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(4)DATA步循环与控制.常用全程语句.输出控制 1. 各种循环与控制 DO组 创建一个执行语句块 DO循环 根据下标变量重复执行DO和E ...

  2. 《SAS编程与数据挖掘商业案例》学习笔记之十九

    继续<SAS编程与数据挖掘商业案例>学习笔记,本文侧重数据处理实践,包括:HASH对象.自定义format.以及功能强大的正则表达式 一:HASH对象 Hash对象又称散列表,是根据关键码 ...

  3. 《SAS编程与数据挖掘商业案例》学习笔记之十六

    <SAS编程与数据挖掘商业案例>学习笔记,本次重点:sas宏变量 内容包括:宏变量.宏函数.宏参数.通配函数.字符函数.计算函数.引用函数.宏语句.宏应用 1.宏触发器: %name-to ...

  4. 《SAS编程与数据挖掘商业案例》学习笔记之十四

    继续<SAS编程与数据挖掘商业案例>学习笔记系列,本次重点:常用全程语句 所谓全程语句,是指可以用在任何地方的sas语句,既可以用在data数据步语句里面,也可以用在proc过程步里面,甚 ...

  5. SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理...

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...

  6. SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...

  7. 《SAS编程与数据挖掘商业案例》学习笔记之十五

    继续<SAS编程与数据挖掘商业案例>读书笔记,本次重点:输出控制 主要内容包含:log窗体输出控制.output窗体输出控制.ods输出控制 1.log窗体输出控制 将日志输出到外部文件 ...

  8. 《SAS编程与数据挖掘商业案例》学习笔记之十八

    接着以前的<SAS编程与数据挖掘商业案例>,之前全是sas的基础知识,现在开始进入数据挖掘方面笔记,本文主要介绍数据挖掘基本流程以及应用方向,并以logistic回归为例说明. 一:数据挖 ...

  9. 《SAS编程与数据挖掘商业案例》学习笔记之一

    今天有空看到一本挺不错的书,仔细阅读,发现很多有用的知识点,于是认真研读起来,以下是初步的要点笔记. 切换至日志窗口的命令是log.热键是F6: 切换至输出窗口的命令是output.热键是F7: 切换 ...

最新文章

  1. 新转机!2020年想裸辞的程序员们注意了
  2. Silverlight揭秘
  3. 漫画:应用程序被拖慢?罪魁祸首竟然是Log4j!
  4. WebView加载HTML时禁止超链接跳转
  5. umi搭建react+antd项目(二)路由
  6. OD调试9—实例:深入分析代码完成软件破解
  7. Java多线程之多线程之间按顺序调用
  8. 我曾经是怎么做面试官的
  9. VS2008调试总结
  10. 访问修饰符 public与private c# 1230
  11. ubuntu15.10 gvim php,IDE---Gvim之ubuntu下配置php的ide开发工具
  12. kubernetes权威指南学习遇见的问题以及意见之二:Permission denied
  13. 道德如果一直在滑坡,终会酿成大祸,历朝历代,莫过于是……
  14. HDU2050 由直线分割平面推广到折线分割平面
  15. Angular测试机床TestBed
  16. Unity UGUI坐标和世界坐标转化
  17. 36个excel技巧、50个快捷键
  18. 首届中国餐饮行业资本品牌创新发展(盐城)论坛圆满举办成功
  19. Pod2g全面回归越狱界 iOS 6越狱曙光来临
  20. IDEA Alt+Insert键打开的是命令行

热门文章

  1. python百分号字符串_python--003--百分号字符串拼接、format
  2. Merge the incoming changes into the current branch
  3. virtuaBox 连接不上解决办法
  4. c3p0使用 与批量生成
  5. dlna和miracast可以共存吗_Airplay、Miracast、DLNA传输原理的底层搭建
  6. 创建数据账号只有个别表的权限_只有普通权限账号,如何把远程数据库中该用户的数据表导入到本地数据库?...
  7. dbf如何导入oracle_Oracle软件的安装介质被注入恶意程序事件分析与防御
  8. html一级子元素,获取子元素_html/css_WEB-ITnose
  9. python写登录界面跳转至数据库操作_pycharm+jdango+python实现创建web工程并实现简单登陆...
  10. idea java 桌面应用_IDEA打包应用程序的教程图解