本节书摘来自异步社区《社会调查数据管理——基于Stata 14管理CGSS数据》一书中的第2章,第2.2节,作者 唐丽娜,更多章节内容可以访问云栖社区“异步社区”公众号查看

2.2 数据管理的工作标准

对社会调查数据而言,数据管理工作从调查工作启动之日开始。调查数据来源于社会调查,社会调查是生产数据的一种重要工具。数据管理的最终目标是确保数据质量。高质量数据有两个基本判断标准:真实、有效,即数据尽量接近事实(真实性),且能为研究所用(有效性)。为此,数据管理工作至少要满足以下6个基本要求。

1.目标清晰
上面提到,数据管理贯穿整个社会调查全程,不仅历时长,且任务杂。在这种情况下,每一阶段、每一步的管理目标都要明确清晰,以便管理工作的分配和管理人员的安排,否则容易出现漏做、重做等问题,影响数据质量。

2.任务可行
确定目标后,接下来要做的工作就是把目标分解成各级任务。数据管理者一定要注意:任务可以是不完美的,但一定要可行。在数据管理过程中,常见的一种困境是:任务明确,但不具备可操作性。舍弃“完美主义”,在现有的时间、资金、人力等资源条件下,尽可能好地完成任务。同理,在这个世界上很难找出没有问题的社会调查,找不到能完全真实反映社会现实的数据,一切社会调查所得的数据都只能是无限接近事实。

3.流程简易
目标和任务确定后,接下来要考虑到工作流程。制定工作流程的基本标准:简易。越复杂的工作流程,越容易出错。在某一项具体的数据管理工作中,参与的人员越多,工作流程的制定就越简易,因为对不同的人而言,简易的标准不一样,如同样的事情,能用常见软件完成,就不要用小众软件,如果采用小众软件,不仅给合作者带来很多负担和学习压力,而且会增加出错的可能性。

4.职责明确
目标不会自动实现,任务不会自动完成,流程不会自动走完,事情最终是由人来完成的,再完美的工作计划如果没有合适的人承担,那它几乎就等于零。任何一项数据管理工作都不可能由一个人单独完成,后面会讲到“双录”“双校”,任何一项和数据管理有关的工作,都尽量保证由两个人独立完成,并做事后校验。 在大型数据管理项目中,整个工作流程类似工业生产的生产线,环环相扣,每个环节的工作人员都要清楚地知道自己的权限和职责,否则一环出错,整个流程就会崩溃。比如:通常,数据编码手册在问卷设计时就要考虑到,而且问卷一旦确定,数据编码手册也就基本定型。数据清理员在拿到原始数据之后,必须要对照数据编码手册对每个变量逐一进行检验。

5.标准统一
在大型数据管理中,标准统一极其重要。只有用同一标准管理的数据,才有可能进行合并,“外人”才有可能读懂数据。数据管理的忌讳是:标准不一,朝令夕改。假设有一个关于健康的、5年的追踪调查,体重这个变量在第一年的数据中单位是公斤,第二年单位变成斤,第三年也是斤,第四年又变成公斤,第五年也用到公斤。这样,用户使用数据时稍不注意,就有可能直接把5年的体重合并在一起比较。再如,在一个多年的追踪调查中,同一个变量“收入”使用的是不同的变量名:income、incomeyr、perincome等。

6.灵活拓展
好的数据管理工作标准和工作流程应该具备一定的可拓展性。对不同的项目进行数据管理时,可能会用到不同的标准和流程,但没有必要对所有的项目都重新建立一套新的标准和流程,相似的数据管理项目可以互相借鉴,比如:对CGSS2012年的数据管理工作流程进行一定的拓展和修改后,即可用作CGSS2013年的工作流程。再如,中国宗教调查是一个全新的项目,针对这个项目的数据管理就是基于CGSS的数据管理工作流程和内容改出来的,既省时、省力,还行之有效。

在上述标准基础之上,尽量提高管理效率,优化管理流程,实现管理自动化,保证管理标准化。

《社会调查数据管理——基于Stata 14管理CGSS数据》一2.2 数据管理的工作标准...相关推荐

  1. 《社会调查数据管理——基于Stata 14管理CGSS数据》一第3章 概念与术语3.1 和计算机及软件有关的术语...

    本节书摘来自异步社区<社会调查数据管理--基于Stata 14管理CGSS数据>一书中的第3章,第3.1节,作者 唐丽娜,更多章节内容可以访问云栖社区"异步社区"公众号 ...

  2. 《社会调查数据管理——基于Stata 14管理CGSS数据》一第2章 数据管理的流程及内容2.1 数据管理的工作流程...

    本节书摘来自异步社区<社会调查数据管理--基于Stata 14管理CGSS数据>一书中的第2章,第2.1节,作者 唐丽娜,更多章节内容可以访问云栖社区"异步社区"公众号 ...

  3. 《社会调查数据管理——基于Stata 14管理CGSS数据》一3.2 和统计有关的术语

    本节书摘来自异步社区<社会调查数据管理--基于Stata 14管理CGSS数据>一书中的第3章,第3.2节,作者 唐丽娜,更多章节内容可以访问云栖社区"异步社区"公众号 ...

  4. 《社会调查数据管理——基于Stata 14管理CGSS数据》一1.2 数据管理内容不清

    本节书摘来自异步社区<社会调查数据管理--基于Stata 14管理CGSS数据>一书中的第1章,第1.2节,作者 唐丽娜,更多章节内容可以访问云栖社区"异步社区"公众号 ...

  5. 《社会调查数据管理——基于Stata 14管理CGSS数据》一2.3 数据管理的工作规范...

    本节书摘来自异步社区<社会调查数据管理--基于Stata 14管理CGSS数据>一书中的第2章,第2.3节,作者 唐丽娜,更多章节内容可以访问云栖社区"异步社区"公众号 ...

  6. 《社会调查数据管理——基于Stata 14管理CGSS数据》一3.3 和社会调查有关的术语...

    本节书摘来自异步社区<社会调查数据管理--基于Stata 14管理CGSS数据>一书中的第3章,第3.3节,作者 唐丽娜,更多章节内容可以访问云栖社区"异步社区"公众号 ...

  7. 《社会调查数据管理——基于Stata 14管理CGSS数据》一1.4 数据伦理

    本节书摘来自异步社区<社会调查数据管理--基于Stata 14管理CGSS数据>一书中的第1章,第1.4节,作者 唐丽娜,更多章节内容可以访问云栖社区"异步社区"公众号 ...

  8. 《社会调查数据管理——基于Stata 14管理CGSS数据》一1.5 本书简介和使用说明...

    本节书摘来自异步社区<社会调查数据管理--基于Stata 14管理CGSS数据>一书中的第1章,第1.5节,作者 唐丽娜,更多章节内容可以访问云栖社区"异步社区"公众号 ...

  9. 【精益生产】数字化转型探索之路——基于精益生产管理的数据决策分析体系

    随着"工业4.0"."两化"融合.<中国制造2025>等理念或政策的提出,粗放式的制造生产模式的弊端被越来越多的暴露出来,中国制造昔日冠以" ...

最新文章

  1. 某百度程序员中午面试一个阿里程序员,晚上去阿里面试,面试官竟是中午那个人!...
  2. 高性能Linux服务器运维实战,《高性能Linux服务器构建实战》笔记
  3. Java中的异常处理
  4. 如何优化页面的响应速度 以及如何减少项目初次加载时间(转https://www.cnblogs.com/MarcoHan/p/5295398.html)...
  5. Eiblog 初体验,搭建教程
  6. 使用Kotlin的Android SeekBar
  7. wlanconnect无法连接wifi_苹果iphone12无法连接wifi怎么回事 解决方法分享
  8. linux工作中常用文件操作命令
  9. Python绘制太阳花
  10. Android自学笔记:Tab控件源码剖析
  11. Taro微信小程序使用getUserProfile获取微信用户头像昵称等信息
  12. 支付宝(Alipay)支付,超详细使用教程讲解!
  13. Grade for Android 之二:Groovy 与Java的语法区别
  14. 王牌战士服务器维修,《王牌战士》8月12日更新维护公告 英雄免费解锁两周年专属活动...
  15. 运行vue项目时,如果一直报eslint语法错误的解决方案
  16. STMF103定时器
  17. 计算机系英文简历常用的词汇,计算机专业英文简历词汇
  18. 【picoCTF2022】Misc部分
  19. time秒和年月日时分秒的转化
  20. 滑铁卢大学计算机专业就业,克服艰难 收获滑铁卢大学计算机专业offer

热门文章

  1. 基于人脸图像的心率心率测量系统
  2. 【Unity3D开发小游戏】专栏文章导读清单
  3. win10修复tcp驱动服务器,高手亲自解决win10系统tcpip.sys蓝屏的详尽解决教程
  4. JAVA_OPTS简介
  5. 泛型无法适用重载的场景:both methods have same erasure
  6. 共享自己电脑硬盘空间还能赚钱?
  7. Python开源项目总结
  8. 物联网毕设 -- 智能家居控制系统(APP+OneNET+WIFI)
  9. Python统计文件中词出现的频率,非常简单,专业人士就不要点了
  10. 浅谈Java三层架构