中华医学科研管理杂志, 2018,31(5)  张策, 陈淑良, 王晓桐, 等

摘要目的

从期刊论文统计方法缺陷方面进行分析,并提出解决方案。

方法

资料采用中国知网文献数据库中的"基础科学"及"医药卫生科技"数据库的全部文献作为抽样源,限定时间为2014年11月10日-2017年11月10日进行检索。共检出文献1 456 417篇,采用随机数字法每年抽样100篇,共300篇逐一通读考察统计学方法应用,指出统计缺陷并给出解决方案。

结果

在分析的300篇文献中有126篇采用统计学方法,存在一定程度上的统计缺陷,其主要集中在未详细标注统计量和P值,统计方法的适用条件把握不好等问题,针对这些问题,笔者开发了统计学路径图和问答式计算机系统,供临床应用。

结论

从被抽查的论文看,存在大量统计学缺陷,本文提出的统计路径图和问答式计算机系统为解决临床统计问题提供了一种解决方案。

统计学(Statistics)是一门研究数据收集、整理和分析的学科,随着现代医学的发展,统计学在医学科研领域得到广泛应用,研究设计、数据记录、结果表达与解释等均涉及统计学知识,统计学方法的正确应用是论文具有科学性和可靠性的前提;统计学的内容非常丰富且不断发展,但在科研过程中不规范使用、滥用、甚至误用的现象非常普遍,且涉及实验设计到结果解释的各个环节[]。医学统计学是医学科学研究中必需的手段,它体现科研结果的可信性、可靠性、科学性[]。但是许多调查研究发现,在医学学术论文中仍存在不少统计方法使用错误及表达不当的情况,这造成了论文统计结论的不可靠,有的甚至产生了严重的偏倚。本研究对近3年医学学术论文中统计学分析方法的应用情况进行了抽样调查和分析,分析常见的统计分析方法缺陷的原因,为提高论文的学术水平提供有益的建议。

资料与方法1.1 资料一般情况

资料采用中国知网文献数据库中的"基础科学"及"医药卫生科技"数据库的全部文献作为抽样源,限定时间为2014年11月10日-2017年11月10日进行检索。近3年共检索出文献1 456 417篇,其中2017年535 250篇(2016年11月10日-2017年11月10日)、2016年795 074篇(2015年11月10日-2016年11月09日)、2015年126 093篇(2014年11月10日-2015年11月09日)。

1.2 文献抽取方法

运用SPSS20.0软件包生成300个随机数,利用随机数在2015到2017年这3年的所有文献中,每年各随机抽取100篇文献进行统计学质量评价,具体方法为以中国知网搜索引擎搜出的文献的默认顺序号为基准,用随机数进行对应抽取。抽样过程中,随机种子设为20171110,执行RAND函数。

1.3 统计学路径设想

统计学误用往往导致非常严重的后果,如结论错误、数据造假、丢失有价值的数据信息等,医学科研中的统计学缺陷可能违背医学伦理学要求,甚至可能导致不良的临床后果[]。但同时应该注意到的是,临床专业人员对统计学的执行不够严格,特别是统计学的基本理论欠缺,不能正确的选择统计学方法,笔者针对这一问题,创建统计学路径理论和问答式计算机系统,配有专门的统计学软件操作视频进行指导,目的是让临床医生不必过多了解统计学基本理论就能正确的选择统计学方法,利用"傻瓜式一站统计"助力临床科研。相信可以降低统计学缺陷的产生。

结果2.1 前十名杂志的一般特征

300篇文献中涉及使用统计学研究方法的有126篇,其中2017年35篇、2016年50篇、2015年41篇。将抽选数量排名前的十位杂志列表显示,抽样文献中选自《中国妇幼健康研究》共有29篇,占41.43%。抽样分析中刊物级别省级和国家级大致均衡。本文的影响因子一般都在0.5~1之间,国内文献影响因子不高。其中影响因子最高的是《武汉大学学报》杂志,影响因子为1.321。

2.2 期刊中的统计学缺陷分析

国内外研究者通过调查发现,在现代医学期刊中,统计方法的运用及表述存在着较多的问题[],本次分析中发现的问题如下,如表1所示:

表12015-2017年抽取的文献中统计学缺陷举例(n=189)

2.2.1 未标注P值 假设检验时,可由样本数据计算出该统计量的值,根据检验统计量的具体分布,可求出P值。[]根据抽样发现,抽样得到的300篇文献中,共有41.27%的文献没有标注P值,建议给出假设检验的精确P值而不是仅仅表达为"P>0.05"或"P<0.05"。P值与概率密切相关,其含义是样本间的差异由抽样误差所致的概率大小,所以精确标明P值,对假设检验的判断还是比较有意义的。

P值的习惯表述是,P>0.05称组间差异不显著,P≤0.05称组间差异显著,这里的"显著"是统计学的一个术语,指观察结果统计量实际代表的总体参数与原假设总体参数在概率意义上的"显著"偏离。P值越小,拒绝原假设的统计学依据越充分,但不能理解为P值越小,试验结果本身越有意义[]

2.2.2 未标注统计量 在进行统计分析时,应根据不同的分析方法给出相应的检验统计量。[]统计量是计算P值的重要依据,也是判断P值的重要参考,论文中应同时标注统计量和P值。我们的研究发现有许多文献在分析中并未给出统计量,而仅仅给出P值,这样的问题占比40.21%。大大降低了论文的科学性和严谨性。

2.2.3 希腊字母χ2(卡方)用X2表示,科研有欠严谨 研究发现有11.6%的的卡方检验的希腊字母χ用英文字母用X表示,体现科研工作欠严谨。

2.2.4 方差分析未考虑方差齐性 方差分析的前提条件是资料要服从独立、正态和方差齐性。在本次调查中发现,方差分析中针对独立性和正态性控制的较好,对方差齐性检验尚存在欠缺,有2.65%的研究没有明确考虑方差齐性。在统计工作中,如方差齐采用LSD等方法进行两两比较,如果方差不齐,应对变量进行处理:(1)用非参数检验方法;(2)用近似法;(3)采用变量变换法,使其方差呈齐性[]

2.2.5 未考虑正态检验 数据的正态性检验是参数检验的基础,所以数据是否服从正态比较重要,本次研究中,有1.59%的研究没有考虑数据的正态性检验。正态性检验可采用绘制PP图、QQ图进行观测,也可以采用假设检验的方法计算P值,是数据分析中的一个比较重要的步骤。统计学的中大部分参数检验均存在数据正态性假设的统计前提,不进行正态性检验就贸然选用参数统计的假设检验方法无疑进入了统计方法误用的误区。

2.2.6 数据建模中无模型评价,直接给出建模结果,导致建模参数表达没有依据 抽样中共有3篇文献建模,均未出现建模评价,同时应该注意的是,模型建立的好坏直接关系到数据建模的结果,是数据结果的基础,在文献中,基本都没有对统计模型建模评价的说明,是统计上的一个缺陷。

2.2.7 配对资料采用独立资料的检验方法 有些医学论文采用配对设计却误用了独立设计资料的t检验,配对t检验适用于配对设计的资料[12]。配对t检验的原理是对每对数据的差值做与0比较的单样本t检验,例如观察对象属于干预前后对比(治疗前后、检查前后等)和同体同源对比(同一观察对象两种干预方法)的两组资料,作统计学处理时应采用配对t检验,如果用组间独立样本检验,其更易获得本应没有意义的结论得到有意义的结论,范统计学上的第II类错误,特别是在显著性临界状态时更明显[。同时在进行配对检验时,除了描述配对样本的一般情况(如均数和标准差)、该出假设检验统计量和P值外,也应注意给出组间差值的均差及其95%可信区间,作为统计结论的重要依据。

讨论

临床医生对统计学的掌握程度并不高,在科研统计学方法的选择上存在问题,让临床医生了解复杂统计理论存在一定的现实困难,笔者团队创建临床科研统计简易路径,方便研究者使用。研究者在使用时,只要通过了解该路径右侧的几个名词解释,就能正确选择统计方法,研究团队为各种统计方法制做了SPSS软件操作视频,供使用者学习,统计路径如图1所示。

图1临床科研统计学简易路径

同时,笔者团队将这一路径做成了超链接形式,使用者采用人机对话形式回答电脑给出的问题就可以找到正确的统计学方法。并针对临床研究人员对SPSS操作不熟练的特点,在相应的统计学方法中给出了一站式解决方案,具体为首先用Excel组织数据,然后将数据导入到SPSS中,通过执行我们所给出的SPSS语句就可以实现统计操作,减少研究者的软件操作过程,切实解决了研究者统计应用问题,此人机对话电脑系统能够成为临床医生的统计助手,人机对话软件如图2所示。

图2人机对话形式的统计学路径选择

提高医学期刊中论文的统计学质量是一项艰巨而又持久的系统工程,需要各界人士(作者、编辑、审稿者、读者、期刊管理者等)的共同努力[]。笔者只是对医学论文中常见统计学概念方面的误用情况做了简单的分析和总结,限于篇幅,不能详细概括出问题的全部。但有一点是很明确的,即作者只有提高认识,才能在医学研究中自觉地运用统计学原理进行医学资料的科学收集、整理和分析。本文通过分析总结近3年相关文献中统计学分析方法的应用情况进行了抽样调查和分析,分析常见的统计分析方法缺陷的原因,并开发了科研统计辅助工具以帮助医学科研工作者提高科研水平。重视数据在科研中的作用。这就需要从源头抓起,提高作者的统计学处理能力[]

关注“医学科研管理空间”

在统计学中参数的含义是指_期刊论文中科研统计学缺陷分析及解决路径相关推荐

  1. 在统计学中参数的含义是指_第一篇 理解统计学中的基本概念

    统计学(stastics)是收集.分析和解释数据的科学. 描述统计(descriptive statistics)是研究数据还搜集.整理和描述的统计分支.描述统计的内容包括取得所需要的数据.用图表形式 ...

  2. 在统计学中参数的含义是指_统计学中基础概念说明

    1.什么是描述性统计? 描述性统计,就是从总体数据中提取变量的主要信息(总和.均值等),从而从总体层面上,对数据进行统计性描述.在统计的过程中,通常会配合绘制相关的统计图来进行辅助.2.统计量 描述性 ...

  3. 在统计学中参数的含义是指_《统计学》名词解释及公式

    章节 主要内容 学习要点 1.1 统计及其 应用领域 什么是统计学  概念:统计学,描述统计,推断统计. 统计的应用领域  统计在工商管理中的应用.  统计的其他应用领域. 1.2 数据的类 型 ...

  4. log4j格局具体格式ConversionPattern中参数的含义

    log4j布局具体格式ConversionPattern中参数的含义 如果使用pattern布局就要指定的打印信息的具体格式ConversionPattern,打印参数如下: <!-- %m 输 ...

  5. 怎么自学Tekla智能节点中参数的含义——学会获取官方资料才是王道

    摘要 本文主要讲述Tekla智能节点官方资料三种获取方式: ①从原生软件获取: ②从网页获取: ③下载离线帮助文档: 以175号节点为例: 一.在节点详情的页面,直接按 F1 键,可使用tekla的自 ...

  6. 方差分析中怎么看有无显著性影响_用R语言做单因素方差分析及多重比较

    SPSS方差分析的应用已经做得非常好了,绝大多数的方差分析问题均可通过SPSS"点菜单"的方式得以解决,R语言在统计和可视化方面有自己的特色,我们不妨来对比着学习.选用R语言自带案 ...

  7. oracle存储过程 论文,Oracle中基于Java的存储过程开发_计算机论文

    论文导读::存储过程是一种数据库对象,将执行计划存储在数据库的服务器中,它的执行速度比独立执行同样的程序要快.任何一个设计良好的数据库应用程序都应该用到存储过程.存储过程可以使得对数据库的管理.显示关 ...

  8. cad2016中选择全图字体怎么操作_拿走不用谢!一分钟永久解决CAD字体乱码显示不全,早该知道了...

    AutoCAD绘图日常,打开CAD图纸使用,总是显示文字显示不全,或者是直接的字体乱码,有的时候甚至是直接的看不见,怎么办? 相信这个问题一定是困扰了太多的小伙伴,如何解决?掌握这3种方法,永久解决, ...

  9. 耿直:统计学中的因果推断问题(Causal Inference)

    来源:量化研究方法 本文约3000字,建议阅读5分钟. 数学科学学院耿直老师为你介绍统计学中的因果推断问题. 今天,小编带来了数学科学学院耿直老师关于统计学中因果推断问题的介绍.文中介绍了几种分析因果 ...

最新文章

  1. vivo亿级微服务 API 网关架构实践
  2. nginx源码分析—内存池结构ngx_pool_t及内存管理
  3. jenkins角色权限管理
  4. jupyter 数据分析可视化案例_Python数据分析及可视化实例之Anaconda、Jupyter简介
  5. SQL语句AND 和 OR执行的优先级
  6. 物资管理系统c语言课程设计,C语言实现仓库物资管理系统
  7. 同包类 和 其他类 java_关于继承:为什么Java中的“protected”修饰符允许访问同一个包中的其他类?...
  8. 马斯克:电动皮卡Cybertruck尺寸在短时间内不会变小
  9. 我的docker随笔37:使用gitlab和jenkins实现CICD
  10. 【转】Prewitt 算子
  11. android 开发按键精灵,安卓按键精灵实现后台
  12. Visual Studio介绍及安装
  13. Linux网络编程:libnet 移植及使用
  14. 中国互联网大人物直播简史
  15. 冬瓜哥祝大家新年快乐!
  16. 虾皮「光速大裁员」:7分钟大会后,软件瞬间查无此人
  17. 如何屏蔽百度搜索热点
  18. webservice:com.sun.xml.internal.ws.server.ServerRtException: [failed to localize]
  19. 14考虑电动汽车可调度潜力的充电站两阶段市场投标策略
  20. 世界杯“引爆”东南亚电商狂潮,电商人如何选品和营销?

热门文章

  1. PE文件格式详解(二)
  2. 如何理解 Linux 中的 load averages
  3. 斯坦福大学机器学习——高斯判别分析
  4. JS 转换数字为大写
  5. underscorejs-groupBy学习
  6. JavaScript 音频处理库 pico.js
  7. cdev 结构体与字符设备的注册
  8. Linux系统信息查看命令大全
  9. Vue组件通信原理剖析(一)事件总线的基石 $on和$emit
  10. Android Studio --- [学习笔记]RadioButton、CheckBox、ImageView、ListView、TCP的三次握手