上一篇文章讨论了μ±3σ统计分析的限制前提:正态分布。本篇将继续讨论限制μ±3σ统计分析方法的另一个因素:样本量。

1 案例

某原料药中间体含量(%,限度96.5-103.5)统计数据如下:

中间体含量-10批

首先进行正态判定,结果显示:不能拒绝正态。

含量数据正态性检验

然后进行μ±3σ分析,结果显示:所有数据均在μ±3σ计算的控制限度内,但控制下限低于规格限度,NO PASS!

含量Xbar控制图-10批

随着时间的推移,生产批次不断增加,继续统计数据并进行μ±3σ分析,结果显示:所有数据均在μ±3σ计算的控制限度内,且控制限度低于规格限度,PASS!

中间体含量-20批
含量Xbar控制图-20批

增加样本数量至30,再次进行分析,结果显示:数据均在μ±3σ计算的控制限度内,且控制限度低于规格限度, PASS!

中间体含量-30批
含量Xbar控制图-30批

2 WHY

数据均为正态,怎么又出现了不同的结论!

现在,回到问题的本质。

2.1 定性-点估计

上述案例实际采用的是控制限

,用样本均值
估计总体均值u,用样本标准差s估计总体标准差σ。

点估计不能保证每次估计参数u、s均是无偏差的!

对于正态总体,用

估计u的标准差
(1)

用s估计σ的标准差

(2)。

可见,n越大,σ越小,对控制限度估计精度越大,越可信。

2.2 定量-边际误差

公式1~2中,包含参数σ未知,而σ从样本数据中是得不到的。如果以s代替σ计算,该如何解释呢,幸运的是,边际误差[1]解决了这一问题。

总体均值u估计的边际误差

(3)。

总体标准差σ估计的边际误差

(4)。

可见:n越大,s越小,边际误差越小,控制限估计精度越大,越可信。

2.3 样本量n=30

传统的大样本“n=30”就足够了吗?

对于正态总体,置信水平均为0.95,根据公式3~4计算的总体均值和标准差的双侧置信区间的边际误差数据如下:

置信水平分别为0.95的双侧置信区间的边际误差

表中数据显示:如果s=5.0,n=30,对应的均值和标准差的边际误差分别为1.867和1.722,显然在中间体含量的控制限度估计上,将出现较大的误判率。

3 HOW

n越大,越可信,那么取多大样本量估计是合适的?

对于“老”产品,可以采用稳定生产的同一生产线历史均值和标准差作为μ和σ的估计,进行μ±3σ分析。

对于“新”产品,可以通过初步的推测或之前的试验研究,得到标准差的推测值,根据能够接受的产品质量属性和工艺属性的误差接受程度[2]选择合适的样本量。

在考虑提高精度的时候,应兼顾样本量和成本之间的平衡关系。

4 小结

μ±3σ分析进行正态判定后,还应选择合适的样本量。

样本量n=30仅为经验数值,如果标准差很大,统计分析将出现较大的误判率。

同一总体,n越大,控制限估计精度越大,越可信,但成本控制必须在视野之内。

参考

  1. ^对于双侧置信区间,边际误差为估计统计量与每个端点之间的距离
  2. ^一般来说,杂质、含量、收率等接受程度依次变大

pass样本量_年度质量回顾-样本量相关推荐

  1. 均值极差图控制上下限_年度质量回顾-单值移动极差

    基于前文的讨论,总体均值和标准差未知,数据分布未知时,用 估计 做为控制限进行统计分析是不够准确精密的.连续型变量常用的控制图有单值-移动极差图.均值-极差图.均值-标准差图.单值-移动极差图用于不属 ...

  2. 药企产品年度质量回顾的分析工具解读---控制图的判异准则

    药企产品年度质量回顾的分析工具解读-控制图的判异准则 控制图是什么? 1924年5月16日美国W·A·Shewhart休哈特博士发明了第一张控制图.世界上第一张控制图是不合格率P控制图,用来发现成品不 ...

  3. 质量回顾分析系统软件(QRS)

    质量回顾分析系统(QRS) 传统的制药企业年度产品质量回顾分析系统多采用Excel和Minitab进行分析,但是费时费力,人力投入大,工作繁琐.全新QRS软件系统能帮助制药企业快速制作年度产品质量回顾 ...

  4. 2019年度年中回顾总结_我的2019年回顾和我的2020年目标(包括数量和收入)

    2019年度年中回顾总结 In this post we're going to take a look at how 2019 was for me (mostly professionally) ...

  5. mysql 备份数据库结账_年度结转问题综合解答(转)

    1:备份还 是备份(用的很多操作是没有办法反结帐或反操作的,可以用恢复有方式返回到前一个操作状态) 备份方法: 1:用用友自带工具备份: 系统管理--admin(或帐套主管)注册-- 帐套--输出(选 ...

  6. 时间序列模式识别_空气质量传感器数据的时间序列模式识别

    时间序列模式识别 · 1. Introduction· 2. Exploratory Data Analysis ∘ 2.1 Pattern Changes ∘ 2.2 Correlation Bet ...

  7. python代码编写_高质量Python代码编写的5个优化技巧

    如今我使用 Python 已经很长时间了,但当我回顾之前写的一些代码时,有时候会感到很沮丧.例如,最早使用 Python 时,我写了一个名为 Sudoku 的游戏(GitHub地址:https://g ...

  8. windows store下载_年度付费软件排行榜这10款软件,你用过5款以上,就算效率达人!Windows平台...

    别人说这些软件香,你看看香不香!别问我香香是谁. 封面说底部有这个!!! No.10 :天若 OCR 文字识别软件 支持平台:Windows 推荐理由:您减少重复劳动,助您提高工作效率.文字识别,一键 ...

  9. 2021年A股年度行情回顾与总结

    这两天一直苦恼股价上不去,想反思一下,结果找到原因了. A股每天的成交额不到1万亿,但是看看A股总市值呢,96.95万亿.也就是说假设行情好,大部分成交额用于买股,平均下来也就每个股票能涨0.8% 但 ...

最新文章

  1. Windows Server2008R2 域迁移
  2. YZMCMS V5.3后台 SSRF
  3. 【中级软考】两个人同一日就同样的发明创造申请专利,应该授予谁?
  4. SAP CRM呼叫中心中结束按钮的实现逻辑
  5. 使用Hexo搭建博客步骤详解
  6. cesium polygon 悬浮在半空中
  7. 33 SD配置-销售凭证设置-定义销售凭证的号码范围
  8. 吴恩达团队最新成果:用深度学习预测死亡概率,改善临终关怀
  9. python装饰器与闭包_Python:函数装饰器和闭包
  10. oracle rman异地备份,通过RMAN磁盘备份进行异地恢复
  11. mysql数据库命令从哪里输入_mysql数据库操作命令
  12. vs2010的Visual Assist X破解版安装
  13. leaflet保存pm绘图geojson数据
  14. python 拦截windows弹窗广告_Win10如何拦截桌面弹窗广告?流氓软件怎么彻底清除?...
  15. Learn Git Branching 答案
  16. linux 卸载 sdcc,Linux sdcc安装
  17. VIVO NEX3高层预热,差0.4到100%屏占比,这得让多少人心动
  18. windows10下使用minGW64 编译krita源码报错
  19. android音视频播放器开发百度云,Android 播放端 SDK
  20. 猜客魔盒二次开发盲盒APP趣味功能讲解(一)

热门文章

  1. 低版本wordpress运行在PHP5.4上如何关闭warning信息
  2. NYOJ-491 幸运三角形
  3. 网域高科家具行业网站开发管理系统
  4. 浅谈V8引擎中的垃圾回收机制
  5. Docker实战 (docker swarm的应用,docker集群的构建,在docker集群中部署服务)
  6. Hystrix面试 - 基于 Hystrix 信号量机制实现资源隔离
  7. 创建设计模式 - 工厂设计模式
  8. C语言,利用循环语句找出1000以内的水仙花数
  9. 水一贴,用任何一种语言导出oracle存储过程(视图)脚本
  10. python configparser模块来 读取 、 创建 和 修改 配置文件