learning why, thinking what, then forgetting how.

随着时间的流逝,知识总会被遗忘和被沉淀,我们无法选择去遗忘那一部分,但是我们可以选择去沉淀那一部分

教材为:《数理统计(孙海燕等)》


第五章 方差分析与正交试验设计

在科研和生产中,影响一个事物的因素有很多个。有些因素影响大,有些因素影响小。为了保证优质、高产、低消耗,就必须找出对产品质量与产量有显著影响的那些因素。

本章介绍如何充分利用试验诗句进行分析、推断因素影响显著性的方差分析方法。其主要任务是通过对数据的分析处理,搞清各试验条件以及它们所处的状态对试验结果的影响,以便有效地指导实践,提高经济效益或科研水平。

本章主要介绍方差分析正交试验设计


5.1 单因素方差分析

为了考察某个因素对试验指标的影响,应该把影响试验指标的其他因素相对固定,而让所考虑的因素改变。其中,因素所处的不同状态称为水平

检验单因素是否显著的问题,转化为推断具有相同方差正态总体均值是否相等的问题。

这里判断正态均值是否相等不能使用 t-检验法:即使任两个正态总体 t-检验的显著水平为 α=0.05,当正态总体个数增多时,使用 t-检验法进行两两检验,累计误差将导致犯第一类错误的概率大大增加。Fisher 提出方差分析法,可同时推断多个正态总体均值是否相等

方差分析的目的就是要确定数据差异主要是由随机误差引起的还是由所研究的因素的水平变化引起的。

  • 单因素试验方差分析表

其中,组间平方和 SA​,组内平方和或误差平方和 Se​,离差平方和 ST​,且因素 A 有 p 个水平,对 A=Ai​ 进行了 ni​ 次试验。

自由度确定

  • SA​:共 p 个变量,满足 1 个线性约束。
  • Se​:共 n 个变量,满足 p 个线性约束。
  • ST​:共 n 个变量,满足 1 个线性约束。

且当假设因素 A 的水平变化对试验结果无影响时,Se​SA​​应该有取值偏小的趋势,则:

  • 假设H0​:因素 A 的水平变化对试验结果无影响
  • 检验统计量为:F=Se​SA​​=Se​/(n−p)SA​/(p−1)​~F(p−1,n−p)
  • 给定显著性水平 α:PH0​​{F≥F1−α​(p−1,n−p)}=α
  • 拒绝域为:W={F:F≥F1−α​(p−1,n−p)}

如果进行 F-检验后拒绝了原假设H0​,则说明因素 A 的水平变化对试验结果有影响。而至于那些因素水平下存在差别,还需要借助多重比较方法来解决,用这个方法还可以确定因素的最优水平

在进行方差分析时,试验结果必须满足三个条件:

  1. 独立性:在试验过程中,只要很好地确保各次试验独立进行,试验结果的独立性一般很容易满足。
  2. 正态性:检验正态性的常用方法有 Pearsonχ2 检验法等。
  3. 方差齐性:比正态性要求更为重要,在实际应用中宁可偏离正态性,也要尽可能保证方差齐性。通过检验,如果数据不具有方差齐性,可以通过适当变换,使变换后的数据具有方差齐性。

5.2 双因素方差分析

在两个因素的试验中,不但每一个因素单独对试验结果起作用,而且两个因素联合起来往往也会起作用,称这种作用为两个因素的交互作用。在多因素方差分析中,把交互作用当成一个新因素来处理

无重复试验的方差分析

无重复试验的意思是对因素 A 与因素 B 的每种搭配仅进行一次独立试验,实际上是假设因素 A 与因素 B 之间无交互作用。因为只进行了一次试验,所以将交互作用归为随机误差

  • 无重复试验的双因素试验方差分析表

其中,组间平方和 SA​,SB​,组内平方和或误差平方和 Se​,离差平方和 ST​,且因素 A 有 p 个水平,因素 B 有 q 个水平。

自由度确定

  • SA​:共 p 个变量,满足 1 个线性约束。
  • SB​:共 q 个变量,满足 1 个线性约束。
  • ST​:共 pq 个变量,满足 1 个线性约束。
  • Se​:f(ST​)−f(SA​)−f(SB​)。

且当

  • 假设因素 A 的水平变化对试验结果无影响时,Se​SA​​应该有取值偏小的趋势
  • 假设因素 B 的水平变化对试验结果无影响时,Se​SB​​应该有取值偏小的趋势

等重复试验的方差分析

等重复试验的意思是对因素 A 与因素 B 的每种搭配进行了 r 次独立试验,将交互作用与随机误差分离开

  • 等重复试验的双因素试验方差分析表

其中,组间平方和 SA​,SB​,交互作用引起的数据离差平方和 SAXB​,组内平方和或误差平方和 Se​,离差平方和 ST​,且因素 A 有 p 个水平,因素 B 有 q 个水平,每种搭配共进行了 r 次试验。

自由度确定

  • SA​:共 p 个变量,满足 1 个线性约束。
  • SB​:共 q 个变量,满足 1 个线性约束。
  • ST​:共 pqr 个变量,满足 1 个线性约束。
  • Se​:共 pqr 个变量,满足 pq 个线性约束。
  • SAXB​:f(ST​)−f(SA​)−f(SB​)−fSe​。

且当

  • 假设因素 A 的水平变化对试验结果无影响时,Se​SA​​应该有取值偏小的趋势
  • 假设因素 B 的水平变化对试验结果无影响时,Se​SB​​应该有取值偏小的趋势
  • 假设交互作用 A X B 的对试验结果无影响时,Se​SAXB​​应该有取值偏小的趋势

进行 F-检验后,如果拒绝了原假设,可以用多重比较方法辨识哪些水平的影响有显著差别,以及选取因素的最优水平。


5.3 正交试验设计的极差分析

正交试验设计法是利用一套现成的规格化的正交表科学地安排和分析多因素试验的方法。它的主要优点是:能在很多试验方案中挑选出代表性强的少数试验方案,并通过对这些少数试验方案试验结果的分析,推断出最优方案或生产工艺。同时它还可以做很多进一步的分析,提供出比试验结果本身多得多的对各因素的分析

随着所考虑的因素个数及其水平数的增多,试验次数和计算量都是很大的。若有 p 个因素,每个因素有 q 个水平,每个因素的水平搭配进行 r 次重复试验,总共就要做 n=r∗qp 次试验,而且,对这么多试验数据进行统计分析计算,也是非常繁重的任务。 如果使用正交设计来安排试验,则试验次数会大大减少,而统计分析的计算也将会变得简单。使用正交设计可使试验次数达到至少 q2 次

对正交试验结果的分析,通常采用两种方法:

正交表

  • L9​(34) 正交表

如图所示,L9​(34) 正交表最多可以安排 4 个 3 水平的因子,需要做 9 次试验。值得强调的是,在正交试验设计分析中将相互作用也看成因子

正交表的两个性质:

  1. 每个水平在每列都出现了,且每列中不同水平出现的次数相同。

    • 每个因子的各个不同水平在试验中都出现了,且出现的次数相同
  2. 在任何两列中,所有各种可能的有序对出现的次数都相同。
    • 任何两个因子各个不同水平的搭配在试验中都出现了,且出现的次数相同

因此,正交试验设计安排的试验方案是有代表性的,能够比较全面地反映各因子、各个水平对指标影响的大致情况,并且大大地减少了试验次数。

正交表的构造原理:forgetting how

无交互作用的正交试验的极差分析

  1. 选择一张合适的正交表,要求试验次数要尽可能少。
  2. 安排试验,一个因子占有一列,称此为表头设计未安排因子的列称为空列,它在正交试验设计的方差分析中起着重要作用
  • 极差分析

度量 T1j​,T2j​,T3j​ 之间差异程度大小最简单的量是极差

极差越大,说明这个因素的水平改变对试验结果影响就越大,因而极差最大的那一列所安排的因素就是对试验结果影响最大的因素,也就是最主要的因素。依照极差从大到小的排序,就可以对影响试验结果的因素主次进行排序。习惯上,用分号将极差相差过大的因子隔开,用逗号将极差相差不大的因子隔开。

最优试验方案的确定涉及到要选取每个因素的最优水平,而选取水平的策略与所考虑的指标有关。如果指标取值越大越好,则应该选取各列中 T1j​,T2j​,T3j​ 达到最大的那个水平;反之选取最小的那个水平。

需要指出的时,最优试验常常不在已做过的试验方案之中。这是因为正交表安排的试验是全部可能搭配的试验的典型代表,通过正交表安排的试验能从所有可能搭配的试验中挑选出最好的搭配方案,这正体现了正交试验设计的优越性

有交互作用的正交试验的极差分析

用正交表安排有交互作用的试验时,由于要把交互作用看成一个因子,因此它要在正交表上占有一列或几列,称所占的列为交互作用列

交互作用列的位置由交互作用列表确定,安排了交互作用的列不能再安排其他因素,否则在这列上就会出现混杂现象,导致无法区分该列的极差是由交互作用引起的还是由所安排的其他因素引起的。

  • L8​(27) 的交互作用列表

在进行表头设计时,应避免混杂现象。当所考察的因子和交互作用较多时,较小的表无法避免混杂,可以选择更大的正交表,而这会使试验次数增多,试验成本提高。当选定正交表后,若混杂不可避免:

  1. 避免交互作用与单独因子的混杂;
  2. 避免重点考察的交互作用之间的混杂;
  3. 避免重点考察的交互作用与其他交互作用的混杂;
  4. 否则,就只能选择更大的正交表。

交互作用所在列内的水平无任何实际意义,并不代表任何实际水平,它对决定试验方案不起任何作用,仅在做方差分析时要用到,仅仅依安排因素的列内水平来安排相应的试验即可。

  • 极差分析

当所研究的指标不是单增或单减时,可以进行适当的变换,使其为单增或单减。

在选择最优方案时,水平的选择次要因子应该服从主要因子。若交互作用对试验结果的影响在单独因子之前,最优水平要从交互作用来考虑。通常将两个因素的各种水平搭配下对应的试验结果之和列成表格,称为搭配表二元表

  • 因素 A 与 B 的水平搭配表

  • 因素 B 与 C 的水平搭配表

在实际应用中,为了提高统计分析结果的可靠性,条件允许时,往往会对正交试验安排的每一个试验方案进行多次试验,分别计算平均值,将其看成各试验方案下的试验数据。

若所考察的因素有 3 个或以上水平,则交互作用的分析比较复杂,不便于应用极差分析法,通常采用方差分析法


5.4 正交试验设计的方差分析

极差分析方法的优点是简单直观,但是没有将试验过程中由因素水平变化引起的数据波动同由试验随机误差引起的数据波动区分开来,因而不能真正区分试验结果的差异究竟是由水平变化所引起的,还是由试验随机误差所引起的。进一步,我们需要一个客观标准来判断所考察的因素对试验结果的影响是否显著

不考虑交互作用的正交试验的方差分析

方差分析除了计算极差,还计算了总离差平方和各个因素水平变化引起的离差平方和

  • 方差分析

空列误差列,其方差平均值为误差平方和

  • 离差平方和小于误差平方和的因素可以认为其影响不显著,并归为误差处理
  • 给定显著性水平 α,根据因素的 F-值来判断其影响是否显著;或者使用 p-值来判断其影响是否显著
    • F因​=Se​/fe​S因​/f因​​~F(f因​,fe​)
    • 拒绝域为:W因​={F因​≥F1−α​(f因​,fe​)}

考虑交互作用的正交试验的方差分析

在有交互作用的情形下,若用正交表 Ln​™ 来安排试验,则每一列的自由度为 t-1,而任意两列的交互作用的自由度为 (t-1)(t-1),因此任意两列的交互作用都要在正交表 Ln​™ 上占用 t-1 列。(在交互作用列表上可以查到 t-1 列

求解:forgetting how


5.5 均匀设计

所有的试验设计方法本质上都是在试验的范围内给出挑选代表性点的一个方法。

正交设计是根据正交性来挑选代表点,在挑选代表点时有两个特点:均匀分散,整齐可比。但为了在达到整齐可比,正交设计的试验点并没有能做到充分均匀分散,而也使得其试验布点的数目比较多。

均匀设计是基于试验点在整个试验范围内均匀散布的从均匀性角度出发的一种试验设计方法,是数论方法中的伪蒙特卡罗方法的一个应用。均匀设计可极大地降低试验的次数,正交试验必须至少要做 q2 次试验,而均匀设计只需要 q 次试验,其中 q 为因素的水平数。均匀设计失去了正交设计的整齐可比性,但更注重了均匀性,在选点方面有更大的灵活性。

  • 水平数多,因素数多:均匀设计
  • 水平数少,因素数少:正交设计
  • 正交设计和均匀设计结合使用

求解:forgetting how

数理统计:方差分析与正交试验设计相关推荐

  1. SPSS统计分析案例:无空白列重复正交试验设计方差分析

    SPSS统计分析案例:无空白列重复正交试验设计方差分析 前面有讲过 SPSS正交试验设计及其方差分析 一篇文章,包含了一个典型的正交试验案例.然而在实际应用当中,主观客观条件复杂多变,在试验设计中就要 ...

  2. 正交试验设计例题及答案_正交表测试用例设计方法的特点是什么?

    用最少的实验覆盖最多的操作,测试用例设计很少,效率高,但是很复杂: 对于基本的验证功能,以及二次集成引起的缺陷,一般都能找出来:但是更深的缺陷,更复杂的缺陷,还是无能为力的: 具体的环境下,正交表一般 ...

  3. 正交设计 python算法_人人都可以掌握的正交试验设计测试用例方法

    ## 介绍 - TamanduaOATs 是测者开发并开源的生成正交计算的pyd(python库)程序(放到python下的dlls目录下) - 项目地址:https://github.com/cri ...

  4. 正交排列法、正交试验设计、正交表

    正交排列法.正交试验设计 正交排列法能够使用最小的测试过程集合获得最大的测试覆盖率,当可能的输入数据或输入数据的组合数量很大时,由于不可能为每个输入组合都创建测试用例,可以采用这种方法. 正交试验设计 ...

  5. 黑盒测试:等价类划分、边界值、错误推测、因果图、判定表组成、场景法、正交试验设计

    黑盒测试方法 黑盒测试流程 等价类划分法 边界值分析法 错误推测法 因果图法 判定表组成法 场景法 正交试验设计 黑盒测试流程 测试计划:根据用户的需求报告中的功能需求.性能需求等功能规格指标制定相应 ...

  6. 正交实验设计插值方法C语言,正交试验设计及C语言实现.doc

    正交试验设计及C语言实现 正交设计的基本知识 一.正交表的分类及特点 HYPERLINK "/stathlp/statcai/sasebook11.htm" \l "zj ...

  7. 正交实验设计插值方法C语言,正交试验设计和c语言实现

    正交试验设计和c语言实现 (9页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 19.90 积分 正交设计的基本知识一.正交表的分类及特点一.正交表的分类及 ...

  8. 正交试验设计例题及答案_4. 什么是正交试验设计?举例说明什么是正交试验设计中的因素及因素的水平?_学小易找答案...

    [单选题]The headmaster hurried to the concert hall only _____ the speaker ____. [单选题]_________ from his ...

  9. 正交试验设计例题及答案_【正交试验设计法是】试验设计与分析试题及答案

    [www.okfie.com--欢迎词] 试验设计与分析这门课程比较深奥,内容复杂,要学好这门课程不容易,同学们要用心去学才能学好试验设计与分析.下面是阳光网小编给大家整理的试验设计与分析试题及答案, ...

  10. 实用干货!正交试验设计及极差分析步骤总结!

    一.研究背景 当前有一项研究,研究大豆出油率分别与3个因素的关系情况,分别是萃取液,温度和处理时间.需要设计一个三因素三水平的正交试验表,并收集试验数据后进行分析,希望找出3个因素时各水平的最佳大豆出 ...

最新文章

  1. 仅需1/5成本:TPU是如何超越GPU,成为深度学习首选处理器的
  2. 关于鼠标移动太快导致moseleave事件不触发的问题
  3. linux中vi大括号enter缩进,格式 – 如何在vi中对齐代码(大括号,括号等)?
  4. 新浪微博搜索php待遇,新浪微博面试
  5. 惊呆!骑士一天收入过万?顺丰同城回应:用户打赏约7856元
  6. Y400中通过easybcd在win7下面的安装Ubuntu14
  7. Combating Adversarial Misspellings with Robust Word Recognition
  8. 解决Tensorflow2.0出现:AttributeError: module 'tensorflow' has no attribute 'get_default_graph'的问题
  9. git submodule时fatal: Not a git repository (or any parent up to mount point /home)
  10. 附上堆和栈的区别 (转贴)
  11. 维纳滤波python 函数_Python中离焦图像的维纳滤波
  12. 四款亲试好用的PDF编辑器推荐,看看哪款最适合你
  13. Uber上市即破发 CEO安慰员工:Facebook和亚马逊上市后股价表现也不好
  14. 小学信息技术 用计算机画画 教学目标,小学信息技术教学计划
  15. 使用 vimdiff 比较文件的技巧
  16. 中国金融进入移动支付时代
  17. 【故障处理】队列等待之enq: TX - row lock contention
  18. RPG冒险类游戏:矮人The Dwarves for Mac中文版(支持m1)
  19. .NET 控件集 ComponentOne 2018V2正式发布,提供轻量级的 .NET BI 仪表板
  20. NS32F103C8T6 可完美替代 STM32F103C8T6

热门文章

  1. android: unexpected end of stream
  2. 六种物联网无线通信技术对比及选择
  3. journalctl查看服务日志
  4. 小米手机第三方卡刷软件_小米手机刷机工具官方下载
  5. 94页5万字市级应急平台建设方案
  6. 解决酷狗音乐缓存文件kgtemp文件无法播放的问题
  7. lisp绘制直齿圆柱齿轮_直齿圆柱齿轮的知识及其画法
  8. DP动态规划--乡村邮局问题-Post Office(POJ-1160)
  9. 彻底卸载anaconda教程
  10. 【图像处理算法】直方图均衡化