MATLAB学习笔记(13 统计 Statistics_&_Data_Analysis)

如想获得更好体验,可以转到下面链接:13

文章目录

  • MATLAB学习笔记(13 统计 Statistics_&_Data_Analysis)
    • 1. 介绍
    • 2. 叙述统计学(Descriptive Statistics)
      • 2.1 平均数,中位数,众数,四分位数
      • 2.2 极差,四分位距
      • 2.3 方差,标准差
      • exercise(P10)
      • exercise(P12)
      • 2.5 箱线图:`Boxplot()`
      • exercise(P15)
      • 2.6 偏度:`skewness()`
      • 2.7 峰度(Kurtosis)
      • exercise(P19)
    • 3. 推论统计学(Inferential Statistics)
      • 3.1 假设检验
      • 3.2 T型检验
      • 3.3 一般的假设检验

1. 介绍

  • 主要统计方法分类
  • 叙述统计学:描述数据的方法

    • Numerical and graphical methods to look for patterns, to summarize the information in a data set
  • 推论统计学:利用给出的数据假设数据可以呈现什么,这个假设是为真或者不为真。

    • Methods to make estimates, decisions, and predictions using sample data

2. 叙述统计学(Descriptive Statistics)

2.1 平均数,中位数,众数,四分位数

平均数 (Mean),中位数 (Median),众数 (Mode),四分位数 (Quartile)

四分位数 (Quartile):把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值,其中每部分包含25%的数据。中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值 q1q_1q1​(称为下四分位数)和处在75%位置上的数值 q3q_3q3​(称为上四分位数)。

![](https://img-blog.csdnimg.cn/img_convert/f6b96976539e317e4b9129ce90433a46.png)

matlab表示:

函数名 作用
mean Average or mean value of array
median Average or mean value of array
mode Most frequent values in array
prctile Percentiles of a data set(可以用来计算quartile)

2.2 极差,四分位距

极差 (Range),四分位距 (Interquartile range)

极差表示最大值-最小值

四分位距为 q3−q1q_3-q_1q3​−q1​

函数 内容
max Largest elements in array
min Smallest elements in array

2.3 方差,标准差

Variance(方差): s=∑(xi−xˉ)2n−1s=\frac{\sum\left(x_{i}-\bar{x}\right)^{2}}{n-1}s=n−1∑(xi​−xˉ)2​

Standard deviation(标准差): s=∑(xi−xˉ)2n−1s=\sqrt{\frac{\sum\left(x_{i}-\bar{x}\right)^{2}}{n-1}}s=n−1∑(xi​−xˉ)2​​

函数 内容
std Standard deviation
var Variance

exercise(P10)

题目:

找出该变量 x4x_4x4​ 的以下属性:

  1. Mean, median, mode, and quartile

  2. Range and interquartile range

  3. Variance and standard deviation

提示:

load stockreturns;
x4 = stocks(:,4);

解:

clear
load stockreturns;
x4 = stocks(:,4);mean = mean(x4);
median = median(x4);
mode = mode(x4);
quartile = prctile(x4,[25 75],'all');   % quartile(1)表示25分位的数(q1),quartile(2)表示75分位的数(q3)range = max(x4)-min(x4);
interquartile_range = quartile(2)-quartile(1);  % q3-q1variance = var(x4);
standard_deviation = std(x4);

exercise(P12)

题目:

给出以下样本:

x = [1 3 5 5 5 5 7 9 9 9 10 13 14];

画出这些图:

解:

clear
clc
x = [1 3 5 5 5 5 7 9 9 9 10 13 14];%计算频率frequency
%i:确定x的元素,k:计算x(i)是否有重复,j:计算元素重复次数,num:该元素重复次数,
%freq:保存元素的大小和元素出现的次数
for i=1:length(x)mark = 0;    %x(1)不能跳过%判断x(i)是否有重复for k=1:i-1if i>1 && x(i)==x(k)    %有重复mark = 1;else    % 没有重复mark = 0;endendif mark==1  %有重复,跳过该x(i)elseif mark==0  %没有重复num=1;for j=1:(length(x)-i)   % j+i<=length(x)if x(i)==x(i+j)num=num+1;endendfreq(x(i))=num;endend%画图
X = 1:max(x);   %横坐标范围为1:14
subplot(1,3,1); bar(X,freq); xlim([0 max(x)]);
subplot(1,3,2); area(X,freq);xlim([0 max(x)]);
subplot(1,3,3); stem(X,freq); xlim([0 max(x)]);

算法流程图如下(可参考)

2.5 箱线图:Boxplot()

![](https://img-blog.csdnimg.cn/img_convert/059f01a6f9adcd47723f3af443b05424.png)

exercise(P15)

题目:

画出变量 stocks 的箱线图

![](https://img-blog.csdnimg.cn/img_convert/f9a215345b1906ff7ba6aee49b7de54c.png)
load stockreturns;
%把里面的每个column画成一个箱线图

解:

clear
clc
clfload stockreturns;
for n=1:size(stocks,2)  %size(stocks,2)表示stocks中第二维度长度
x(:,n) = stocks(:,n);  %x中的第1列元素等于stocks中的第1列元素
end
X = 1:size(stocks,2);    %X表示横坐标
boxplot(x,X);
title('exercise');

2.6 偏度:skewness()

三种偏态分类:(可以理解为平均值相对正态分布往左/右偏,方便记忆)

  • 左偏态:skewness < 0
  • 右偏态:skewness > 0

example:

clear
X = randn([10 3])*3;
X(X(:,1)<0, 1) = 0; X(X(:,3)>0, 3) = 0;% X(:,1)<0 表示小于0的数标记为1
% X的第一列元素中<0的元素用0替换,X的第三列元素中>0的元素用0替换,
boxplot(X, {'Right-skewed', 'Symmetric', 'Left-skewed'});
y = skewness(X)>> Class13y =1.6574    0.0112   -0.7703

2.7 峰度(Kurtosis)

峰度是用来测量分布的平坦度,正态分布的峰度为零

  • 正峰度:表示更尖锐的峰值
  • 负峰度:表示更平坦的峰值

exercise(P19)

题目:

找到变量 stocks 每一列的偏度和峰度

load stockreturns;

解:

clear
clc
clfload stockreturns;
for n=1:size(stocks,2)  % size(stocks,2)表示stocks中第二维度长度
x(:,n) = stocks(:,n);  % x的第1列元素等于stocks中的第1列元素
end
X = 1:size(stocks,2);    % X表示横坐标
boxplot(x,X);
title('exercise');skewness = skewness(x)
kurtosis = kurtosis(x)
skewness =-0.2318    0.2304   -0.1773   -0.1236   -0.1874   -0.1527   -0.3484   -0.2678    0.0963    0.0580kurtosis =3.4272    2.5871    2.4970    2.8580    2.7638    2.3758    3.4207    2.4909    3.3993    3.1807

3. 推论统计学(Inferential Statistics)

3.1 假设检验

Example:

  • 现在有个问题:我能否在班级中拿到成绩 A

  • 经典假设:

    • H0:θ=theta0H_0:\theta=theta_0H0​:θ=theta0​ 和 H1:θ≠θ0H_1:\theta \ne \theta_0H1​:θ=θ0​

      其中 H0H_0H0​ 为零假设(null hypothesis,原假设),H1H_1H1​ 为备择假设(alternativehy pothesis,关于总体分布的一切使原假设不成立的命题)

  • 假设检验的步骤:

    • 确定一个概率,如 95%
    • 找到 H0H_0H0​ 的 95% 置信区间
    • 检验我的成绩是否落入区间当中
    • 一些专业术语:
      • Confidence interval (置信区间)
      • Confidence level 1−α1-\alpha1−α (置信水平或置信度)
      • Significance level α\alphaα (显著性水平)
      • p-value (p值)

3.2 T型检验

load stockreturns;
x1 = stocks(:,3); x2 = stocks(:,10);
boxplot([x1, x2], {'3', '10'});
[h,p] = ttest2(x1, x2) % h代表原假设成立(1)或不成立(0),p表示原假设成立的概率,p越小越不成立
>> Class13h =1p =0.0423

3.3 一般的假设检验

B站台湾大学郭彦甫|MATLAB 学习笔记|13 统计 Statistics__Data_Analysis相关推荐

  1. B站台湾大学郭彦甫|MATLAB 学习笔记|12 线性方程式和线性系统 Linear equations

    MATLAB学习笔记(12 线性方程式和线性系统 Linear equations) 如想获得更好得阅读体验,可以转到后面链接 12 文章目录 MATLAB学习笔记(12 线性方程式和线性系统 Lin ...

  2. B站台湾大学郭彦甫|MATLAB 学习笔记|06 高阶绘图 Advanced Plot

    MATLAB学习笔记(06 高阶绘图 Advanced Plot) 如果想获得更好浏览体验的朋友可以转到下面链接 06 1. 对数图 (Logarithm Plots) x = logspace(-1 ...

  3. B站台湾大学郭彦甫|MATLAB 学习笔记|08 图像处理I Image Processing

    MATLAB学习笔记(08 图像处理I Image Processing) 如果想获得更好浏览体验的朋友可以转到下面链接 08 1. 基本操作 读取图像 imread() 展示图像 imshow() ...

  4. B站台湾大学郭彦甫|MATLAB 学习笔记|09 图像处理II Image Processing

    MATLAB学习笔记(09 图像处理II Image Processing) 如果想获得更好浏览体验的朋友可以转到下面链接 09 1. 提出问题 题目:如何找出图片中的米粒,并且确定他们的大小? 老师 ...

  5. B站台湾大学郭彦甫|MATLAB 学习笔记|07 Graphical user interface(GUI)设计

    MATLAB学习笔记(07 Graphical user interface(GUI)设计) 如果想获得更好浏览体验的朋友可以转到下面链接 07 (MATLAB R2021a版本提示GUIDE将在未来 ...

  6. 台湾大学郭彦甫matlab百度云,台湾国立大学郭彦甫Matlab教程笔记(23) linear systems...

    台湾国立大学郭彦甫Matlab教程笔记(23) linear systems linear system线性系统 线性系统和线性方程组实际上是解决的两类不同的问题. 下面一个系统.这个系统 是一个矩阵 ...

  7. 台湾大学郭彦甫matlab讲义,台湾国立大学郭彦甫Matlab教程笔记(17)numerical integration...

    台湾国立大学郭彦甫Matlab教程笔记(17)numerical integration 数值积分 calculating the numerical value of a definite inte ...

  8. 台湾国立大学郭彦甫Matlab教程笔记(20) root finding(numeric)

    台湾国立大学郭彦甫Matlab教程笔记(20) root finding(numeric) symbolic vs. numeric符号法和数值法的区别对比 symbolic 1)advantages ...

  9. 数字图像处理MATLAB学习笔记(五)

    数字图像处理MATLAB学习笔记(五) Color Image Processing 1 Color Image Representation in MATLAB 这里不多说了,彩色图片在计算机中以R ...

最新文章

  1. solidity 编程练习_学习Solidity编程语言并开始为区块链开发
  2. FILE操作:删除与需要拷贝文件同名的文件
  3. P1605 迷宫 dfs回溯法
  4. python网站用什么数据库_PyMySQL数据库的使用
  5. mac node oracle,将Python3.5(Mac OS X El Capitan)连接到Oracle集群(远程)
  6. SQL_create_table创建表
  7. stm32 非debug模式程序无法运行
  8. 苹果Ma视频剪辑软件:DaVinci Resolve Studio (达芬奇调色)
  9. day6--pandas
  10. 阿里云服务器“禁止外国IP访问服务器”和“禁止服务器访问外国IP”的安全组策略配置方法
  11. python求解函数偏导数sympy
  12. STM32 I2C驱动0.96寸OLED屏
  13. python列表推导式去除m3u8中的广告视频地址下载视频
  14. Learning Framer X 学习Framer X Lynda课程中文字幕
  15. 1121 Damn Single
  16. bug : UnpicklingError: invalid load key, ‘\x0a‘.
  17. 网卡流量实时查看的三种方法
  18. jquery刷新页面方法
  19. 将非托管的dll 转化为托管的dll
  20. Android 新浪微博客户端

热门文章

  1. docker容器虚拟技术
  2. 10-250 B1-2查询供应商及其供应的产品情况
  3. pyDicom基本使用操作dicom文件
  4. RateLimiter高并发访问限流
  5. 史上最全Maven教程(三)
  6. [计算机网络] --- RSTP运行原理及配置
  7. Java 数字转字符串并指定位数,位数不足,自动补零
  8. http://localhost/myphpsite/index.php
  9. JBOSS EAP 6 系列七 JPA/hibernate
  10. SVG SMIL 动画(基本动画 、变换动画)