B站台湾大学郭彦甫|MATLAB 学习笔记|13 统计 Statistics__Data_Analysis
MATLAB学习笔记(13 统计 Statistics_&_Data_Analysis)
如想获得更好体验,可以转到下面链接:13
文章目录
- MATLAB学习笔记(13 统计 Statistics_&_Data_Analysis)
- 1. 介绍
- 2. 叙述统计学(Descriptive Statistics)
- 2.1 平均数,中位数,众数,四分位数
- 2.2 极差,四分位距
- 2.3 方差,标准差
- exercise(P10)
- exercise(P12)
- 2.5 箱线图:`Boxplot()`
- exercise(P15)
- 2.6 偏度:`skewness()`
- 2.7 峰度(Kurtosis)
- exercise(P19)
- 3. 推论统计学(Inferential Statistics)
- 3.1 假设检验
- 3.2 T型检验
- 3.3 一般的假设检验
1. 介绍
- 主要统计方法分类
叙述统计学:描述数据的方法
- Numerical and graphical methods to look for patterns, to summarize the information in a data set
推论统计学:利用给出的数据假设数据可以呈现什么,这个假设是为真或者不为真。
- Methods to make estimates, decisions, and predictions using sample data
2. 叙述统计学(Descriptive Statistics)
2.1 平均数,中位数,众数,四分位数
平均数 (Mean),中位数 (Median),众数 (Mode),四分位数 (Quartile)
四分位数 (Quartile):把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值,其中每部分包含25%的数据。中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值 q1q_1q1(称为下四分位数)和处在75%位置上的数值 q3q_3q3(称为上四分位数)。
matlab表示:
函数名 | 作用 |
---|---|
mean
|
Average or mean value of array |
median
|
Average or mean value of array |
mode
|
Most frequent values in array |
prctile
|
Percentiles of a data set(可以用来计算quartile) |
2.2 极差,四分位距
极差 (Range),四分位距 (Interquartile range)
极差表示最大值-最小值
四分位距为 q3−q1q_3-q_1q3−q1
函数 | 内容 |
---|---|
max
|
Largest elements in array |
min
|
Smallest elements in array |
2.3 方差,标准差
Variance(方差): s=∑(xi−xˉ)2n−1s=\frac{\sum\left(x_{i}-\bar{x}\right)^{2}}{n-1}s=n−1∑(xi−xˉ)2
Standard deviation(标准差): s=∑(xi−xˉ)2n−1s=\sqrt{\frac{\sum\left(x_{i}-\bar{x}\right)^{2}}{n-1}}s=n−1∑(xi−xˉ)2
函数 | 内容 |
---|---|
std
|
Standard deviation |
var
|
Variance |
exercise(P10)
题目:
找出该变量 x4x_4x4 的以下属性:
Mean, median, mode, and quartile
Range and interquartile range
Variance and standard deviation
提示:
load stockreturns;
x4 = stocks(:,4);
解:
clear
load stockreturns;
x4 = stocks(:,4);mean = mean(x4);
median = median(x4);
mode = mode(x4);
quartile = prctile(x4,[25 75],'all'); % quartile(1)表示25分位的数(q1),quartile(2)表示75分位的数(q3)range = max(x4)-min(x4);
interquartile_range = quartile(2)-quartile(1); % q3-q1variance = var(x4);
standard_deviation = std(x4);
exercise(P12)
题目:
给出以下样本:
x = [1 3 5 5 5 5 7 9 9 9 10 13 14];
画出这些图:
解:
clear
clc
x = [1 3 5 5 5 5 7 9 9 9 10 13 14];%计算频率frequency
%i:确定x的元素,k:计算x(i)是否有重复,j:计算元素重复次数,num:该元素重复次数,
%freq:保存元素的大小和元素出现的次数
for i=1:length(x)mark = 0; %x(1)不能跳过%判断x(i)是否有重复for k=1:i-1if i>1 && x(i)==x(k) %有重复mark = 1;else % 没有重复mark = 0;endendif mark==1 %有重复,跳过该x(i)elseif mark==0 %没有重复num=1;for j=1:(length(x)-i) % j+i<=length(x)if x(i)==x(i+j)num=num+1;endendfreq(x(i))=num;endend%画图
X = 1:max(x); %横坐标范围为1:14
subplot(1,3,1); bar(X,freq); xlim([0 max(x)]);
subplot(1,3,2); area(X,freq);xlim([0 max(x)]);
subplot(1,3,3); stem(X,freq); xlim([0 max(x)]);
算法流程图如下(可参考)
2.5 箱线图:Boxplot()
exercise(P15)
题目:
画出变量 stocks
的箱线图
load stockreturns;
%把里面的每个column画成一个箱线图
解:
clear
clc
clfload stockreturns;
for n=1:size(stocks,2) %size(stocks,2)表示stocks中第二维度长度
x(:,n) = stocks(:,n); %x中的第1列元素等于stocks中的第1列元素
end
X = 1:size(stocks,2); %X表示横坐标
boxplot(x,X);
title('exercise');
2.6 偏度:skewness()
三种偏态分类:(可以理解为平均值相对正态分布往左/右偏,方便记忆)
- 左偏态:skewness < 0
- 右偏态:skewness > 0
example:
clear
X = randn([10 3])*3;
X(X(:,1)<0, 1) = 0; X(X(:,3)>0, 3) = 0;% X(:,1)<0 表示小于0的数标记为1
% X的第一列元素中<0的元素用0替换,X的第三列元素中>0的元素用0替换,
boxplot(X, {'Right-skewed', 'Symmetric', 'Left-skewed'});
y = skewness(X)>> Class13y =1.6574 0.0112 -0.7703
2.7 峰度(Kurtosis)
峰度是用来测量分布的平坦度,正态分布的峰度为零
- 正峰度:表示更尖锐的峰值
- 负峰度:表示更平坦的峰值
exercise(P19)
题目:
找到变量 stocks
每一列的偏度和峰度
load stockreturns;
解:
clear
clc
clfload stockreturns;
for n=1:size(stocks,2) % size(stocks,2)表示stocks中第二维度长度
x(:,n) = stocks(:,n); % x的第1列元素等于stocks中的第1列元素
end
X = 1:size(stocks,2); % X表示横坐标
boxplot(x,X);
title('exercise');skewness = skewness(x)
kurtosis = kurtosis(x)
skewness =-0.2318 0.2304 -0.1773 -0.1236 -0.1874 -0.1527 -0.3484 -0.2678 0.0963 0.0580kurtosis =3.4272 2.5871 2.4970 2.8580 2.7638 2.3758 3.4207 2.4909 3.3993 3.1807
3. 推论统计学(Inferential Statistics)
3.1 假设检验
Example:
现在有个问题:我能否在班级中拿到成绩 A
经典假设:
H0:θ=theta0H_0:\theta=theta_0H0:θ=theta0 和 H1:θ≠θ0H_1:\theta \ne \theta_0H1:θ=θ0
其中 H0H_0H0 为零假设(null hypothesis,原假设),H1H_1H1 为备择假设(alternativehy pothesis,关于总体分布的一切使原假设不成立的命题)
假设检验的步骤:
- 确定一个概率,如 95%
- 找到 H0H_0H0 的 95% 置信区间
- 检验我的成绩是否落入区间当中
- 一些专业术语:
- Confidence interval (置信区间)
- Confidence level 1−α1-\alpha1−α (置信水平或置信度)
- Significance level α\alphaα (显著性水平)
- p-value (p值)
3.2 T型检验
load stockreturns;
x1 = stocks(:,3); x2 = stocks(:,10);
boxplot([x1, x2], {'3', '10'});
[h,p] = ttest2(x1, x2) % h代表原假设成立(1)或不成立(0),p表示原假设成立的概率,p越小越不成立
>> Class13h =1p =0.0423
3.3 一般的假设检验
B站台湾大学郭彦甫|MATLAB 学习笔记|13 统计 Statistics__Data_Analysis相关推荐
- B站台湾大学郭彦甫|MATLAB 学习笔记|12 线性方程式和线性系统 Linear equations
MATLAB学习笔记(12 线性方程式和线性系统 Linear equations) 如想获得更好得阅读体验,可以转到后面链接 12 文章目录 MATLAB学习笔记(12 线性方程式和线性系统 Lin ...
- B站台湾大学郭彦甫|MATLAB 学习笔记|06 高阶绘图 Advanced Plot
MATLAB学习笔记(06 高阶绘图 Advanced Plot) 如果想获得更好浏览体验的朋友可以转到下面链接 06 1. 对数图 (Logarithm Plots) x = logspace(-1 ...
- B站台湾大学郭彦甫|MATLAB 学习笔记|08 图像处理I Image Processing
MATLAB学习笔记(08 图像处理I Image Processing) 如果想获得更好浏览体验的朋友可以转到下面链接 08 1. 基本操作 读取图像 imread() 展示图像 imshow() ...
- B站台湾大学郭彦甫|MATLAB 学习笔记|09 图像处理II Image Processing
MATLAB学习笔记(09 图像处理II Image Processing) 如果想获得更好浏览体验的朋友可以转到下面链接 09 1. 提出问题 题目:如何找出图片中的米粒,并且确定他们的大小? 老师 ...
- B站台湾大学郭彦甫|MATLAB 学习笔记|07 Graphical user interface(GUI)设计
MATLAB学习笔记(07 Graphical user interface(GUI)设计) 如果想获得更好浏览体验的朋友可以转到下面链接 07 (MATLAB R2021a版本提示GUIDE将在未来 ...
- 台湾大学郭彦甫matlab百度云,台湾国立大学郭彦甫Matlab教程笔记(23) linear systems...
台湾国立大学郭彦甫Matlab教程笔记(23) linear systems linear system线性系统 线性系统和线性方程组实际上是解决的两类不同的问题. 下面一个系统.这个系统 是一个矩阵 ...
- 台湾大学郭彦甫matlab讲义,台湾国立大学郭彦甫Matlab教程笔记(17)numerical integration...
台湾国立大学郭彦甫Matlab教程笔记(17)numerical integration 数值积分 calculating the numerical value of a definite inte ...
- 台湾国立大学郭彦甫Matlab教程笔记(20) root finding(numeric)
台湾国立大学郭彦甫Matlab教程笔记(20) root finding(numeric) symbolic vs. numeric符号法和数值法的区别对比 symbolic 1)advantages ...
- 数字图像处理MATLAB学习笔记(五)
数字图像处理MATLAB学习笔记(五) Color Image Processing 1 Color Image Representation in MATLAB 这里不多说了,彩色图片在计算机中以R ...
最新文章
- solidity 编程练习_学习Solidity编程语言并开始为区块链开发
- FILE操作:删除与需要拷贝文件同名的文件
- P1605 迷宫 dfs回溯法
- python网站用什么数据库_PyMySQL数据库的使用
- mac node oracle,将Python3.5(Mac OS X El Capitan)连接到Oracle集群(远程)
- SQL_create_table创建表
- stm32 非debug模式程序无法运行
- 苹果Ma视频剪辑软件:DaVinci Resolve Studio (达芬奇调色)
- day6--pandas
- 阿里云服务器“禁止外国IP访问服务器”和“禁止服务器访问外国IP”的安全组策略配置方法
- python求解函数偏导数sympy
- STM32 I2C驱动0.96寸OLED屏
- python列表推导式去除m3u8中的广告视频地址下载视频
- Learning Framer X 学习Framer X Lynda课程中文字幕
- 1121 Damn Single
- bug : UnpicklingError: invalid load key, ‘\x0a‘.
- 网卡流量实时查看的三种方法
- jquery刷新页面方法
- 将非托管的dll 转化为托管的dll
- Android 新浪微博客户端