《概率论与数理统计》作业一,python画频率分布表

    • 5.1
      • 2:
      • 5:
      • 6:
    • 5.2
      • 2:
      • 3:
    • 5:
  • 5.3
    • 3:
    • 4:
    • 5:
    • 8:
    • 10:
    • 13:
    • 24:
    • 28:
      • (1)
      • (2)
      • (3)
    • 频率分布表画图函数(按照分割区间大小/按照分组
      • (1)按照分组数
      • (2)按照分割区间大小

5.1

2:

总体:全体成年男子的抽烟情况
样本:50个同学调查到的全部5000名男子
总体分布:Bernoulli分布

5:

总体:某场生产的所有电容器
样本:抽出的n件产品
样本分布:
假设每个样本的分布iid,且都服从指数分布
P(X1=x1,X2=x2,...,Xn=xn)=Πi=1nλe−λxiP(X_1=x_1,X_2=x_2,...,X_n=x_n)=\Pi_{i=1}^{n} \lambda e^{-\lambda x_i }P(X1​=x1​,X2​=x2​,...,Xn​=xn​)=Πi=1n​λe−λxi​

6:

我认为这个结论是不合理的,因为总体是所有毕业生,但是样本是返校毕业生,工资低混的不好的毕业生不太愿意返校,抽样不随机。毕业生平均工资低于5万美金。

平均工资,平均年龄等样本数据一般有偏,样本均值不适合代表平均水平。

5.2


2:

3+4+8+3+2=20

分布函数要求右连续
F20(x)={0x<3832038≤x<4872048≤x<583458≤x<6891068≤x<781x≥78F_{20}(x)=\left\{ \begin{aligned} &0 \qquad & x< 38 \\ &\frac{3}{20} & 38\leq x< 48 \\ &\frac{7}{20} & 48\leq x< 58\\ &\frac{3}{4} &58\leq x<68\\ &\frac{9}{10}&68\leq x< 78\\ &1& x\geq 78 \end{aligned} \right. F20​(x)=⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧​​0203​207​43​109​1​x<3838≤x<4848≤x<5858≤x<6868≤x<78x≥78​

3:

#顺序排列
import numpy as np
import pandas as pd
t2=[909,1086,1120,999,1320,1091,1071,1081,1130,1336,967,1572,825,914,992,1232,950,775,1203,1025,1096,808,1224,1044,871,1164,971,950,866,738]
t2=np.sort(t2)#排序
print(t2.shape,t2,(np.max(t2)-np.min(t2))/6)
(30,) [ 738  775  808  825  866  871  909  914  950  950  967  971  992  9991025 1044 1071 1081 1086 1091 1096 1120 1130 1164 1203 1224 1232 13201336 1572] 139.0
#频率分布表
#取间隔为140
t22=pd.cut(t2,6, labels=[u"(737,877]",u"(877,1017]",u"(1017,1157]",u"(1157,1297]",u"(1297,1437]",u"(1437,1577]"])
t22=t22.value_counts()
t22=pd.DataFrame(t22)
t22['分组区间'] = t22.index
t22.columns = ['频数','分组区间']
t22.reset_index(drop=True, inplace=True)
t22['组中值'] =[807,947,1087,1227,1367,1507]
t22['频率']=t22['频数']/30
##计算累计频率
ljpl=[0]
for i in t22['频率']:ljpl.append(i+ljpl[-1])
t22['累计频率']=ljpl[1:]
t22=t22[['分组区间','组中值','频数','频率','累计频率']]
t22
分组区间 组中值 频数 频率 累计频率
0 (737,877] 807 6 0.200000 0.200000
1 (877,1017] 947 8 0.266667 0.466667
2 (1017,1157] 1087 9 0.300000 0.766667
3 (1157,1297] 1227 4 0.133333 0.900000
4 (1297,1437] 1367 2 0.066667 0.966667
5 (1437,1577] 1507 1 0.033333 1.000000
#画直方图
import matplotlib.pyplot as plt
plt.rcParams['font.family'] = 'sans-serif'
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = Falseplt.hist(t2, bins=6)
plt.title('第三题直方图')
Text(0.5, 1.0, '第三题直方图')

5:

t5=[5954,5022,14667,6582,6870,1840,2662,4508,1208,3852,618,3008,1268,1978,7963,2048,3077,993,353,14263,1714,11127,6926,2047,714,5923,6006,14267,1697,13867,4001,2280,1223,12579,13588,7315,4538,13304,1615,8612]
t5=np.sort(t5)
print(t5.shape,t5)
(40,) [  353   618   714   993  1208  1223  1268  1615  1697  1714  1840  19782047  2048  2280  2662  3008  3077  3852  4001  4508  4538  5022  59235954  6006  6582  6870  6926  7315  7963  8612 11127 12579 13304 1358813867 14263 14267 14667]
(14667-353)/1700
8.42
ran=[]
for i in range(10):ran.append(352+i*1700)lable=[]
for i in range(9):lable.append('('+str(ran[i])+','+str(ran[i+1])+']')
lable
['(352,2052]','(2052,3752]','(3752,5452]','(5452,7152]','(7152,8852]','(8852,10552]','(10552,12252]','(12252,13952]','(13952,15652]']
t55=pd.cut(t5,ran, labels=lable)
t55=t55.value_counts()
t55=pd.DataFrame(t55)
t55['分组区间'] = t55.index
t55.columns = ['频数','分组区间']
t55.reset_index(drop=True, inplace=True)
#组中值
zzz=[]
for i in range(9):zzz.append(ran[i]+1700/2)
t55['组中值'] =zzz
t55['频率']=t55['频数']/40
##计算累计频率
ljpl=[0]
for i in t55['频率']:ljpl.append(i+ljpl[-1])
t55['累计频率']=ljpl[1:]
t55=t55[['分组区间','组中值','频数','频率','累计频率']]
t55
分组区间 组中值 频数 频率 累计频率
0 (352,2052] 1202.0 14 0.350 0.350
1 (2052,3752] 2902.0 4 0.100 0.450
2 (3752,5452] 4602.0 5 0.125 0.575
3 (5452,7152] 6302.0 6 0.150 0.725
4 (7152,8852] 8002.0 3 0.075 0.800
5 (8852,10552] 9702.0 0 0.000 0.800
6 (10552,12252] 11402.0 1 0.025 0.825
7 (12252,13952] 13102.0 4 0.100 0.925
8 (13952,15652] 14802.0 3 0.075 1.000
plt.hist(t5, bins=ran)
plt.title('第五题直方图')
Text(0.5, 1.0, '第五题直方图')

5.3





3:

yˉ=3xˉ−4\bar{y}=3\bar{x}-4yˉ​=3xˉ−4

sy2=1n−1∑i(yi−yˉ)2=1n−1∑i(3xi−4−(3xˉ−4))2=1n−1∑i9(xi−xˉ)2=9sx2s_y^2=\frac{1}{n-1}\sum_{i}(y_i-\bar{y})^2=\frac{1}{n-1}\sum_{i}(3x_i-4-(3\bar{x}-4))^2=\frac{1}{n-1}\sum_{i}9(x_i-\bar{x})^2=9s_x^2sy2​=n−11​∑i​(yi​−yˉ​)2=n−11​∑i​(3xi​−4−(3xˉ−4))2=n−11​∑i​9(xi​−xˉ)2=9sx2​

4:

pf:
(n+1)xn+1ˉ−(n+1)xnˉ=xn+1−xnˉ(n+1)\bar{x_{n+1}}-(n+1)\bar{x_n}=x_{n+1}-\bar{x_n}(n+1)xn+1​ˉ​−(n+1)xn​ˉ​=xn+1​−xn​ˉ​
左右同时除以n+1即得所证

pf:
$ns_{n+1}2-(n-1)s_{n}2=\sum_{i=1}{n+1}(x_i-\bar{x}_{n+1})2-\sum_{i=1}{n}(x_i-\bar{x}_n)2
=x_{n+1}2-2(\sum_{i=1}{n+1}x_i \bar{x}{n+1}-\sum{i=1}^{n}x_i \bar{x}{n})+((n+1)\bar{x}{n+1}2-n\bar{x}_n2)=x_{n+1}2-2[x_{n+1}\bar{x}_{n+1}-\sum_{i=1}{n}x_i(\bar{x}{n+1}-\bar{x}{n})]+((n+1)\bar{x}{n+1}2-n\bar{x}_n2)=x{n+1}2-2[x_{n+1}\bar{x}_{n+1}-\frac{n}{n+1}(x_{n+1}-\bar{x}_n)\bar{x}_n]+((n+1)\bar{x}_{n+1}2-n\bar{x}_n^2)
$
把xˉn+1\bar{x}_{n+1}xˉn+1​带入上一条证明中的xˉn+1n+1(xn+1−xˉn)\bar{x}_n+\frac{1}{n+1}(x_{n+1}-\bar{x}_n)xˉn​+n+11​(xn+1​−xˉn​)
可得nsn+12−(n−1)sn2=nn+1(xn+1−xˉn)2n s_{n+1}^2-(n-1)s_{n}^2=\frac{n}{n+1}(x_{n+1}-\bar{x}_{n})^2nsn+12​−(n−1)sn2​=n+1n​(xn+1​−xˉn​)2
两边同时除以n即为所求

remark:这道题说明随着抽样样本的增加可逐次计算样本 均值与方差

5:

pf:
xˉ=1m+n∑im+nxi=∑j=1mxj2+∑i=1nxi1m+n=nxˉ1+mxˉ2m+n\bar{x}=\frac{1}{m+n}\sum_{i}^{m+n}x_{i}=\frac{\sum_{j=1}^{m}x_{j}^{2}+\sum_{i=1}^{n}x_{i}^{1}}{m+n}=\frac{n\bar{x}_1+m\bar{x}_2}{m+n}xˉ=m+n1​∑im+n​xi​=m+n∑j=1m​xj2​+∑i=1n​xi1​​=m+nnxˉ1​+mxˉ2​​

其中
xj1x_{j}^1xj1​表示容量为n的样本中的样本的取值
xi2x_{i}^2xi2​表示容量为m的样本中的样本的取值

pf:

s2=∑i=1n(xi1−xˉ)2+∑i=1m(xi2−xˉ)2m+n−1s^2=\frac{\sum_{i=1}^{n}(x_{i}^1-\bar{x} )^2+\sum_{i=1}^{m}(x_i^2-\bar{x})^2}{m+n-1}s2=m+n−1∑i=1n​(xi1​−xˉ)2+∑i=1m​(xi2​−xˉ)2​

=∑i=1n(xi1−nxˉ1+mxˉ2m+n)2+∑i=1m(xi2−nxˉ1+mxˉ2m+nm+n−1=\frac{\sum_{i=1}^{n}(x_{i}^1-\frac{n\bar{x}_1+m\bar{x}_2}{m+n} )^2+\sum_{i=1}^{m}(x_i^2-\frac{n\bar{x}_1+m\bar{x}_2}{m+n}}{m+n-1}=m+n−1∑i=1n​(xi1​−m+nnxˉ1​+mxˉ2​​)2+∑i=1m​(xi2​−m+nnxˉ1​+mxˉ2​​​

=∑i=1n(xi1−xˉ1+m(xˉ1−xˉ2)2m+n)2m+n−1+∑i=1m(xi2−xˉ2+n(xˉ1−xˉ2)2m+n)2m+n−1=\frac{\sum_{i=1}^n(x_i^1-\bar{x}_1+\frac{m(\bar{x}_1-\bar{x}_2)^2}{m+n})^2}{m+n-1}+\frac{\sum_{i=1}^m(x_i^2-\bar{x}_2+\frac{n(\bar{x}_1-\bar{x}_2)^2}{m+n})^2}{m+n-1}=m+n−1∑i=1n​(xi1​−xˉ1​+m+nm(xˉ1​−xˉ2​)2​)2​+m+n−1∑i=1m​(xi2​−xˉ2​+m+nn(xˉ1​−xˉ2​)2​)2​

=(n−1)s12+(m−1)s22+mn(xˉ1−xˉ2)2m+nm+n−1=\frac{(n-1)s_1^2+(m-1)s_2^2+\frac{mn(\bar{x}_1-\bar{x}_2)^2}{m+n}}{m+n-1}=m+n−1(n−1)s12​+(m−1)s22​+m+nmn(xˉ1​−xˉ2​)2​​

由上式记得所求。

8:

E(xˉ)=E(∑i=1nxnn)=0E(\bar{x})=E(\frac{\sum_{i=1}^n x_n}{n})=0E(xˉ)=E(n∑i=1n​xn​​)=0

Var(xˉ)=1n2∑i=1nVar(xi)=1nVar(xi)Var(\bar{x})=\frac{1}{n^2}\sum_{i=1}^{n} Var(x_i)=\frac{1}{n}Var(x_i)Var(xˉ)=n21​∑i=1n​Var(xi​)=n1​Var(xi​)

Var(xi)=E(xi2)=12∫−11x2dx=13Var(x_i)=E(x_i^2)=\frac{1}{2}\int_{-1}{1}x^2 dx=\frac{1}{3}Var(xi​)=E(xi2​)=21​∫−1​1x2dx=31​

Var(xˉ)=13nVar(\bar{x})=\frac{1}{3n}Var(xˉ)=3n1​

10:

∑i<j(xi−xj)2=12∑i=1n∑j=1n((xi−xˉ)+(xˉ−xj))2=12∑i=1n∑j=1n(xi−xˉ)2+(xj−xˉ)2−2(xixj+xˉ2)=12∑i=1n∑j=1n[(xi−xˉ)2+(xj−xˉ)2]=n(n−1)s2\sum_{i<j}(x_i-x_j)^2=\frac{1}{2}\sum_{i=1}^{n}\sum_{j=1}^{n}((x_i-\bar{x})+(\bar{x}-x_j))^2=\frac{1}{2}\sum_{i=1}^{n}\sum_{j=1}^{n}(x_i-\bar{x})^2+(x_j-\bar{x})^2-2(x_ix_j+\bar{x}^2)=\frac{1}{2}\sum_{i=1}^{n}\sum_{j=1}^{n}[(x_i-\bar{x})^2+(x_j-\bar{x})^2]=n(n-1)s^2∑i<j​(xi​−xj​)2=21​∑i=1n​∑j=1n​((xi​−xˉ)+(xˉ−xj​))2=21​∑i=1n​∑j=1n​(xi​−xˉ)2+(xj​−xˉ)2−2(xi​xj​+xˉ2)=21​∑i=1n​∑j=1n​[(xi​−xˉ)2+(xj​−xˉ)2]=n(n−1)s2

13:

由正态分布的再生性
xˉ1∼N(μ,σ2n),xˉ2∼N(μ,σ2n)\bar{x}_1\sim N(\mu,\frac{\sigma^2}{n}),\bar{x}_2\sim N(\mu,\frac{\sigma^2}{n})xˉ1​∼N(μ,nσ2​),xˉ2​∼N(μ,nσ2​)
μˉ=xˉ1−xˉ2,μˉ∼N(0,2σ2n)\bar{\mu}=\bar{x}_1-\bar{x}_2,\quad \bar{\mu}\sim N(0,\frac{2\sigma^2}{n})μˉ​=xˉ1​−xˉ2​,μˉ​∼N(0,n2σ2​)
记ϕ\phiϕ为标准正态分布的分布函数
解P(∣μˉ>σ∣)≤0.01→2ϕ(σσ2n)−1P(|\bar{\mu}>\sigma|)\leq 0.01\rightarrow 2\phi(\frac{\sigma}{\sigma \sqrt{\frac{2}{n}}})-1P(∣μˉ​>σ∣)≤0.01→2ϕ(σn2​​σ​)−1得n≥14n\geq 14n≥14

24:

P(x(16)>10)=1−P(x(16)≤10)=1−P(x≤10)16=0.937P(x_{(16)}>10)=1-P(x_{(16)}\leq 10)=1-P(x\leq 10)^16=0.937P(x(16)​>10)=1−P(x(16)​≤10)=1−P(x≤10)16=0.937
P(x(1)>5)=[1−P(x≤5)]16=0.331P(x_{(1)>5})=[1-P(x\leq 5)]^{16}=0.331P(x(1)>5​)=[1−P(x≤5)]16=0.331

28:

(1)

pf:
η∈[0,1]\eta\in [0,1]η∈[0,1]
P(ηi=t)=i(ni)P(η=t)P(η<t)i−1(1−P(η<t))n−iP(\eta_{i}=t)=i\binom{n}{i}P(\eta=t)P(\eta<t)^{i-1}(1-P(\eta<t))^{n-i}P(ηi​=t)=i(in​)P(η=t)P(η<t)i−1(1−P(η<t))n−i
由P(η<t)=P(F(x)<t)=P(x<F−1(t))=F⋅F−1(t)=t→F(x)连续,对t求导P(η=t)=1P(\eta<t)=P(F(x)<t)=P(x<F^{-1}(t))=F\cdot F^{-1}(t)=t \overset{\text{F(x)连续,对t求导}}\rightarrow P(\eta=t)=1P(η<t)=P(F(x)<t)=P(x<F−1(t))=F⋅F−1(t)=t→F(x)连续,对t求导P(η=t)=1
从而P(ηi=t)=i(ni)ti−1(1−t)n−iP(\eta_{i}=t)=i\binom{n}{i} t^{i-1}(1-t)^{n-i}P(ηi​=t)=i(in​)ti−1(1−t)n−i
上述概率密度函数也是n个i.i.d.且服从U[0,1]U[0,1]U[0,1]的随机变量的次序统计量的概率密度函数。

(2)

B(m,n)=∫01xm−1(1−x)n−1dx=Γ(m)Γ(n)Γ(m+n)B(m,n)=\int_{0}^1 x^{m-1}(1-x)^{n-1}dx=\frac{\Gamma (m)\Gamma (n)}{\Gamma (m+n)}B(m,n)=∫01​xm−1(1−x)n−1dx=Γ(m+n)Γ(m)Γ(n)​

E(ηi)=n(n−1i−1)∫01ti(1−t)n−i=in!i!(n−i)!(i)!(n−i)!(n+1)!=in+1E(\eta_i)=n\binom{n-1}{i-1} \int_0^1 t^i(1-t)^{n-i}=i \frac{n!}{i!(n-i)!}\frac{(i)!(n-i)!}{(n+1)!}=\frac{i}{n+1}E(ηi​)=n(i−1n−1​)∫01​ti(1−t)n−i=ii!(n−i)!n!​(n+1)!(i)!(n−i)!​=n+1i​
Var(ηi)=in!i!(n−i)!int01ti−1(1−t)n−i(t−in+1)2dt=in!i!(n−i)![(i+1)!(n−i)!(n+2)!−2in+1i!(n−1)!(n+1)!+i2(n+1)2(i−1)!(n−i)!n!]=i(n−i+1)(n+1)2(n+2)Var(\eta_i)=i\frac{n!}{i!(n-i)!}int_{0}^1 t^{i-1}(1-t)^{n-i}(t-\frac{i}{n+1})^2 dt=i\frac{n!}{i!(n-i)!}[\frac{(i+1)!(n-i)!}{(n+2)!}-\frac{2i}{n+1}\frac{i!(n-1)!}{(n+1)!}+\frac{i^2}{(n+1)^2}\frac{(i-1)!(n-i)!}{n!}]=\frac{i(n-i+1)}{(n+1)^2(n+2)}Var(ηi​)=ii!(n−i)!n!​int01​ti−1(1−t)n−i(t−n+1i​)2dt=ii!(n−i)!n!​[(n+2)!(i+1)!(n−i)!​−n+12i​(n+1)!i!(n−1)!​+(n+1)2i2​n!(i−1)!(n−i)!​]=(n+1)2(n+2)i(n−i+1)​

(3)

协方差矩阵A,其中A(1,1)=Var(ηi),A(2,2)=Var(ηj)A(1,1)=Var(\eta_i),A(2,2)=Var(\eta_j)A(1,1)=Var(ηi​),A(2,2)=Var(ηj​),从而只证明A(1,2)=A(2,1)=cov(η1,η2)A(1,2)=A(2,1)=cov(\eta_1,\eta_2)A(1,2)=A(2,1)=cov(η1​,η2​)
先求η1,η2\eta_1,\eta_2η1​,η2​的联合分布密度函数:
不妨设i≤ji\leq ji≤j,则P(ηi=t1,ηj=t2)=(ni−1,j−i−1,n−j)t1i−1(t2−t1)j−i−1t2jP(\eta_i=t_1,\eta_j=t_2)=\binom{n}{i-1,j-i-1,n-j}t_1^{i-1}(t_2-t_1)^{j-i-1}t_2^{j}P(ηi​=t1​,ηj​=t2​)=(i−1,j−i−1,n−jn​)t1i−1​(t2​−t1​)j−i−1t2j​

cov(η1,η2)cov(\eta_1,\eta_2)cov(η1​,η2​)

=E(ηiηj)−E(ηi)E(ηj)=E(\eta_i\eta_j)-E(\eta_i)E(\eta_j)=E(ηi​ηj​)−E(ηi​)E(ηj​)

=E(ηi)−E(ηi(1−ηj))−E(ηi)E(ηj)=E(\eta_i)-E(\eta_i(1-\eta_j))-E(\eta_i)E(\eta_j)=E(ηi​)−E(ηi​(1−ηj​))−E(ηi​)E(ηj​)

=in+1−∫01∫01t1(1−t2)⋅2(ni−1,j−i−1,n−j)t1i−1(t2−t1)j−i−1(1−t2)n−jdt1dt2−in+1jn+1=\frac{i}{n+1}-\int_{0}^{1}\int_0^1 t_1(1-t_2) \cdot 2\binom{n}{i-1,j-i-1,n-j} t_1^{i-1}(t_2-t_1)^{j-i-1}(1-t_2)^{n-j} dt_1 dt_2-\frac{i}{n+1}\frac{j}{n+1}=n+1i​−∫01​∫01​t1​(1−t2​)⋅2(i−1,j−i−1,n−jn​)t1i−1​(t2​−t1​)j−i−1(1−t2​)n−jdt1​dt2​−n+1i​n+1j​

=i(n+1−j)(n+2)(n+1)2=\frac{i(n+1-j)}{(n+2)(n+1)^2}=(n+2)(n+1)2i(n+1−j)​

=a1(1−a2)n+2=\frac{a_1(1-a_2)}{n+2}=n+2a1​(1−a2​)​

对于上述积分:
I=∫01∫01(n+2i,j−i−1,n−j+1)2t1i(t2−t1)j−i−1(1−t2)n−j+1=1E(η1η2)=i(n−j+1)(n+2)(n+1)II=\int_{0}^1\int_0^1 \binom{n+2}{i,j-i-1,n-j+1}2 t_1^{i}(t_2-t_1)^{j-i-1}(1-t_{2})^{n-j+1}=1\\ E(\eta_1\eta_2)=\frac{i(n-j+1)}{(n+2)(n+1)}I I=∫01​∫01​(i,j−i−1,n−j+1n+2​)2t1i​(t2​−t1​)j−i−1(1−t2​)n−j+1=1E(η1​η2​)=(n+2)(n+1)i(n−j+1)​I
关于III的积分:把积分对应到某种概率分布,利用概率密度函数的正则性计算积分。

频率分布表画图函数(按照分割区间大小/按照分组

(1)按照分组数

import numpy as np
import pandas as pddef fredistable_zushu(t,n):#t是数组,n是组数t=np.sort(t)mi=np.min(t)ma=np.max(t)ran=[]#不需要分割区间为整数时:cut=(ma-mi)/ncut=int((ma-mi)/n)+1for i in range(n+1):ran.append(mi-1+i*cut)#ran.append(mi+i*cut)直接从最小值开始lable=[]for i in range(n):lable.append('('+str(ran[i])+','+str(ran[i+1])+']')t1=pd.cut(t,ran, labels=lable)t1=t1.value_counts()t1=pd.DataFrame(t1)t1['分组区间'] = t1.indext1.columns = ['频数','分组区间']t1.reset_index(drop=True, inplace=True)  #组中值zzz=[]for i in range(n):zzz.append(ran[i]+float(cut)/2)t1['组中值'] =zzzt1['频率']=t1['频数']/np.shape(t)[0]##计算累计频率ljpl=[0]for i in t1['频率']:ljpl.append(i+ljpl[-1])t1['累计频率']=ljpl[1:]t1=t1[['分组区间','组中值','频数','频率','累计频率']]return(t1)t5=[5954,5022,14667,6582,6870,1840,2662,4508,1208,3852,618,3008,1268,1978,7963,2048,3077,993,353,14263,1714,11127,6926,2047,714,5923,6006,14267,1697,13867,4001,2280,1223,12579,13588,7315,4538,13304,1615,8612];
fredistable_zushu(t5,9)
分组区间 组中值 频数 频率 累计频率
0 (352,1943] 1147.5 11 0.275 0.275
1 (1943,3534] 2738.5 7 0.175 0.450
2 (3534,5125] 4329.5 5 0.125 0.575
3 (5125,6716] 5920.5 4 0.100 0.675
4 (6716,8307] 7511.5 4 0.100 0.775
5 (8307,9898] 9102.5 1 0.025 0.800
6 (9898,11489] 10693.5 1 0.025 0.825
7 (11489,13080] 12284.5 1 0.025 0.850
8 (13080,14671] 13875.5 6 0.150 1.000

(2)按照分割区间大小

def fredistable_fenge(t,cut):#t是数组,cut是分割间隔t=np.sort(t)mi=np.min(t)ma=np.max(t)ran=[]n=int((ma-mi)/cut)+1for i in range(n+1):ran.append(mi-1+i*cut)#ran.append(mi+i*cut)直接从最小值开始lable=[]for i in range(n):lable.append('('+str(ran[i])+','+str(ran[i+1])+']')t1=pd.cut(t,ran, labels=lable)t1=t1.value_counts()t1=pd.DataFrame(t1)t1['分组区间'] = t1.indext1.columns = ['频数','分组区间']t1.reset_index(drop=True, inplace=True)  #组中值zzz=[]for i in range(n):zzz.append(ran[i]+float(cut)/2)t1['组中值'] =zzzt1['频率']=t1['频数']/np.shape(t)[0]##计算累计频率ljpl=[0]for i in t1['频率']:ljpl.append(i+ljpl[-1])t1['累计频率']=ljpl[1:]t1=t1[['分组区间','组中值','频数','频率','累计频率']]return(t1)fredistable_fenge(t5,1700)
分组区间 组中值 频数 频率 累计频率
0 (352,2052] 1202.0 14 0.350 0.350
1 (2052,3752] 2902.0 4 0.100 0.450
2 (3752,5452] 4602.0 5 0.125 0.575
3 (5452,7152] 6302.0 6 0.150 0.725
4 (7152,8852] 8002.0 3 0.075 0.800
5 (8852,10552] 9702.0 0 0.000 0.800
6 (10552,12252] 11402.0 1 0.025 0.825
7 (12252,13952] 13102.0 4 0.100 0.925
8 (13952,15652] 14802.0 3 0.075 1.000

《概率论与数理统计》作业一,python画频率分布表相关推荐

  1. 【渝粤题库】陕西师范大学200741概率论与数理统计作业(高起本、专升本)

    <概率论与数理统计>作业 一.填空题 1.设有两门高射炮,每一门击中飞机的概率都是0.6,则同时发射一发炮弹而击中飞机的概率为 .若有一架敌机入侵领空,欲以99%以上的概率及中它,至少需 ...

  2. python 画频率分布直方图求平均数_Python绘制频率分布直方图

    Python绘制频率分布直方图 项目中在前期经常要看下数据的分布情况,这对于探究数据规律非常有用.概率分布表示样本数据的模样,长的好不好看如果有图像展示出来就非常完美了,使用Python绘制频率分布直 ...

  3. 【渝粤题库】陕西师范大学200251概率论与数理统计 作业(高起专、高起本)

    <概率与数理统计>作业 一.填空题 设ξ具有概率密度,又,则a=___,b=___. 2.一批产品的废品率为0.2, 每次抽取1个, 观察后放回去, 下次再任取1个, 共取3次, 则3次中 ...

  4. 概率论与数理统计 作业题目及答案

    Day1 2.27 Day2 2.28

  5. python 画频率分布直方图_[python常用图件绘制#03]Gamma分布拟合图

    〇.Gamma分布主要参数说明 对于一组连续的随机变量x来说,若它的概率密度分布函数f(x|α,β)符合下式时: 0-1 则将这个概率密度函数称为伽码(Г,Gamma)分布,记作 X ~Г(α,β), ...

  6. 概率论由相关性求数学期望和方差的公式_《概率论与数理统计》(公共课—计算机科学与技术本科专业)教学大纲(2017.2编)资料...

    <概率论与数理统计>课程教学大纲 (2016版) 一.课程基本信息 课程名称:概率论与数理统计 英文名称:Probability Theory and Mathematical Stati ...

  7. python在概率论与数理统计中的作用

    概率论与数理统计 一.描述性统计和统计图 1.用Pandas来计算统计量 使用 pandas的describe方法计算相关统计量,并计算身高和体重的偏度,峰度,样本的25%,50%,90%分位数 数据 ...

  8. 北航数理统计大作业_如何自学概率论与数理统计/微积分/线性代数等科目

    现在的学习环境较之前题主本科学习那会真的要好太多了 当年本科如果你有不懂的问题,又害羞不敢问老师同学,那就等挂或者进行肮脏的py交易吧,但是现在不同,即使你暂时弄不懂它,没关系,题主来教你如何自学 遥 ...

  9. python实践数学基础——线性代数,概率论与数理统计,基本库的使用(jupyter notebook)

    <数据科学基础实践> 这是一个jupyter里python实践各种数学基础的目录,文中链接直通jupyter形式展示的代码文章,仅作为学习记录.(未完待续,内容持续更新中) 一.线性代数 ...

  10. python实现概率论与数理统计_《统计思维:程序员数学之概率统计》读书笔记

    更多 1.书籍信息 书名:Think Stats: Probability and Statistics for Programmers 译名:<统计思维:程序员数学之概率统计> 作者:A ...

最新文章

  1. 机器学习-贝叶斯分类器
  2. Mysql压测工具mysqlslap 讲解
  3. 一年的第几周怎么算_部编版一年级下册第7课《怎么都快乐》图文讲解+知识点梳理...
  4. 网卡的7种bond模式
  5. Java 洛谷 P1035 级数求和
  6. GUI可视化利器,让实时数据可视化so easy
  7. DllImport的用法
  8. cad快捷键文件路径_办公格式转太难不会看这里!CAD、PDF、Word、Excel、TXT教你玩转...
  9. python 自定义函数导入_python如何导入自编函数模块
  10. 小学计算机课教学工作总结,小学六年级信息技术教学工作总结
  11. [转]Linux芯片级移植与底层驱动(基于3.7.4内核)
  12. Linux安装PHPwind
  13. 各种文件后缀名与打开方式
  14. 【历史上的今天】9 月 21 日:世界上第一部商用移动电话;苹果发布 iPhone 5 ;Mini-SATA 研制成功
  15. HDCP-新家庭影院网络场景的数字内容保护
  16. “新产业50人论坛”之清华龙桂鲁教授:量子信息与创新发展
  17. 人机大战三周年:围棋界发生了哪些巨变?
  18. 你所不知道的Win键
  19. 2022年度软考考试时间表已公布
  20. 弹幕的开发(DanmakuFlameMaster)

热门文章

  1. 计算机功能键名称,电脑键盘功能基础知识有哪些你知道吗
  2. oracle 00936 pivot,oracle 11g 使用 pivot/unpivot 行列转换
  3. java swap_Java中swap()方法的实现
  4. 买的鱼丸怎么做好吃 鱼丸的家常做法介绍
  5. 软件测试工程师的职业技能分析
  6. 激活后服务器无限重启,服务器无限重启
  7. 避坑指南——海外服务器租用的这些坑,你踩过吗?
  8. 蔡高厅高等数学28-高阶导数
  9. 《outliers》/《异类》读后有所思
  10. CSS3炫酷的发光文字 可自定义文字色彩