机器学习中的统计学基础知识
- 负偏斜分布
人类存活年龄分布
- 均匀分布
没有众数,天气预报
- 多峰分布
有多个众数,该例子为前半部分为女士鞋号,后半部分为男士鞋号
- 众数指的是x轴,y轴代表具体的频率
- 众数不受总体数据影响,而平均值又会因为总体影响过大导致被平均,所以就发明了中位数
- 中位数在处理偏斜分布时通常能很好的反映出趋势
对于上图的正偏斜分布来说,众数<中位数<均值
对于上图的正态分布来说,众数=中位数=均值
统计学家在做统计的时候,通常会砍掉已经排序好的前25%的值,和后25%的值
Q1是第一个四分位数,Q3是第三个四分位数,IQR=Q3−Q1IQR=Q3-Q1得到的值域通常就是统计学家要用的部分数据
统计学中计算是否为异常值的公式为
Outlier<Q1−1.5∗IQR∥Outlier<Q3+1.5∗IQROutlier
- 箱线图
注意:上图中最下面的点表示异常值
- IQR也存在一定问题,对于不同的分布IQR可能相同,所以IQR不能考虑分布特性
- 方差和标准差的图像解释
- 贝塞尔校正
当做数据抽样的时候,抽出来的数据量由于小于总体数据量,所以他的方差和标准差总是小于总体数据量的方差和标准差,于是做了贝塞尔校正,将原来的标准差公式 S=Σ(xi−x¯)2n−−−−−−−√ S=\sqrt{\frac{\Sigma(x_{i}-\overline{x})^2}{n}} 变成S=Σ(xi−x¯)2n−1−−−−−−−√ S=\sqrt{\frac{\Sigma(x_{i}-\overline{x})^2}{n-1}} ,也就是样本标准差,主要目的是用来估算总体标准差的
机器学习中的统计学基础知识相关推荐
- 机器学习中的统计学基础
一.什么是统计学 是一门收集.整理和分析统计数据的方法科学 其目的是探索数据内在的数据规律性,以达到对客观事物的科学认识 统计学研究随机现象,以推断为特征,"由部分及全体"的思想贯 ...
- 机器学习中的基本数学知识
注:本文的代码是使用Python 3写的. 机器学习中的基本数学知识 线性代数(linear algebra) 第一公式 矩阵的操作 换位(transpose) 矩阵乘法 矩阵的各种乘积 内积 外积 ...
- 总结:机器学习中的基本数学知识
注:本文的代码是使用Python 3写的. 机器学习中的基本数学知识 线性代数(linear algebra) 第一公式 矩阵的操作 换位(transpose) 矩阵乘法 矩阵的各种乘积 内积 外积 ...
- 机器学习之推荐系统的基础知识
本文转载至博客园的小编周旭龙:初探机器学习之推荐系统的基础知识 一.推荐系统是神马 维基百科这样解释道:推荐系统属于资讯过滤的一种应用.推荐系统能够将可能受喜好的资讯或实物(例如:电影.电视节目.音乐 ...
- 机器学习入门一:基础知识
机器学习入门一:基础知识 前言 机器学习介绍 1.什么是机器学习? 2.机器学习中的常见困难 模型的泛化[^1] (Generalization)能力 3.机器学习中数据集划分 4.机器学习中几种学习 ...
- 百面机器学习—4.SVM模型基础知识
文章目录 引言 一.间隔与支持向量 1.什么是线性可分? 2.什么是超平面?什么是最大间隔超平面? 3.什么是支撑向量? 4.SVM最优化问题 二.对偶问题 1.约束条件下的目标函数如何求解最优化问题 ...
- 中职计算机基础课堂传统教学,中职计算机基础知识教学创新
刘静月 [摘要]信息化是当今世界经济和社会发展的趋势,以计算机技术为代表的信息技术已经成为拓展人类能力不可缺少的工具,具有越来越重要的地位.中等职业学校在培养未来的高素质劳动者和技能型人才时,使学生掌 ...
- python编程的基本方法有哪些_Python编程中常用的基础知识有哪些?
今天小编要跟大家分享的文章是关于Python编程中常用的基础知识有哪些?正在从事Python相关工作的小伙伴们,来和小编一起看一看本篇文章,希望本篇文章能够对大家有所帮助. 1.正则表达式替换 目标: ...
- 中职计算机基础课教学策略研究,中职计算机基础知识教学方法及教学策略研究.doc...
中职计算机基础知识教学方法及教学策略研究 中职计算机基础知识教学方法及教学策略研究摘要:中职教育的培养目标是造就具有综合职业能力和全面素质的.直接工作在生产.技术.管理和服务第一线的应用型.技能型人才 ...
- day29—JavaScript中DOM的基础知识应用
转行学开发,代码100天--2018-04-14 JavaScript中DOM操作基础知识即对DOM元素进行增删改操作.主要表现与HTML元素的操作,以及对CSS样式的操作.其主要应用知识如下图: 通 ...
最新文章
- 人工智能学习实战之路
- C#验证Email是否真正存在,不是验证邮件格式,是邮件地址是否存在 .
- Spring MVC:使用基于Java的配置创建一个简单的Controller
- 《精通Python设计模式》学习之原型模式
- 10个给程序员的建议
- Socket 核心原理分享
- 云计算:大数据时代的系统工程
- php制作闹钟,简易闹钟 - 按键精灵资源站 按键精灵教程,学习脚本制作,脚本大全,视频教程...
- 基于Thinkphp开发的网页点餐收银系统SAAS模式
- 服务器设置静态IP地址教程,在Ubuntu服务器18.04上设置静态IP地址
- 简单测试IP地址连通性
- 如何清除PDF中的水印?PDF删除水印的方法
- vulnhub之 BLUEMOON: 2021
- 20221018-B站视频怎么自动添加字幕
- android平板开发板,基于ARM Cortex A9开发板平板电脑实战项目
- ubuntu给手机建wifi
- 音响设备对于卡拉OK系统运行
- 数据结构与算法day19-希尔排序算法
- 2819年三月份计算机,统计局:3月规模以上工业增加值增长7.6%
- 雪碧enjoy_雪碧牛