概率论与信息论基础

1、比较“频率论概率”和“贝叶斯概率”?

频率学派对概率的定义包含两个要点:
(1):事件A发生的概率是一个常数,也就是说频率学派认为事件发生的概率是一个确定的数,可以直接求出来。
(2):事件A发生的概率是通过重复多次进行同一实验得到的。当重复实验的次数趋于无穷,事件的频率趋于事件A发生的概率。

贝叶斯学派对概率的定义包括以下三个要点:
(1):事件A发生的概率是变化的,并非常数,也就是说事件发生的概率具有不确定性。
(2):事件A发生的概率是在特定条件下的条件概率。
(3):事件A发生的概率是一个后验概率,且事件发生的先验概率已知。

频率学派认为:概率及其模型(参数)是真实确定存在的,而事件本身是随机的;因此,可以通过最大似然估计参数的值。比如,在随机试验过程中,我们把某事件发生的比例或频率作为该事件发生的概率。
贝叶斯学派则持完全不同的观点,他们认为:真实出现的事件是一种确定性的存在,而模型及其参数反而是不确定的随机变量。在分析过程中,总是先假设一个先验的概率分布,随着样本的增加,不断的修正先验的概率分布。

2、什么是随机变量?

随机变量X是定义在样本空间的S上的实值单值函数。也就是说它是随机试验结果的函数。
它的取值随试验的结果而定,是不能预先确定的,它的取值具有一定的概率。
作用是:随机变量的引入,使概率论的研究由个别随机事件扩大为随机变量所表征的随机现象的研究。

3、什么是概率分布?

概率分布就是描述随机变量落在某个区间的概率,描述了随机变量的统计规律性。

4、概率质量函数和概率密度函数?

它们本质是相同的,只是表现的形式不同,
描述离散型数据的概率分布的叫概率质量函数;描述连续型数据叫做概率密度函数。
概率质量(mass)函数:各个分类的概率。
概率密度(density)函数:数据落在某一段连续的区间的概率。

然后为何一个叫做质量,一个叫做密度。主要是他们从英文翻译过来的。所以得从英文解释。
概率质量函数:
mass强调的是一个聚集在一起的物体,就是它一个块一块的。这和离散型数据很像,就是一堆数据属于某个类。他们是聚集一块一块的。所以用mass这个词来描述他们的概率。翻译成中文就变成了概率质量函数。你可以这么记忆:离散型数据是块状物体,物体是有质量,所以叫做概率质量函数。

概率密度函数(Probability Density Function)
这个是描述连续性数据。就是落在某个区间内的概率多大。这个就像液体,液体是连续的。同等体积有些液体重有些液体轻,用密度这个词描述会更合适。它的缩写很意思,叫做PDF,哈哈哈。

5、函数成为概率密度函数的条件

非负,积分和为1

6、条件概率的链式法则

根据条件概率的定义:p(A,B) = p(A|B)p(B)
推广到一般情况下就是条件概率的链式法则:
p(X1,X2,…,Xn) = p(X1|X2,…,Xn)*p(X2|X3,…,Xn)…p(Xn-1|Xn)p(Xn)

7、两个随机变量的独立性和条件独立性?

独立性:P(A,B) = P(A)P(B) 也就是说两个随机试验发生的结果相互没有干扰。
条件独立性:P(A,B|C) = P(A|C)P(B|C)

8、大数定律

极限定理是概率论的基本理论,大数定律和中心极限定理是其中最重要的两个定理。

大数定律;叙述的是随机变量序列的前一些项的算数平均值在某种条件下收敛到这些项的均值的算数平均值。

通俗的说,辛钦大数定律是说,独立同分布且具有均值u的随机变量X1,…,Xn,当n很大的时候,他们的算数平均有很大可能接近u。


伯努利大数定律表明,当独立重复实验的次数趋于无穷的时候,事件A发生的频率接近于事件A发生的概率。这也是频率具有稳定的真正含义,也是为什么实际应用过程中,当实验次数很大,便可以用事件的频率代替事件的概率的理由。

9、中心极限定理

中心极限定理叙述的是,在什么条件下,大量随机变量和的分布逼近于正态分布。
客观背景:在客观实际中许多随机变量,它们是由大量的相互独立的随机因素的综合影响所形成的,而其中每一个因素在总的影响中所起到的作用是微小的,这种随机变量往往近似服从正态分布。

这里规定,随机变量之间的独立同分布的,实际上,李雅普诺夫定理表明,不是同分布,无论随机变量服从什么分布,在某种条件下,他们和的分布也逼近于正态分布。

10、介绍假设检验?以及它的应用

假设检验和参数估计是统计推断中两类重要问题。假设检验是在总体的分布函数完全未知或者只知其形式,参数未知的情况下。为了推断总体的某些特征,根据经验或者样本的提出一些关于总体的假设,再根据样本对所提出假设做出接受或者是拒绝的决策过程。

其中蕴含了两个重要的思想,小概率事件原理和反证法。

应用:质量检测,产品检测等,一般情况下,就是我们需要对某个对象的总体的一些特征做出一些判断,而我们又无法得到总体全部的数据或者得到总体全部的数据代价很大的时候,那么我们就可以根据实际问题或者以往的经验对总体做出一些假设,在通过抽样得到总体的部分样本去检验我们的假设是否正确。

11、卡方检验

说到卡方检验,就必须先说说抽样分布的三大分布之一的卡方分布,

性质:

**卡方检验是在零假设近似成立时,检验统计量的分布服从卡方分布的假设检验。在在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。
卡方检验可以用来检验单个正态总体均值未知,方差是否等于某个值。

皮尔逊卡方检验
皮尔逊卡方检验经常用来根据样本数据推断总体分布与期望分布是否有显著差异,或推断分类变量间是否相互关联或彼此独立
变量独立性检验步骤,一般是通过列联表来求解。

12、皮尔逊相关系数和卡方检验的区别

皮尔逊相关系数:定义了两个随机变量的协方差与标准差的商

相关系数在0到1之间,相关系数越大,两者相关性越大
卡方检验是统计实际观察值和理论推断值之间的偏离程度,卡方值越大,两者的偏离程度越大。

13、t检验

零假设成立时,检验统计量服从t分布的假设检验。

t分布

t检验常用来检验正态总体方差未知,检验总体的均值。
在多元线性回归中t检验用来检验各个回归系数的显著性。

14、F检验

零假设成立时,检验统计量服从F分布的假设检验

F分布

两个正态总体均值未知,检验两者方差之间的关系,用到F检验。
在多元线性回归中,F检验通常用来检验整个回归关系的显著性

15、P值的含义?

p值就是在原假设可拒绝的最小显著性水平,当我们根据样本观察值计算出p值,如果它比我们预先设定的显著性水平小,那么说明观察值落入拒绝域内,若比显著性水平大,那么样本观察值落在拒绝域外,接受原假设。

说白了就是P值就是当原假设为真时,根据样本观察结果计算的检验统计量落入拒绝域的概率。如果P值很小,说明这种情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。

常见的概率论问题清单及其答案相关推荐

  1. 14个最常见的Kafka面试题及答案【转】

    原创 IT168企业级 2017-08-21 17:40 本文为您盘点了14个最常见的Kafka面试题,同时也是对Apache Kafka初学者必备知识点的一个整理与介绍. 1.请说明什么是Apach ...

  2. 常见的HTML5面试题(附答案)

    常见的HTML5面试题(附答案) 1.HTML5有哪些新特性?移除了哪些元素? HTML5的新特性如下: 1.拖放( Drag and drop)APIl 2.语义化更好的内容标签( header.n ...

  3. linux进程 面试题,Linux面试题,浅析常见Linux命令面试题及答案

    原标题:Linux面试题,浅析常见Linux命令面试题及答案 对于Linux面试来说如果面试官问到你不会的问题,你就说这个不太熟悉,没有具体研究过,千万别不懂装懂,还扯一堆没用的话题来掩饰,这样只会让 ...

  4. 常见php面试题,常见的 PHP 面试题和答案分享

    搜索热词 如何直接将输出显示给浏览器? 将输出直接显示给浏览器,我们必须使用特殊标记 . PHP 是否支持多重继承? PHP 只支持单继承.PHP 的类使用关键字 extends 继承另一个类 获取图 ...

  5. 重庆理工大学计算机学院学概率论,重庆理工大学概率论与数理统计习题册答案...

    重庆理工大学概率论与数理统计习题册答案 习题一一.填空题1. 2. 3. 4. ABC50260二.单项选择题1.B 2.C 3.C 4.A 5.B三.计算题1. (1)略(2)A. B.321 ...

  6. 分段概率密度矩估计_南昌大学概率论与数理统计练习答案.doc

    您所在位置:网站首页 > 海量文档 &nbsp>&nbsp研究生考试&nbsp>&nbsp考研数学 南昌大学概率论与数理统计练习答案.doc19页 本 ...

  7. [javaee基础] 常见的javaweb笔试选择题含答案

    常见的javaweb笔试选择题含答案 常见的javaweb笔试选择题含答案 1.以下HTTP相应状态码的含义描述正确的是() A. 200ok表示请求成功 B. 400不良请求表示服务器未发现与请求U ...

  8. leetcode常见经典算法面试题及答案汇总

    精心整理了leetcode常见经典算法面试题及答案,实现语言为python和c++,整理在这里主要是为了面试前复习使用,希望对您有所帮助,题目比较多建议您先收藏 题目:1.求缺失的第一个正数;2. 字 ...

  9. 概率论常见面试问题总结,含答案

    0. 写在前面 总导航在此 这些问题是我备考概率论过程中,详细总结的常见面试问题和答案.逐个搜索并记录下来,花了很大的精力! 目录 0. 写在前面 1. 变量和随机变量的区别? 2. 随机变量和概率分 ...

  10. 常见Jvm面试题总结及答案整理 120道(持续更新)

    最新Jvm面试题总结及答案[附答案解析]Jvm面试题及答案2021,Jvm面试题最新面试题,Jvm面试题新答案已经全部更新完了,有些答案是自己总结的,也有些答案是在网上搜集整理的.这些答案难免会存在一 ...

最新文章

  1. 2017-2018-1 20155202 《信息安全系统设计基础》第9周学习总结
  2. php对连接加密后传,PHP 加密解密和解决URL传输问题
  3. 大数据在银行业的应用场景
  4. 深入制造 云计算大数据与智能制造论坛将于6月16日召开
  5. 【USACO】奶牛抗议 树状数组+dp
  6. ustc小道消息20211229
  7. 怎样查看电脑开机记录
  8. P3403 跳楼机 同余最短路
  9. 数据库基础知识——DQL语言(一)
  10. ACM-ICPC知识要点收集
  11. Linux driver 板级文件跟踪一般方法
  12. 简析struct in_addr ,struct sockadd
  13. 《CSDN实训》工时统计(未完)
  14. Android长截屏(滚动截屏)实现原理
  15. 读书百客:《渔家傲·天接云涛连晓雾》评赏
  16. 从消费价值角度破解小红书爆文密码
  17. 极简微前端框架-京东MicroApp开源了
  18. 培训班和科班出来的程序员有什么不同之处?
  19. Pycharm—— 6 函数 和 7 公共运算符
  20. 电子计算机女生就业方向,计算机专业的女生就业方向有哪些

热门文章

  1. WPF 做的天干地支 乾坤八卦 罗盘
  2. 基于RFID的图书馆管理
  3. 容量管理体系建设实践
  4. 什么是蒙特卡罗仿真?
  5. python词云图输出(附代码)
  6. 墙裂推荐9个在线图片压缩网站
  7. 主管都在用项目管理Excel表格模板管理项目
  8. 计算机信息管理发展的重要性,建设计算机信息管理系统的意义和目标
  9. MATLAB数值计算——矩阵运算乘法、除法、乘方
  10. Python办公自动化——8行代码实现文件去重