决策论

决策论一般分为了两种类型:

  • 单目标决策,只考虑单个方面的影响,研究单个目标函数。(对接了《战略管理》 《决策管理)
  • 多目标决策,还是考虑多个方面的影响,研究多个目标函数 (目标规划 引入偏差或者优先级)

多目标决策

首先我们要把所有的目标函数都写出来
max{Z1=f1(x)...Zn=fn(x)max\left\{ \begin{array}{l} Z_1=f_1\left( x \right)\\ ...\\ Z_n=f_n\left( x \right)\\ \end{array} \right. max⎩⎨⎧​Z1​=f1​(x)...Zn​=fn​(x)​
x视具体情况而定,不一定是单一变量。关于解的讨论其实就是多目标进化优化里面的帕累托解,一般来说,假如是最大化,如果存在多个解在各个维度上都大于或等于大部分其他解,则这一些解就是帕累托解或者可行解

怎么对待非劣解和不能穷举的情况
  • 化多为少的方法,将多个目标转换为单个目标,例如其中目标变成一个约束或者加权求和
  • 分层序列法
  • 直接求非劣解
  • 多目标线性规划的解法
  • 层次分析法

以上的方法是经典方法,在现实生活中很难使用到,一般会使用matlab软件进行计算(数值比较),在使用机器的时候,做课题或者做科研的时候很重要的思想:蒙特卡洛思想(通过概率来研究问题)经典,不过时

与视频不同,我本人是学过一点点蒙特卡洛的思想的,而蒙特卡洛是一个赌城,所以你大概知道这是一个赌徒思想,总体来说它遵循概率里面的大数定律,就是样本越多的情况下它越有可能接近最优解。

优化在优化过程中一般都是:有最优解找最优解,没有找次优解,再没有找有效解,再没有就不求甚解(要改变模型了)…

运筹学框架:

单目标决策 --不确定的决策、风险决策

这个知识点本身不难,跟管理学等科目很相关,偏思想性

不确定决策(不知道不同情况具体发生的概率)

意思是我只知道我现在有多少东西,以及我的卖价和生产成本,但具体有没有顾客来买,这件事情我们是不清楚的,也就是亏不亏本也是不清楚的

这个时候我们首先将自己手上的数据进行一些处理,例如将穷举所有成本和可能卖出的数量进行建模成矩阵,我们将其分布成一个矩阵,可以叫做收益矩阵或者损失矩阵

这个时候我们就可以看成一个与自然的博弈过程,只不过这个过程,我们可以看到,这只不过是一个我们可以做出决策的一个过程

书本上有5个要求需要我们去思考:

  • 乐观主义 激进原则,放到数学里面,就是先找每行里面的最大值,然后选择其中最小值。

  • 悲观主义 悲观主义其实是一种保守的原则,在我损失最小情况我去找到一个最大值,在数学上来看,就是先取一个最小再取一个最大,分别对每行找一个最小的出来,,当然从我们上面来看,就是不生产。这是不合理的…

  • 折衷(中)主义 这是一个涉及程度的问题,用a来表示乐观(悲观)系数,表示乐观(悲观)的程度问题,需要利用一个这样的范式,对于每一行,站在乐观来看,我们可以得到一个数,从悲观来看,我们又可以得到一个数,最终Hi就是我们折衷的收益,这个a的取值很关键
    maxHi=aaij((max⁡))+(1−a)aij(min⁡)max\ \\H_i=aa_{ij\left( \left( \max \right) \right)}+\left( 1-a \right) a_{ij\left( \min \right)} max Hi​=aaij((max))​+(1−a)aij(min)​

  • 等可能性 对于每个事件的发生,如果我们没有办法决定那一种事件更容易发生,然后我们只能基于每个事件都是等可能性去思考(古典概型),所以上面每个事件的可能性都是0.2,然后用来算期望,最后得到最大的那一个

  • 最小机会损失准则(后悔值、遗憾值)既不是激进也不是保守们也不是等可能性,外号为“别后悔”,处理出我们能够看到我们后悔的情况,假设上面那个表格,我们假如选则事件1,相较于其他情况,我们选择S1,我们无损失,其他都有损失,所以只有选S1才最不后悔,所以从数学上来看,我们从每一列中找最大的数(代表事件的最优解),然后找到的最大的数-对应列各位的数,取绝对值(作为后悔的程度)(得到这一列中最后悔的程度),然后修正上面得到的表,再这个表的基础上,我们先取每行最大的后悔值,再在后悔值里面选一个最小值,从上面来看,我们会选择S5

风险决策(对于客观事情的发生概率不再未知)

跟上面的区别在于上面的概率是不知道的或者很难知道,而风险决策的概率是可以知道的或者不难得到的

涉及到概率,一般就涉及到了期望,所以方法有:

  • 最大期望收益准则 就是将前面的等概率改成对应的概率,就可以求解出来对应的期望,然后得到最大的期望值

  • 最小机会损失决策准则 跟概率相关了。出现期望的意味,先计算各策略的期望损失值,然后在各期望值中损失值中找到最小的。首先根据上面的情况我们算出一个后悔程度的表格,然后修改每行对应位置的概率乘以对应的值,再选择最小值

定理,假定我们原来的矩阵记为EMV,后悔矩阵记为EOL,我们可以得到如下定理

EMV + EOL =K(定值)K值如下:
k=p1a11+p2a22+...+pnannk\ =\ p_1a_{11}+p_2a_{22}+...+p_na_{nn} k = p1​a11​+p2​a22​+...+pn​ann​

  • 全情报价值(expected value of perfect information,EVPI)在做决策之前,先做一个调查(支出成本),来确定一个概率(说法可能不够充分),如果我们按照这个结果来求最优解,会得到一个更符合最优解,但调查是需要成本。假定调查以后我们得到的收益为EPPL,没调查的收益为EMV,那么调查完以后我们的净利润(EPPL-支出)>=EMV,这里乍一看可能没有什么问题,但是其实这里存在一个悖论,那就是我压根就不知道我调查以后得到的收益是否会大于我不调查的收益,所以这里我们需要加一个角度,能不能先不进行调研,得到更新后的P1–P5,这就涉及到了贝叶斯公式。这更新的概率与真实的概率还会存在差距,但差距很小了。

贝叶斯公式

主要涉及为条件概率、全概率公式和贝叶斯公式

由于本人学过贝叶斯公式,所以在这里就不赘述了,这里给出一个学习的链接:全概率公式、贝叶斯公式 - 知乎 (zhihu.com)

贝叶斯公式使用的主要特征,首先肯定知道B发生以后A发生的概率,求A发生以后B发生的概率(全集分解思想)

建议大家去看看这个视频,有些东西不好言传,只可意会:关于我强烈建议大家看看这个视频。我相信如果之前没有对贝叶斯有很深刻的了解,这个视频绝对会对大家有所帮助

【运筹学】基础教程(已完结){适用范围:本科、考研、考博}_哔哩哔哩_bilibili

效用曲线与决策树

效用函数

一般来说对于投入,就会得到一个收益,但是这个投入到收益的转换很难做到百分之一百,因为中间会有损失,所以这就涉及到了效用函数(函数) ,同时在这里还会涉及到了一个转化率的问题,一般来说,赚钱是开心的,亏钱是难过的,而且赚钱的开心程度比亏掉同样大小的金钱数伤心的程度要小的多。但是效用函数,一般偏向为一个对数函数,通常表示为保守型或者激进型两种曲线,经济学注重现象,管理学注重过程。

决策树

所谓决策树,数学本质上其实就是穷举法,所以决策树只能帮我们处理有限的情况。

在画决策树之前,首先我们要先做好说明,例如使用圆圈作为决策,矩形作为事件,三角形作为收益,横线表示为支出。每个决策肯定有放置或者不放置,然后就会产生一个事件,然后会产生一个反应,所以会继续做决策,做完决策以后就又会产生一个事件,然后接着做决策,直至结束。

在画完决策树,以后,我们根据树的每个枝的最叶子处进行计算(倒着算),首先根据对应的收入进行计算,选择收入最大的那个树枝,例如一个分叉的树枝,一边的期望值为7,一边的期望值为2,我们会舍弃掉为2的分支,并只记录期望值为7的分支,然后使用期望值为7继续向上进行迭代。向上迭代的过程中,不断选择期望值最大的值,最后根据期望值做出我们相应的决策

当我们加入之前所提到的效用值,我们可以将效用值当作概率进行使用,与利益相乘就可以得到相应的期望值,跟上面迭代过程一样,最终做出我们期望最大的决策

灵敏度分析

通过波动其中一些参数或者概率,来检验我们的决策的结果是否发生变化以及会发生变化范围的大小

决策论基础(单目标、多目标、不确定决策、风险决策、贝叶斯公式、效率函数和决策树基础入门知识)相关推荐

  1. MonoCon:使用辅助学习的单目3D目标检测框架(AAAI 2022)

    作者丨慕弋云子@知乎 来源丨https://zhuanlan.zhihu.com/p/455897310 编辑丨3D视觉工坊 本文已被收录在单目3D目标检测的综述文章中.如果你对单目3D目标检测的相关 ...

  2. DD3D:基于预训练的单目3D目标检测

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源丨CV研习社 作者丨元气满满的打工人 文章导读 导读:3D目标检测的主要应用场景就是自动驾驶,虽然 ...

  3. ICCV2021|单目3D目标检测真的需要伪激光雷达吗?

    作者丨agent@知乎 来源丨https://zhuanlan.zhihu.com/p/406918022 编辑丨3D视觉工坊 Paper: arxiv.org/pdf/2108.0641 Code: ...

  4. 使用YOLOv5实现单摄像头实时目标检测

    我将在上一节的基础上,一步一步展示如何实现单摄像头实时目标检测,其中包括我在配置过程中遇到的报错和解决方法. 实现单摄像头实时目标检测 将'--source'的默认值改为0 parser.add_ar ...

  5. 浅述单目3D目标检测

    作者丨慕弋云子@知乎 来源丨https://zhuanlan.zhihu.com/p/432135656 编辑丨3D视觉工坊 三维目标检测是一个相对上游.比较基础却又新兴的任务领域.得益于自动驾驶和2 ...

  6. 基础研究与国家目标——国家重点基础研究发展计划[转自科学社]

    http://www.kexuemag.com/Article/ShowInfo.asp?InfoID=839 引 言 科学是人类文明进步的动力,是技术创新与经济发展的源泉,是培养和造就优秀人才的摇篮 ...

  7. 【单目3D目标检测】FCOS3D + PGD论文解析与代码复现

    文章目录 前言 FCOS3D 概述 主要创新点 主要框架结构 回归目标 损失函数 推理过程 2D引导的多层3D预测 2D高斯分布的3D中心度 实验设置 源码复现 PGD 概述 主要创新点 深度估计 主 ...

  8. 最新发布!SMOKE 单目3D目标检测,代码开源!

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者| 黎国溥 编辑| 3D视觉开发者社区 SMOKE是一个one-stage的单目视觉障碍物检测模型 ...

  9. 万字长文概述单目3D目标检测算法

    一,理论基础-相机与图像 相机将三维世界中的坐标点(单位为米)映射到二维图像平面(单位为像素)的过程能够用一个几何模型进行描述,这个模型有很多种,其中最简单的称为针孔相机模型.相机的成像过程是也一个射 ...

最新文章

  1. Azure运维系列 3:善用Azure捕获功能事半功倍
  2. 不懂AI的我,是如何搞开发的?
  3. 在Ngnix上部署Flask应用
  4. pyqt漂亮gui界面模板_一种基于模板的C代码自动生成方法
  5. 后台nodejs程序如何主动推送数据给浏览器
  6. 运维必知的23个经验教训,值得收藏!
  7. 最详细的equals和hashcode详解
  8. mp4 视频在网页上播放不了
  9. Web接收实时视频流并显示(flask创建路由接收)| 解决延时不同步问题
  10. 放弃百万年薪,独自创业,我做错了吗?
  11. 到目前为止,Linux下最完整的Samba服务器配置攻略
  12. CSS显示属性上的过渡
  13. 我的pycharm+python常用快捷键(复习防遗忘版)
  14. python pandas中文手册-Pandas速查手册中文版(转)
  15. 【2016阿里安全峰会】“安全攻防”烧脑博弈全解读【附PDF下载】
  16. 加工生产调度(贪心)
  17. vmware虚拟机15 安装centos764 并且配置网络
  18. 2015年2月微软补丁_浏览器趋势2015年5月:Microsoft是否可以重新获得优势?
  19. 7、counters计数器使用
  20. 联想笔记本有福啦:最新联想Windows 7简体中文旗舰版OEM光盘镜像下载

热门文章

  1. 电脑假死卡的动不了_电脑卡死了动不了怎样恢复
  2. 【深度学习 功法篇】win10操作系统PC端环境的部署(如何并存 不同的、多种版本的深度学习框架)
  3. qywechat.class.php,wechat-php-sdk/qywechat.class.php at master · xzw/wechat-php-sdk · GitHub
  4. 搭建Spark On YARN集群
  5. 小程序图片懒加载放在服务器,【小程序】使用uni-app搭建小程序环境---图片懒加载...
  6. 魅族pro7plus android10,魅族PRO7和PRO7 Plus有什么区别?哪个好?一文秒懂
  7. 进程在内存中的样子,以及进程的一生
  8. 雨果奖得主刘慈欣(《三体》作者)如何看待人工智能?
  9. MyBatis的关联映射之 一对一(嵌套查询/嵌套结果)
  10. Docker-三剑客之machine、compose、swam集群、visualizer监控、stack部署集群、Portainer可视化