问题求解和机器博弈

问题求解与人工智能

问题求解;

决策-博弈(各主体存在利益冲突,求解其矛盾,解释和预测)

博弈论:

历史:
冯诺依曼、摩 根斯坦
约翰纳什:纳什均衡

computer game

概念:基于博弈论,用人工智能方法解决博弈中的问题
里程碑:各种牌类游戏

分类:

  1. 完备信息博弈:棋盘上子的位置都公开/非完备:扑克
  2. 确定性/非确定性:存在其他因素改变时间方向:麻将开局骰子
  3. 双人/多人
  4. 各种棋牌对应的计算机搜索节点规模,德州扑克E1755;围棋E160当做非完备处理

领域研究框架

人类如何进行博弈游戏
观察当前局势
有哪些合法的走步
哪个最有利
执行

机器

  1. 人界界面-数据结构
  2. 走法生成器-规则解释器
  3. 搜索引擎-估值核心(经验技巧灵感-思考能力)(机器学习方法-博弈树搜索方法:对比)(如果需要很长时间收敛,eg3年,可能已经软硬件迭代更新了)
    非完备信息处理
    抽样信息空间,蒙特卡洛抽样
  4. 走步执行器

主流解决方案

博弈树搜索方法
机器学习方法
蒙特卡洛抽样
德州扑克AAAI-ACPC、四国军棋(顶级的复杂性)

蒙特卡洛博弈树搜索方法MCTS:

人工智能:alpha-beta剪枝 历史启发算法那
动态:不先深也不先广
选择
扩展
抽样
反向传播

  • 感觉我毕设那个是蒙特卡洛抽样啊
    概率来自于历史上布局的统计
    MCTS节点扩展选择策略:UCT算法 2009法国
    XI+这个节点被计算过的次数
    被选到的次数越多,它的权值越大,开发-探索选择倾向,
    开局阶段应该更广泛探索,进入后盘像更深的方向探索
    风险模型
    风险优势、收益优势
    正向风险(买彩票,正向风险高所以买)负向风险(一瓶药里只有一颗毒药不吃)
    对手建模方法
    非完备信息的牌类
    进攻型防守型的对手,固定位置步子的习惯峰值有很不同的。
    强化学习方法
    CFR方法通过反复迭代和训练 2015 science 二人受限(加注只能加固定值、跟牌、弃牌) 已经解决 阿尔伯塔 10^14更搞笑的存储方法,
    可以应用了,原来是10^12
    ACPC AAAI IJCAI
    非完备信息博弈专题
    2013 多人德州4
    哈工大,hit-sz
    人工智能目标
    想出这个玩法
    数值设计,每一关的摆放怎样的规律。关卡的失败率曲线,人工智能模拟用户行为,驴子前面胡萝卜vs大规模测试?10个人每个人3000盘、慢不准
    腾讯、博雅
    加拿大阿尔伯他大学机器博弈研究中心
    jonathan schaeffer
    和游戏厂商合作FIFA系列足球,RPG,cs,
    AIIDE暴雪的即时战略大赛
    线上扑克教学网站
    花钱学到了技巧再去赌博

主要研究问题

核心算法

转载于:https://www.cnblogs.com/dunfentiao/p/5164065.html

机器人技术课堂笔记-zjj2016.11.10相关推荐

  1. 数据库开发技术 课堂笔记2

    本文主要来源是课堂笔记 有两种情况是比较头疼的: 数据库重构 数据库迁移(不同的数据库差异巨大) 空 == 空 这个判断的返回值,每个数据库的设计都不一样 返回值 数据库类型 false MySQL ...

  2. 【电路】电路与电子技术基础 课堂笔记 第11章 数制、编码与逻辑代数

    11.1 数制与数制转换 11.2 二进制数的编码 1. 二-十进制(BCD)码 把十进制数的每一位用多位二进制数表示,称为二进制编码的十进制数,简称BCD编码. 具有二进制数的形式,又具有十进制数的 ...

  3. 动力节点数据结构课堂笔记 2021.11.23-11.29

    1.数据结构的分类:链表,数组,二叉树,图,栈,队列 线性结构:有序数据元素,线性表,数组,栈,队列,链表 非线性结构:树,图,二维数组 2.栈的特点,先进后出,只允许在栈顶进行插入(push)和删除 ...

  4. 安恒信息HWS计划2021硬件冬令营 物联网安全课堂笔记 2021.1.10

    使用幕布制作的笔记,无法直接导入,内容如图,文件下载自取. 链接:https://pan.baidu.com/s/1ayILSjAPD9Gmc8fdM-1rIQ 提取码:4pri 复制这段内容后打开百 ...

  5. AI公开课:19.04.10颜水成—360副总裁《人工智能:观察与实践》课堂笔记以及个人感悟—191017再次更新

    AI公开课:19.04.10颜水成-360副总裁<人工智能:观察与实践>课堂笔记以及个人感悟 导读       颜水成,新加坡国立大学副教授.360集团副总裁.人工智能研究院院长. 颜水成 ...

  6. AI公开课:19.03.06何晓冬博士《自然语言与多模态交互前沿技术》课堂笔记以及个人感悟

    AI公开课:19.03.06何晓冬博士<自然语言与多模态交互前沿技术>课堂笔记以及个人感悟 导读:AI与产业界结合,算法还是很重要的. 计算机能不能思考?会不会思考?把哲学问题转为科学问题 ...

  7. AI公开课:18.05.05 施尧耘(阿里云量子技术CS)—清华AI第四讲之《人工智能与量子计算》Quantum课堂笔记——带你了解量子计算

    AI公开课:18.05.05 施尧耘(阿里云量子技术CS)-清华AI第四讲之<人工智能与量子计算>Quantum课堂笔记--带你了解量子计算 导读 清华大学"人工智能前沿与产业趋 ...

  8. 杜国光博士,基于视觉的机器人抓取--物体定位,位姿估计到抓取估计课堂笔记

    基于视觉的机器人抓取--物体定位,位姿估计到抓取估计课堂笔记 杜国光博士在智东西公开课上讲了<基于视觉的机器人抓取--物体定位,位姿估计到抓取估计>的精彩课程 满满的干货,记下来,后面慢慢 ...

  9. 数字信号处理翻转课堂笔记10

    数字信号处理翻转课堂笔记10 Flipped Classroom10 of DSP 教材:<数字信号处理(第五版)>西安电子科技大学出版社,高西全.丁玉美著 一.要点 1.频域抽取法基2F ...

最新文章

  1. 二阶齐次线性微分方程的通解可以表示成两个线性无关解的线性组合
  2. 【EASYDOM系列教程】之 textContent 属性
  3. js中对函数设置默认参数值的3种方法
  4. PPT 下载 | 神策数据朱静芸:电商行业精细化运营四大场景
  5. WINDOWS系统常用程序及快捷键
  6. 【Flink】flink Operator State 的使用及Redistribute listState UnionListState
  7. sql 新增加一列序号_取出上一条下一条的 sql语句
  8. 怎样打开android设备,在app中打开android设备的存储
  9. ​FMEA失效模式分析中风险评估「SOD」标准
  10. 2022年认证杯SPSSPRO杯数学建模B题(第一阶段)唐宋诗的定量分析与比较研究求解全过程文档及程序
  11. 适用于Android的最佳笔记应用程序以及如何制作自己的应用程序
  12. DelayQueue使用
  13. 网页设计html图片滚动特效,网站设计|滚动特效全面讲解!
  14. OCT图像层次分割相关论文泛读
  15. WIN2003序列号
  16. 微信群导出群成员时间数据_教你一招轻松导出微信群名单
  17. 数字改造有色金属产业链,发挥产业优势效能
  18. 美工素材 站酷 千图网 昵图网
  19. PHP获取系统时间的方法(毫秒数)
  20. starting tomcat v7.0 server at localhost has encountered a problem错误解法方法

热门文章

  1. 一个概率题:54张扑克牌,除去两张大小王剩下52张扑克牌。问红桃A和黑桃A同时被一个人拿到的概率是多少?...
  2. 必须要裁掉那些老家伙
  3. 股票量化分析工具QTYX使用攻略系列——远程量化机器人
  4. iview table使用render函数实现关键字高亮
  5. Linux系统内存知识总结
  6. ERP系统是什么含意?
  7. 算法 二分查找的时间复杂度为O(log2N)的原因推理
  8. 1.前端HTML开发规范
  9. markdown 各种符号
  10. 黑马JAVA P52 补充知识:Debug工具