PDF
这篇是2011年ICML的最佳论文。
题目意思:计算合理化:反均衡问题
摘要:
Modeling the purposeful behavior of imperfect agents from a small number of observations is a challenging task. When restricted to the single-agent decision-theoretic setting, inverse optimal control techniques assume that observed behavior is an approximately optimal solution to an unknown decision problem. These techniques learn a utility function that explains the example behavior and can then be used to accurately predict or imitate future behavior in similar observed or unobserved situations.
In this work, we consider similar tasks in competitive and cooperative multi-agent domains. Here, unlike single-agent settings, a player cannot myopically maximize its reward; it must speculate on how the other agents may act to influence the game’s outcome. Employing the game-theoretic notion of regret and the principle of maximum entropy, we introduce a technique for predicting and generalizing behavior.

通过运用博弈论中后悔的概念和最大熵原则,论文提出了一种可预测和概括行为的技术。
看来想看懂这篇论文,需要学一下博弈论。

因为论文还看不懂,下面就自娱自乐好了。
慢慢接触人工智能之后,感觉真正能够实现人工智能的时候,都不知需要多少百年,甚至千年。或者说永远也不可能实现真正的人工智能,就像永动机一样,是违背自然规律的。不过转而又想,就算不能实现像人类一样 的人工智能,但也可以另外的形式实现人工智能。比如,虽然我们人类一直希望够能够飞翔,虽然不能真正像小鸟一样,但我们因此造出了飞机,进而又造出太空飞船,这已经不单单是飞翔的问题了。或许另辟蹊径,就能打破瓶颈。
让我们看一下人工智能所要完成的主要目标(也成为AI问题):
1. Reasoning(推理)
2. Knowledge Representation(知识表示)
3. Automated Planning and Scheduling(自动规划)
4. Machine Learning(机器学习)
5. Natural Language Processing(自然语言处理)
6. Computer Vision(计算机视觉)
7. Robotics(机器人学)
8. General Intelligence/Strong AI(通用智能/强人工智能)

单词:
myopically [maɪ’ɒpɪkəlɪ] 目光短浅地

每日一佳——Computational Rationalization: The Inverse Equilibrium Problem(Kevin Waugh et al. ,ICML ,2011)相关推荐

  1. 每日一佳——SVM Optimization: Inverse Dependence on Training Set Size(Shai Shalev-Shwartz et al,ICML,2008)

    PDF 题目意思:SVM优化:训练集大小上的反比关系 摘要:We discuss how the runtime of SVM optimization should decrease as the ...

  2. 每日一佳——Structure Preserving Embedding(Blake Shaw et al. ,ICML,2009)

    PDF 题目意思:结构保存嵌入,也就是"保存结构信息的图嵌入算法",等等,什么是图嵌入?1.A graph embedding is a particular drawing of ...

  3. 每日一佳——Hilbert Space Embeddings of Hidden Markov Models(Le Song,ICML,2010)

    PDF 好久没写博客了,前段时间来了个小发烧,所以便停止了.生病的时候就会想,还是命重要啊!活得那么累干嘛? 好了,废话少说. 题目一看,又是不知道说啥.只能Duang了一下百度了. 题目意思:隐马尔 ...

  4. 每日一佳——A Support Vector Method for Multivariate Performance Measures(Thorsten Joachims,ICML,2005)

    PDF 这篇Paper是2005年ICML的Best Paper. 题目意思:用于多变量性能度量的一个支持向量方法 摘要: This paper presents a Support Vector M ...

  5. 每日一佳——Least-Squares Temporal Difference Learning(Justin A. Boyan,ICML,1999)

    PDF 这篇Paper获得ICML1999年的Best Paper Award.好吧,看到题目我就傻眼了,讲的是啥?没办法,只能Duang一下了.(^_^) Least-Squares:最小二乘 Te ...

  6. 每日一佳——Information-Theoretic Metric Learning(Jason V. Davis et al. ,ICML,2007)

    PDF 题目意思:"信息-理论"度量学习 In this paper, we present an information-theoretic approach to learni ...

  7. codeforces D. Design Tutorial: Inverse the Problem

    题意:给定一个矩阵,表示每两个节点之间的权值距离,问是否可以对应生成一棵树, 使得这棵树中的任意两点之间的距离和矩阵中的对应两点的距离相等! 思路:我们将给定的矩阵看成是一个图,a 到 b会有多条路径 ...

  8. Best paper awards for AAAI, ACL, CHI, CIKM, FOCS, ICML, IJCAI, KDD, OSDI, SIGIR, SIGMOD, SOSP, STOC

    转载于:http://jeffhuang.com/best_paper_awards.html Best paper awards for AAAI, ACL, CHI, CIKM, FOCS, IC ...

  9. 计算机顶级会议的历年最佳文章 (1996-2013)

    本人博客地址:http://blog.csdn.net/wanrenwangxuejing Best Paper Awards in Computer Science (since 1996) ByC ...

最新文章

  1. Linux 裸设备基础知识(转)
  2. 什么是多项式时间?什么是NP问题?
  3. opencv学习笔记(六)---图像梯度
  4. Spring 事务底层原理,你会了吗?
  5. mysql limit acs_mysql查询操作
  6. 随机抽样java_实现随机抽样【随机数生成问题】
  7. python入门经典100例-【python】编程语言入门经典100例--3
  8. 【面经】字节AI Lab-NLP算法热乎面经
  9. 引力波应该称为空间波
  10. 【数学逻辑思维】A 好玩的数独游戏——001
  11. 匠心独运解读Mybatis源码,纯手工打造开源框架
  12. 局域网、以太网、无线局域网学习笔记
  13. Linux 邻居子系统介绍
  14. 激励是改善业绩的关键
  15. JAVA反编译工具总结
  16. 格斗机器人制造图纸_一种新型格斗机器人的制作方法
  17. 首期“赛迪区块链技术与应用培训班”成功举办
  18. 全球与中国医疗BI软件市场深度研究分析报告
  19. 电脑动态图制作的方法技巧
  20. matlab_tts更改为在线获取百度语音合成

热门文章

  1. oracle 日期 区别,oracle中日期类型 to_date 和to_timestamp什么区别啊?
  2. 2021 年高教社杯全国大学生数学建模竞赛 E 题 中药材的鉴别 第一题
  3. idea mybatis 常用插件
  4. 学校宿舍天翼校园网构建路由器
  5. 【3D】常见的3D模型格式介绍
  6. 网络工程师发展及待遇--学习
  7. Failed to read artifact descriptor for xxx:jar的问题解决
  8. 思科模拟器实现不同网段主机互ping
  9. OneNote中英文格式不同,OneNote无法修改英文字体,OneNote默认英文字体为Calibri无法修改的问题。
  10. bootstrap框架之面包屑导航(Breadcrumbs)