博弈论

文章目录

  • 博弈论
    • 一、内容简介
    • 二、前置概念
      • 1.ICG
      • 2.博弈图
      • 3.P点、N点
      • 4.mex函数
    • 三、前置定理
    • 四、四大经典组合游戏
      • 1.Nim游戏
      • 2.Bash游戏
      • 3.Wythoff游戏
      • 4.Fibonacci游戏
    • 五、SG函数
      • 1.SG函数
      • 2.SG定理
      • 3.简单应用
    • 六、SG游戏及拓展
      • 1. Anti−SGAnti-SGAnti−SG 游戏
      • 2. Multi−SGMulti-SGMulti−SG 游戏
      • 3. Every−SGEvery-SGEvery−SG 游戏
      • 4.翻硬币游戏
      • 5.无向图删边游戏
    • 七、致谢与感悟

一、内容简介

本文主要介绍算法竞赛中常常出现的博弈论模型,包括:

  1. 4个经典组合游戏
  2. SG函数
  3. SG游戏及拓展

二、前置概念

进一步学习需要了解一些前置概念

  1. ICG
  2. 博弈图
  3. P点、N点
  4. mex函数

1.ICG

ICG全称为“公平组合游戏”,我们下面讨论的博弈游戏均建立在ICG的基础上,那么什么是ICG呢,它需要满足以下条件:

  • 由两名玩家交替行动
  • 对任意局面,接下来可执行的行动仅与局面有关(玩家平等)
  • 游戏以玩家无法行动为结束,且无平局

那么称此游戏为“公平组合游戏

2.博弈图

我们可以看到,整个过程是各个状态的集合,且状态间可以到达,那么我们可以将这个博弈过程抽象为一张图,称为博弈图,这个游戏我们也称之为有向图游戏

那么这个图是一个有向无环图,图中有唯一的起点,可能有多个终点,两名玩家的交替行动可认为是图上的有向边,所有出度为0的节点便是终点

对于这个图,每个节点存储如下信息:{弈盘信息x,先手信息p,…}等

同时有如下结论:任何一个公平组合游戏均可以转化为有向图游戏

3.P点、N点

P点和N点是博弈里面两个及其重要的概念

  • 先手必胜状态:先手行动后,可以将一个必败状态留给后手
  • 先手必败状态:先手无论如何行动,只能将必胜状态留给后手
  • 必败点(P点):前一个选手取胜,当前选手将败的节点(previous)
  • 必胜点(N点):下一个选手将败,当前选手取胜的节点(next)

4.mex函数

mex函数是一个建立在集合上的整数函数,即mex:SN↦Nmex: S_N \mapsto Nmex:SN​↦N ,它的定义域是一个非负整数集,mexmexmex代表这个集合里最小未出现的非负整数,举几个例子:mex({1,2,3})=0mex(\{1,2,3\})=0mex({1,2,3})=0,mex({0,1,2})=3mex(\{0,1,2\})=3mex({0,1,2})=3,mex({0,2,3})=1mex(\{0,2,3\})=1mex({0,2,3})=1,等等

三、前置定理

定理一:没有后继状态的状态是必败状态

定理二:一个状态是必胜状态 ⇔\Harr⇔ 它至少存在一个向必败状态的转移

定理三:一个状态是必败状态 ⇔\Harr⇔ 它所有后继状态均为必胜状态

四、四大经典组合游戏

1.Nim游戏

给定 NNN 堆物品,第iii堆物品有 AiA_iAi​ 个。

两名玩家轮流行动,每次可以任选一堆,取走任意多个物品,可把一堆取光,但不能不取。

取走最后一件物品者获胜。

问先手是否必胜。

Nim博弈是最经典的博弈之一,许多博弈均可转化为Nim博弈,我们给出结论:

先手必胜 ⇔\Harr⇔ A1⊕A2⊕A3...⊕An≠0A_1\oplus A_2\oplus A_3...\oplus A_n\ne0A1​⊕A2​⊕A3​...⊕An​​=0

由归纳法其实很容易证得,也可以利用三个前置定理进行证明,但这个等价表达式还是给予我们很多震撼~~(也给予出题人很多灵感)~~

但其实我们不应把Nim游戏看成一个独立游戏,而应该把它看成若干个游戏的和

对每个游戏,先手是否必胜 ⇔\Harr⇔ Ai≠0A_i\ne0Ai​​=0

进而对于这 nnn 个游戏的加和为 A1⊕A2⊕A3...⊕AnA_1\oplus A_2\oplus A_3...\oplus A_nA1​⊕A2​⊕A3​...⊕An​

游戏和的概念后续还会继续用到,也是用异或的形式给出表达式,这个表达式很重要

int main(){scanf("%d", &n);for(int i = 1; i <= n; ++ i)  scanf("%d", &x), ans ^= x;puts("%s", ans ? "Yes" : "No");return 0;
}

2.Bash游戏

有 1 堆石子,总个数是 nnn 。

两名玩家轮流在石子堆中拿石子,每次至少取 1 个,至多取 mmm 个。

取走最后一个石子的玩家为胜者。

判定先手和后手谁胜。

给出结论:

先手必胜 ⇔\Harr⇔ (m+1)∤n(m+1)\nmid n(m+1)∤n

考虑三种情形 :

情形一:n≤mn \le mn≤m时,显然先手必胜

情形二:n=m+1n=m+1n=m+1时,先手最多拿m个,但无论先手取走几个,后手一定可以拿完,后手胜

情形三:(m+1)∣n(m+1)\mid n(m+1)∣n 时,假设先手每次拿 xxx 个,后手可以拿 m+1−xm+1-xm+1−x 个,最后后手胜

其余情形,先手均可以通过拿走 n%(m+1)n \% (m+1)n%(m+1) 个,进而转至情形三,先手胜

int main() {scanf("%d%d", &n, &m);puts("%s", n%(m+1) ? "First Win" : "Second Win");return 0;
}

3.Wythoff游戏

有两堆石子,石子数可以不同。

两人轮流取石子,每次可以在一堆中取,或者从两堆中取走相同个数的石子,数量不限.

取走最后一个石头的人获胜。

判定先手是否必胜。

这个游戏的结论比较复杂,涉及到了平面上的点集,下图便是先手必败节点,(x,y)(x,y)(x,y) 代表两堆石子个数

上面这张图粉色区域即为解集,解集是关于 y=xy=xy=x 对称,靠前的解有:(0,0),(1,2),(3,5),(4,7),(6,10),(8,13),(9,15),(11,18),(12,20),(13,21)...(0,0), (1,2), (3,5), (4,7), (6,10), (8,13), (9,15), (11,18), (12,20), (13,21)...(0,0),(1,2),(3,5),(4,7),(6,10),(8,13),(9,15),(11,18),(12,20),(13,21)... 等

解集 (ak,bk)(a_k,b_k)(ak​,bk​) 满足 :aka_kak​ 是之前未出现的最小自然数,bk=ak+kb_k=a_k+kbk​=ak​+k

这个可以利用题目的性质进行归纳证明,主要利用了如下性质:

  • 若(x,y)∈Ans(x,y) \in Ans(x,y)∈Ans ,那么 ∀t∈N,(x+t,y)∉Ans,(x,y+t)∉Ans,(x+t,y+t)∉Ans\forall t\in \N,(x+t,y)\notin Ans ,(x,y+t)\notin Ans,(x+t,y+t)\notin Ans∀t∈N,(x+t,y)∈/​Ans,(x,y+t)∈/​Ans,(x+t,y+t)∈/​Ans

我们称符合要求的解为奇异节点,奇异节点便是先手必败节点,而非奇异节点显然可以通过一步操作变成奇异节点,通过归纳法也可以证明奇异节点坐标正确性

按照解的定义,我们发现实际上集合 A={ak∣k∈N}A=\{a_k|k\in \N\}A={ak​∣k∈N} 和 B={bk∣k∈N}B=\{b_k|k\in \N\}B={bk​∣k∈N} 实际上是对整数区间的一个划分,即 A∩B=∅,A∪B=N+A\cap B=\varnothing,A\cup B=\N^+A∩B=∅,A∪B=N+ ,考虑引入Beatty定理

如果两个无理数 α,β\alpha,\betaα,β 满足:

1α+1β=1\frac{1}{\alpha}+\frac{1}{\beta}=1α1​+β1​=1

考虑两个正整数集 A,BA,BA,B :

A={⌊nα⌋},B={⌊nβ⌋}A=\{\lfloor n\alpha \rfloor\},B=\{\lfloor n\beta \rfloor\}A={⌊nα⌋},B={⌊nβ⌋} (1)(1)(1)

以及两个结论:

A∩B=∅,A∪B=N+A\cap B=\varnothing,A\cup B=\N^+A∩B=∅,A∪B=N+ (2)(2)(2)

那么我们断言:(1)⇔(2)(1)\Harr(2)(1)⇔(2) ,可利用取整函数的上下界进行证明

Beatty定理 代入我们的解集,利用 β=α+1\beta = \alpha +1β=α+1 解出:α=5+12,β=3−52\alpha = \frac{\sqrt{5}+1}{2} ,\beta=\frac{3-\sqrt{5}}{2}α=25​+1​,β=23−5​​

假设两堆石子为 (ak,bk),ak<bk(a_k,b_k),a_k \lt b_k(ak​,bk​),ak​<bk​ ,那么先手必败 ⇔\Harr⇔ (bk−ak)×α=kα=ak(b_k-a_k)\times \alpha =k \alpha = a_k(bk​−ak​)×α=kα=ak​

int main() {scanf("%d%d", &n, &m);if (a > b) swap(a, b);int ans = (b - a) * ((1.0 + sqrt(5.0)) / 2.0);puts("%s", ans==a ? "Second Success" : "First Success");return 0;
}

4.Fibonacci游戏

有 1 堆石子,总个数是 nnn (n≥2)(n\ge 2)(n≥2) 。

游戏双方轮流取石子,规则如下:

先手不能在第一次把所有的石子取完,至少取 1 颗;

之后每次可以取的石子数至少为 1 ,至多为对手刚取的石子数的 2 倍。

取走最后一个石子的人为赢家,求必败态。

结论:

先手必败 ⇔\Harr⇔ 石子数为斐波那契数

必要性可由归纳法简要证出,充分性建立在 Zeckendorf定理

任何正整数均可以表示为若干个不连续的 Fibonacci 数之和

进而先手可以将石子划分成多堆不连续的斐波那契数的加和,先手先取走最小堆,然后可以通过操作,让后手来面临这些斐波那契堆,且每次后手不能取完,而先手可以取完,最后先手取完最后的石子,先手胜

int f[N], x;
map<int,bool>mp;
int main(){fib[1] = 1, fib[2] = 1;for(int i = 3;i <= 50; ++ i) f[i] = f[i-1] + f[i-2], mp[f[i]] = 1;while(scanf("%d", &x) && x != 0)puts(mp[x] == 1 ? "Second win" : "First win");return 0;
}

五、SG函数

1.SG函数

SG函数是对博弈图中每一个节点或者说状态的评估函数,SG:state↦NSG: state \mapsto NSG:state↦N

规定游戏终点的 SG 函数值为 0 ,即 SG(end)=0SG(end)=0SG(end)=0 ,同时扩展规定一个游戏图的 SG 值为起点的 SG 值,即 SG(Graph)=SG(start)SG(Graph)=SG(start)SG(Graph)=SG(start)

在有向图游戏中,对每个节点 xxx ,

设从 xxx 出发有 kkk 个状态转移,分别到达节点 y1,y2,...,yky_1,y_2,...,y_ky1​,y2​,...,yk​ ,

那么定义 SG(x)SG(x)SG(x) 为 xxx 的后继节点的 SGSGSG 值集合取 mexmexmex

即:SG(x)=mex({SG(y1),SG(y2),...,SG(yk)})SG(x) = mex(\{SG(y_1),SG(y_2),...,SG(y_k)\})SG(x)=mex({SG(y1​),SG(y2​),...,SG(yk​)})

那么由前置定理,推出以下结论:

  • 若 SG(x)=0SG(x)=0SG(x)=0 ,则为必败状态
  • 若 SG(x)≠0SG(x)\not=0SG(x)​=0 ,则为必胜状态

2.SG定理

SG 定理 :

对于游戏 XXX ,它可以拆分成若干个子游戏 x1,x2,...,xnx_1,x_2,...,x_nx1​,x2​,...,xn​ ,X=⋃i=1nxiX = \bigcup_{i=1}^{n}x_iX=⋃i=1n​xi​

那么,SG(X)=⊕i=1nSG(xi)=SG(x1)⊕SG(x2)⊕...⊕SG(xn)SG(X)=\oplus_{i=1}^{n}SG(x_i)=SG(x_1)\oplus SG(x_2)\oplus...\oplus SG(x_n)SG(X)=⊕i=1n​SG(xi​)=SG(x1​)⊕SG(x2​)⊕...⊕SG(xn​)

换句话说,对于由 nnn 个有向图组成的组合游戏,设它们的起点为 s1,s2,...,sns_1,s_2,...,s_ns1​,s2​,...,sn​ 当且仅当 SG(s1)⊕SG(s2)⊕...⊕SG(sn)≠0SG(s_1)\oplus SG(s_2)\oplus...\oplus SG(s_n) \not=0SG(s1​)⊕SG(s2​)⊕...⊕SG(sn​)​=0 时,这个游戏为先手必胜

证明方法与 Nim 游戏的证明类似

事实上,每一个简单 SG-组合游戏 都可以完全等效成一堆数目为 KKK 的石子,其中 KKK 为该简单游戏的 SG函数值。

定义游戏的和

考虑任意多个同时进行的 SG-组合游戏,这些 SG-组合游戏的和 是这样一个SG-组合游戏:

在它进行的过程中,游戏者可以任意挑选其中的一个 单一游戏 进行决策,

最终,没有办法进行决策的人输。

易见,SG定理是对 游戏的和的SG值 和 单一游戏的SG值 间关系的一座桥梁,揭示了两者间的关系

3.简单应用

#include <unordered_set>  // AcWing 893
int n, m, x, res;
int a[N], s[N], ans[M];
int sg(int x){//记忆化搜索if(ans[x] != -1) return ans[x];unordered_set<int>St;for(int i = 1; i <= m; i++) if(x >= s[i]) St.insert(sg(x - s[i]));for(int i = 0; ; i++)  if(!St.count(i)) return ans[x] = i; // 求 mex
}
int main(){scanf("%d", &m);for(int i = 1; i <= m; i++)  scanf("%d", &s[i]);// m 个起点scanf("%d", &n);memset(ans, -1, sizeof ans);for(int i = 1; i <= n; i++) scanf("%d", &x), res ^= sg(x);puts("%s", res ? "Yes" : "No");return 0;
}

六、SG游戏及拓展

这一章节我们讲述 SG 游戏以及一些常见的扩展和应用,包括以下内容:

  1. Anti−SGAnti-SGAnti−SG 游戏
  2. Multi−SGMulti-SGMulti−SG 游戏
  3. Every−SGEvery-SGEvery−SG 游戏
  4. 翻硬币游戏
  5. 无向图删边游戏

1. Anti−SGAnti-SGAnti−SG 游戏

有 nnn 堆石子

两个人可以从任意一堆石子中拿任意多个石子,不能不拿,

拿走最后一个石子的人失败

求必胜策略

这个似乎与 SGSGSG 定理是相反的, SGSGSG 函数建立在可执行决策上,它认为当可执行决策为空时(终点态) SGSGSG 为 0 ,但这个游戏无法通过可执行决策来确切判断胜负,那我们是否要建立新的 SGSGSG 定理了呢

先给出结论:先手必胜等价于

  • ∀i,Ai≤1&SG(X)=0\forall i,A_i \le 1 \space \& \space SG(X)=0∀i,Ai​≤1 & SG(X)=0
  • ∃i,Ai>1&SG(X)≠0\exist i,A_i \gt 1 \space \& \space SG(X)\not=0∃i,Ai​>1 & SG(X)​=0

简证:第一点显然,对于第二点,若 SG(X)≠0SG(X)\not=0SG(X)​=0 ,先手每次操作使得其为 0 ,一直下去,使得最终只有一堆的石子数大于 1 ,此时,轮到先手操作,先手可以让局面变成只有奇数个 1 ,先手胜

其实除了全为 1 的情况,剩下情况还是符合常规 SGSGSG 定理的,我们分析一下 Anti−NimAnti-NimAnti−Nim 与常规 NimNimNim 的区别,主要区别在于 SG(X)=0SG(X)=0SG(X)=0 时,我们无法判负,为解决这个几乎与常规 NimNimNim 颠倒的博弈,我们引出下面的 SJSJSJ 定理

首先给出 Anti−SGAnti-SGAnti−SG 游戏的具体定义:

决策集合为空的游戏者获胜,生成终止局面的游戏者判负

其余规则与普通的 SGSGSG 游戏相同。

再给出 SJSJSJ 定理:

对于任意一个 Anti−SGAnti-SGAnti−SG 游戏

如果我们规定当局面中所有的单一游戏(不可再分割游戏)的 SGSGSG 值为 0 时,游戏结束

那么先手必胜等价于:

(1) ∀i,SG(xi)≤1&SG(X)=0\forall i,SG(x_i)\le 1\space \& \space SG(X)=0∀i,SG(xi​)≤1 & SG(X)=0

(2) ∃i,SG(xi)>1&SG(X)≠0\exist i,SG(x_i)\gt 1\space \& \space SG(X)\not=0∃i,SG(xi​)>1 & SG(X)​=0

证明与上述 Anti−NimAnti-NimAnti−Nim 类似

// Luogu P4279 Anti-Nim 模板题
int n, m, t, k;
int a[N];
int main(){scanf("%d", &t);while(t -- ) {scanf("%d", &n);int sg = 0, flag = 0;for(int i = 1; i <= n; ++ i) {scanf("%d", &a[i]), sg ^= a[i];if(a[i] > 1) flag = 1;}if((flag == 0 && sg == 0) || (flag == 1 && sg != 0))  puts("John");else puts("Brother");}return 0;
}

2. Multi−SGMulti-SGMulti−SG 游戏

有 nnn 堆石子

两个人可以从任意一堆石子中拿任意多个石子,不能不拿

或者可以把一堆数量不少于 222 石子堆分为两堆不为空的石子堆

无法操作的人失败

问谁有必胜策略

给出结论:

SG(x)={x−1,x≡0(mod4)x,x≡1&2(mod4)x+1,x≡3(mod4)SG(x)=\begin{cases} x-1 ,& x \equiv 0 \pmod 4 \\ x, & x \equiv 1 \&2 \pmod 4 \\ x+1, &x\equiv 3 \pmod 4 \end{cases}SG(x)=⎩⎪⎨⎪⎧​x−1,x,x+1,​x≡0(mod4)x≡1&2(mod4)x≡3(mod4)​

SG(X)=⊕i=1nSG(xi)SG(X)=\oplus_{i=1}^n SG(x_i)SG(X)=⊕i=1n​SG(xi​)

具体怎么来的,是依靠 独特的智慧 打表 来的,不过事实上,打表也确实是很重要 博弈类游戏 结论发现来源,不是所有人都有着拉马努金那种高超的直觉和经验

我们再来给出 Multi−SGMulti-SGMulti−SG 的准确定义:

Multi−SGMulti-SGMulti−SG 游戏规定,在符合拓扑原则的前提下,一个单一游戏的后继可以为 多个单一游戏 。

Multi−SGMulti-SGMulti−SG 其他规则与 SGSGSG 游戏相同。

那么它有如下性质:

  • 一个后继状态的SG值 为 后继状态中所能衍生出的所有独立游戏的异或和

举个简单的例子:SG(3)SG(3)SG(3) 的后继状态有 {(0),(1),(2),(1,2)}\{(0),(1),(2),(1,2)\}{(0),(1),(2),(1,2)} 也就是这堆有 333 个石子的石子堆,可以拿走或者分开等四种情况,他们的 SGSGSG 值分别为 $ { 0 , m e x { 0 } = 1 , m e x { 0 , 1 } = 2 , m e x { 0 , 1 , 2 } = 3 }$,因此 $SG(3)=mex{0,1,2,3}=4 $

int n, a[N], sg[N]; // hdu 3032 Multi-Nim 模板
int main(){int t, scanf("%d", &t);while(t -- ) {int ans = 0;scanf("%d", &n);for(int i = 1; i <= n; ++ i) scanf("%d", &a[i]);for(int i = 1; i <= n; ++ i) {if(a[i] % 4 == 0) sg[i] = a[i] - 1;else if(a[i] % 4 == 3) sg[i] = a[i] + 1;else sg[i] = a[i];ans ^= sg[i];}puts("%s", ans ? "Alice" : "Bob")}return 0;
}
int sg[M], vis[M]; // hdu 3032 打表代码
int main(){ // 对于一堆石子,数量为 M ,打表出 SG[M]sg[0] = 0, sg[1] = 1;for (int i = 2; i < M; ++ i){memset(vis, 0, sizeof(vis));//操作一,至少取一个for (int j = 1; j <= i; ++ j) vis[sg[i - j]] = 1;//操作二,分成两堆,不为空for (int j = 1; j < i; ++ j) vis[sg[j] ^ sg[i - j]] = 1;int j = 0; while (vis[j]) j ++ ;sg[i] = j;}for (int i = 1; i <= M; ++ i) printf("sg[%d] : %d\n", i, sg[i]);return 0;
}

3. Every−SGEvery-SGEvery−SG 游戏

给定一张无向图,上面有一些“棋子”

每人每次必须将所有可以移动的棋子都进行移动

最后不能移动的人输

求是否有必胜策略

还有一道 杭电OJ (HDU-3595) 的题:

GG和MM喜欢玩游戏。在游戏开始时,有两堆石头。

MM首先选择一堆石头,里面有 xxx 块石头,然后选择一个正数k,从另一堆有 yyy 块石头的堆中取走 kxkxkx 块石头 (y≥kx)(y\ge kx)(y≥kx) 。

然后是轮到了GG,也遵循上述规则选择石头。

当有人不能移除任何石头时,他就输掉了比赛,这个游戏就结束了。

很多年后,GG和MM发现这个游戏太简单了,所以他们决定一次同时玩 NNN 个上述游戏。

MM先手,当进入他的回合时,他必须对每个未完成的游戏进行操作。

取石头规则与上述相同,如果有人无法取走任何石头(即输掉最后一场结束游戏),那么他就输了

对于每个测试用例,输出获胜者的姓名

给出 Every−SGEvery-SGEvery−SG 游戏的具体定义:

Every−SGEvery-SGEvery−SG 游戏规定,对于还没有结束的单一游戏,玩家必须对该游戏进行一步决策

Every−SGEvery-SGEvery−SG 游戏的其他规则与普通 SGSGSG 游戏相同

Every−SGEvery-SGEvery−SG 游戏与普通 SGSGSG 游戏最大的不同就是它多了一维:时间

对于 SGSGSG 值为0的点,我们需要知道最少需要多少步才能走到结束,

对于 SGSGSG 值不为0的点,我们需要知道最多需要多少步结束

所有游戏都是独立的,并且我们发现无法操作者输,而同时又在进行多个游戏。因此,我们知道胜负情况最终由最后结束的游戏的胜负情况觉定。

既然只与最后结束的游戏相关,那么我们便不会太在意除最后一个游戏外其他游戏的胜负。

而且又由于我们得同时操作所有柚子,所以,对于我们必胜的游戏,我们一定会想办法将其尽可能的向后拖,尽可能完的结束;反过来,对于我们必败的游戏,我们一定会让他尽可能早的结束。

那么,我们首先可以判定出所有位置是 NNN 点还是 PPP 点,然后按照判定决策我们按拖延方案走还是加速方案走。

这样我们用 stepstepstep 变量来记录每个单一游戏的这个步数,有点像关键路径算法

step(u)={0,u∈Endmax⁡{step(v)}+1,<u,v>∈E,u∈N,v∈Pmin⁡{step(v)}+1,<u,v>∈E,u∈Pstep(u)=\begin{cases} 0 ,& u \in End \\ \max \{step(v)\}+1, & <u,v>\in E,u\in N,v\in P \\ \min\{step(v)\}+1, &<u,v>\in E,u\in P \end{cases}step(u)=⎩⎪⎨⎪⎧​0,max{step(v)}+1,min{step(v)}+1,​u∈End<u,v>∈E,u∈N,v∈P<u,v>∈E,u∈P​

给出必胜结论:

对于 Every−SGEvery-SGEvery−SG 游戏,

先手必胜 ⇔\Harr⇔ 单一游戏中最大的 stepstepstep 为奇数

结论建立在以下三条性质上,可以归纳地证明,或者显然地感觉出它们是对的:

  • 对于所有的单一游戏,先手必胜状态的 stepstepstep 值为奇数,先手必败状态的 stepstepstep 值为偶数
  • 设最大的 stepstepstep 为 maxsmax_smaxs​ ,那么胜手可以保证该单一游戏最少会在 maxsmax_smaxs​ 步结束
  • 设最大的 stepstepstep 为 maxsmax_smaxs​ ,那么胜手可以保证他所有必败的游戏最多在 maxsmax_smaxs​ 步结束

然后下面解决 HDU-3595 的题目,不过最好先看下 HDU-1525

浅要说下 HDU-3595 中单一游戏 N/PN/PN/P 判定的结论,这个单一游戏的背景来源于 EuclidEuclidEuclid 游戏

假设 a≥ba\ge ba≥b,那么如果 a=ba=ba=b,先手必胜,如果 a%b=0a\%b=0a%b=0 ,先手必胜,

而如果 b<a<2bb<a<2bb<a<2b 的话,怎么取就已经定了,

进而如果 a>2∗ba>2*ba>2∗b ,那么先手可以决定谁先取到 b<a<2bb<a<2bb<a<2b 这个状态,

所以当 a>2∗ba>2*ba>2∗b 时,先手必胜,只用讨论当 b<a<2bb<a<2bb<a<2b 时最后谁胜

int n,m,sg[MAX][MAX],step[MAX][MAX]; // hdu 3595
int SG(int x,int y){if(x > y) swap(x, y);if(~sg[x][y]) return sg[x][y];if(!x || !y) return sg[x][y] = 0;int r = y%x, d = y/x;if(d == 1){ // 此时操作唯一sg[x][y] = SG(r,x) ^ 1;step[x][y] = step[r][x] + 1;return sg[x][y];}else{ // 由上述说明知必胜step[x][y] = SG(r,x) + 1 + step[r][x]; // (r,x)先手胜的话,需多一步决策return sg[x][y] = 1;}
}
int main(){memset(sg, -1, sizeof(sg));while(cin >> n){int mx = 0, a, b;while(n--){cin >> a >> b; // 每个单一游戏的两堆石头数SG(a, b);mx = max(mx, step[a][b]);}puts("%s", mx&1 ? "MM" : "GG");}return 0;
}

4.翻硬币游戏

有 nnn 枚硬币排成一排,依次编号 111 到 NNN ,有的正面朝上,有的反面朝上,

现在按照一定的规则翻硬币,

比如每次只能翻一枚或者两枚,或者每次只能翻动连续的几枚,

但是要求最靠右的硬币必须从正面被翻到了反面,

操作集合为空者负,

求必胜策略

给出结论:

当前局面的 SGSGSG 值是所有正面朝上的硬币单独存在时的 SGSGSG 值的异或和

结论的来源估计也是打表猜结论和归纳大法

不过这个结论可以直接用,配合状压或者别的算法可以出很多题目

5.无向图删边游戏

给定一个 nnn 个节点的有根树,

两人轮流删边,删去边之后,不和根节点联通的部分都会被移除

不能操作者输,

求必胜策略

给出结论:

叶子节点的 SGSGSG 值为 000 ,其他所有节点的 SGSGSG 值为它所有儿子的 SGSGSG 值加 111 后的异或和

可以参考 克朗原理 的证明,配合归纳法,假设 nnn 节点树成立,那么 n+1n+1n+1 节点树也成立

同时,树的删边游戏可以进一步扩展,感兴趣的同学可以参考 FusionPrincipleFusion \space PrincipleFusion Principle

七、致谢与感悟

忙活了一整天,终于完结撒花了

学到了很多东西,对其内在数学模型有了更深的了解,也熟悉了一些常见处理手段(打表、归纳)

同时也收集了许多关于 SGSGSG 函数应用的代码模板和应用模型,真的收获颇丰

下面给出一些有用的链接,在写作时参考了很多

  • 《组合游戏略述——浅谈SG游戏的若干拓展及变形》贾志豪 本文参考了许多许多
  • 博弈论ACM / OI_繁凡さん的博客 里面总结的特别全面
  • 博弈论知识汇总 solvit 里面介绍了本文未提到的 NimKNimKNimK 和 StairNimStairNimStairNim
  • 博弈论题目总结(一) 和 博弈论题目总结(二) 分别介绍了经典博弈和 SGSGSG 函数应用的大量例题
  • 博弈论总结_Ethan-Walker的博客 里面包含了 80 余道博弈习题,涉及了博弈的方方面面
  • ACM-ICPC中博弈论的一些小小总结_phython96的博客 也介绍了一些本文未出现的思想方法和模型

博弈论算法常见模型整理相关推荐

  1. 自然语言处理常见算法与模型

    自然语言处理中常见算法与模型 个人学习记录备份,内容只对本人有效,不保证正确性 尊重原创,感谢原作者知识共享,版权均归原作者所有 NLP预训练模型 信息熵.最大熵模型(MaxEnt/MEM) 概率图模 ...

  2. DSP基础算法与模型研究

    DSP基础算法与模型研究 (转载请保留原文链接 http://www.techinads.com/archives/41 authored by 江申_Johnson) 美国有一家很优秀的DSP公司- ...

  3. 网络流性质及常见模型、改进空间的思考

    网络流基本是noip+的图论题必有算法,很重要. 1.网络最大流是已经没有任何方法使答案更大的一种算法.即最大化某个值,进一步讲即为完成最大化某个值的分配. 与费用流一起用时应注意,网络最大流没有增广 ...

  4. STL::算法::常见算法(二)

    STL::算法::常见算法 remove_copy/remove 及其泛化版 remove_copy_if/remove_if 这两组函数提供的实现删除序列中的相关元素的思路,对我们实现自己的算法是有 ...

  5. 【火炉炼AI】机器学习023-使用层次聚类算法构建模型

    [火炉炼AI]机器学习023-使用层次聚类算法构建模型 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotli ...

  6. 基于CNN算法自定义模型的动物识别项目1

    基于CNN算法自定义模型的动物识别项目1 资源文件 一.数据集介绍 二.开发步骤 1.引入库 2.定义模型 3.定义优化器 4.训练数据增强 5.测试数据归一化 6.数据生成 7.查看类别定义 8.训 ...

  7. 交通系统速度预测综述:从车辆到交通【公共交通数据集】【开源模型整理】

    交通系统速度预测综述:从车辆到交通[公共交通数据集][开源模型整理] 分享这篇综述,希望对大家有帮助.如有错误,请多指正! Zewei Zhou, Ziru Yang, Yuanjian Zhang, ...

  8. 搜索推荐算法系列文章整理

    博主近期花了几个月时间,将搜索推荐行业一些经典的模型算法进行了整理,有的还加入了自己的浅显理解,还有一些是自己的经验文章,也都是搜索推荐行业,这个系列算是做完了,特来整理下每篇文章的链接和简要介绍 读 ...

  9. FPGA经验谈系列文章——FPGA开发方向以及算法开发模型

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 FPGA经验谈系列文章--FPGA开发方向以及算法开发模型 前言 接口方向 算法方向 总结 前言 FPGA开发笼统的说可以分为两个方向 ...

  10. 特斯拉自动驾驶算法和模型解读(感知/规划/矢量地图/自动标注等)

    编辑 | 焉知汽车 点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心[全栈算法]技术交流群 特斯拉是一个典型的AI公司,过去一年训练了7 ...

最新文章

  1. 少儿python编程培训-厦门在线儿童编程课
  2. PAT甲级1111 Online Map (30分):[C++题解]两次dijkstra求单源最短路、保存路径、长度最短、时间最短
  3. javascript number转string不用科学计数法_[JavaScript]之数据类型篇
  4. Android RemoteController使用
  5. 关于ORACLE MYSQL NOT IN和NOT exists需要注意的 NULL值
  6. NB贝叶斯平凡而又神奇的贝叶斯方法
  7. 作为技术工程师,到底需要怎样的专业能力
  8. Python 数据结构与算法——图出度和入度的计算
  9. 系统找不到指定的文件。 : No installed service named Apache
  10. spss之数据预处理
  11. 网易 html5,今天网易刷屏的这个H5,到底有多猛?
  12. 寻找春天nbsp;九宫格日记-2011.08.24
  13. Freenom 申请免费域名(二)
  14. TabHost眼睛会骗人
  15. 一种下载网页中视频的方式
  16. 50元打造双网卡负载均衡服务器(Network Load Balancing)
  17. 史上最全无线通信频率分配表
  18. 【华人学者风采】汪玉 清华大学
  19. Linux系统命令(网络通信)
  20. 如何写一份优秀的微信营销方案

热门文章

  1. 《css世界》- 详细重点笔记与技巧
  2. idea导入项目后没有被识别为maven项目的解决办法
  3. android 断点下载的实现,自己动手实现一个Android断点下载
  4. EMC之 “不整改好别回来了”
  5. 谷粒商城学习笔记(一)
  6. 数据库分类及主流数据库对比
  7. BI项目中ETL设计与思考
  8. 安川机器人仿真软件安装
  9. HTML5桌面应用程序开发
  10. Learun,一款专注于业务,不用写代码的框架