游戏王MD中的概率问题(二):Bo2与升降段
前言
如前文所说,一次11连后手引起了我计算MD相关概率问题的兴趣。在完成了n连硬币正面概率的计算后,本篇文章将讨论已知卡组胜率的情况下升降段机制对对局数量的要求,以及特殊赛制的公平性问题。
文中涉及到马尔科夫链和鞅论的一些知识,可以查阅这篇文章来了解。其中关于一维随机游走问题的计算也有助于理解本文中的计算。
TL;DR
这篇文章的主要计算结果都在这里,如果你对冗长的计算没什么兴趣也许可以不看之后的计算。结果就已经挺冗长了
实卡无穷对局连胜K局问题
AB双方无限对局,由A首先先攻,单局胜者下一局后攻。当某一方首先获得单局K连胜时视为游戏胜利。第一局(主卡局),卡组A对卡组B的先攻胜率为p0;在备牌局,卡组A的先攻胜率为p1,后攻胜率为p2。
分出胜负所需局数的期望E由以下方程组给出
⎩⎨⎧E1=(E−1+1−p21)(1−p2K−1)E−1=(E1+p11)(1−(1−p1)K−1)E=(1−p0)E−1+p0E1+1
A获得最终游戏胜利的概率是
p+=(1−p1)K−1+p2K−1−(1−p1)K−1p2K−1p2K−1[1−(1−p0)(1−p1)K−1]
特别地,当K=2时,
E=1−p1+p1p22+p0+p1p2−p0(p1+p2)p+=1−p1+p1p2p2(p0+p1−p0p1)
如果双方使用完全相同的卡组(含side),那么p1+p2=1;如果双方在MD打,没有side,那么p0=p1。
MD天梯升降段问题
设某卡组单局游戏胜率为p=2p先+p后,假设刚升上某一小段,问升段/降段发生的期望局数,以及升段的概率。
钻石段/白金段
累计4胜升段,0胜场3连败掉段。
E=p6−5p5+11p4−13p3+11p2−5p+12p5−4p4−p3+10p2−6p+3p+=p6−5p5+11p4−13p3+11p2−5p+1p4(p2−3p+3)
大师段
累计5胜升段,0胜场3连败掉段。
E=2p6−10p5+22p4−24p3+16p2−6p+13p6−9p5+12p4−11p3+16p2−9p+3p+=2p6−10p5+22p4−24p3+16p2−6p+1p5(p2−3p+3)
p=0.5时,钻石段升段概率为63.6%,大师段升段概率为58.3%。单局胜率低于50%的卡组升段的概率可以大于50%。钻石段升降段期望局数约为13,大师段升降段期望局数约为10。
一般情况
一般地,如果某小段需要累计N胜升段,0胜场M连败掉段,卡组单局胜率为p。那么,能成功升段的概率为:
p+=f(N)−f(−M)−f(−M)
其中,
f(n)=⎩⎨⎧2p−1p[1−(p1−p)n]1−(1−p)n,n≥0,n<0
而升降段发生所需的期望局数E由以下线性方程组给出:
⎩⎨⎧E1=2p−1N−1+(E0−2p−1N)pN+1−p(1−p)NpN(1−p)−p(1−p)NE=(E1+p1)[1−(1−p)M]
Bo∞中的连胜
Bo3决定胜负的卡牌游戏
游戏王实卡的赛制是Bo3,也就是三局两胜制。在前一局游戏结束后,败方可以选择下一局的先后手,同时双方可以根据对方的卡组以及先后手情况从自己预先准备的15张备牌中更换一些针对卡。
由于换备和三局两胜制的存在,因此会比MD的一把定胜负更平衡一些。
Bo2赛制
设想这样一种Bo2赛制: 双方无限对局,当某一方首先获得单局2连胜时视为游戏胜利。 理论上来说,相比Bo3赛制,这样会要求更大的玩家水平和卡组构筑差距才能决出胜负。
假设对局双方分别使用卡组A和卡组B,在第一局(主卡局),卡组A对卡组B的先攻胜率为p0;在备牌局,卡组A的先攻胜率为p1,后攻胜率为p2.
为了简单起见,我们假设双方卡组都是先手比后手更有优势的卡组(没有玩天杯龙的)。因此当某个玩家输了一局的时候,下一局他一定会选择先手。
那么问题是,如果使用卡组A的玩家先攻:
对局次数期望
这个对局过程显然是马尔可夫的。对局总共有5种状态,S={−2,−1,0,1,2},其中0是第一局(初始态),−2和2分别代表连输/连赢2次的状态(吸收态)。
我们可以写出相应的转移矩阵:
P=11−p1000001−p01−p20000000p1p000000p21
设从状态i转移到某个吸收态的期望为Ei,则
⎩⎨⎧E−2=0E−1=(1−p1)E−2+p1E1+1E0=(1−p0)E−1+p0E1+1E1=(1−p2)E−1+p2E2+1E2=0
解得
⎩⎨⎧E−1=1−p1+p1p21+p1,E0=1−p1+p1p22+p0+p1p2−p0(p1+p2),E1=1−p1+p1p22−p2
也就是说,分出胜负的期望局数是E=E0=1−p1+p1p22+p0+p1p2−p0(p1+p2)
获胜概率
设对局中前一把赢了之后最终取胜的概率为A,前一把输了之后最终取胜的概率为B,利用
{A=p2+(1−p2)BB=p1A
解得(A,B)=(1−p1+p1p2p2,1−p1+p1p2p1p2)
最终胜率为P=p0A+(1−p0)B=1−p1+p1p2p2(p0+p1−p0p1)
K连胜的情形
之前我们讨论的是2连胜的情形,假如将胜利条件改为有一方K连胜才结束那又如何计算呢?
获胜概率
我们使用鞅与停时定理来计算一般情况下的概率。参考前文,为了计算概率,我们需要构造鞅f(Xn),由定理4可知f(i)需要满足:
{f(i)=p2f(i+1)+(1−p2)f(−1),f(i)=p1f(1)+(1−p1)f(i−1),i>0i<0
由初值无关性,我们不妨设f(0)=p0f(1)+(1−p0)f(−1)=0,求解函数方程组(提示:当成共享边界条件f(0)=0的两个线性递推数列),不难得到,
f(n)=⎩⎨⎧p2−n+1−p00−(1−p1)n+1+1−p0,n>0,n=0,n<0
容易验证f(n)是有界的,所以我们可以使用停时定理,得到
0=f(0)=E(f(X0))=E(f(XT))=p+f(K)+(1−p+)f(−K)
因此
p+=f(K)−f(−K)−f(−K)=p2−K+1−p0+(1−p1)−K+1−1+p0(1−p1)−K+1−1+p0=(1−p1)K−1+p2K−1−(1−p1)K−1p2K−1p2K−1[1−(1−p0)(1−p1)K−1]
游戏局数的期望
期望的计算还是一样,根据状态转移矩阵可以列出2K+1元的线性方程组:
⎩⎨⎧Ei=(1−p2)E−1+p2Ei+1+1Ei=p1E1+(1−p1)Ei−1+1E0=(1−p0)E−1+p0E1+1EK=E−K=0,i∈{1,⋯,K−1},i∈{−1,⋯,−K+1}
由于我们只关心E0,简单化简后可以得到(提示:把前两行看成数列递推式)
⎩⎨⎧E1=(E−1+1−p21)(1−p2K−1)E−1=(E1+p11)(1−(1−p1)K−1)E0=(1−p0)E−1+p0E1+1
具体的解就不写了,太长了😵
天梯升降段
另一个有趣的问题是已知卡组的胜率为p,如何计算在MD天梯升段/降段的期望局数和概率?
你可以考虑先攻胜率p1后攻胜率p2,但无非就是把每步转移概率里的p换成(p1+p2)/2
MD的段位机制如下:
- 累计净胜K局升段(白金/钻石段K=4,大师段K=5)
- 净胜0局的情况下连败3局掉段
- 掉段流程中只要有赢一局,回到净胜1局的状态
这个问题的解法和之前的K连胜问题基本一样:
- 根据状态转移矩阵列出线性方程组求解期望
- 构造鞅使用停时定理来计算最终概率
读者可以参考上一节的计算,这里就简单写写。
钻石段:K=4
状态转移矩阵:
Mp=11−p000000001−p000000001−p000000001−p0000ppp01−p000000p01−p000000p00000000p1
记E=E−3E−2E−1E0E1E2E3E4,c=01111110,A=2I62
解线性方程(A−Mp)E=c,得
E=p6−5p5+11p4−13p3+11p2−5p+1102p3+2p2−p+1−2p4+2p3+5p2−3p+22p5−4p4−p3+10p2−6p+3−p5+5p4−11p3+15p2−9p+4p5−2p4−3p3+13p2−12p+5−2p5+12p4−29p3+36p2−22p+60
为了计算升段概率,我们构造f(n)使{f(Xn)}是个鞅,
f(n)=⎩⎨⎧2p−1p[1−(p1−p)n]1−(1−p)n,n≥0,n<0
停时T={首次到达n=4∨n=−3},设升段概率为p+,则由停时定理
f(0)=E(f(XT))=p+f(4)+(1−p+)f(−3)=0
解得,
p+=f(4)−f(−3)−f(−3)=p6−5p5+11p4−13p3+11p2−5p+1p4(p2−3p+3)
大师段:K=5
状态转移矩阵:
Mp=11−p0000000001−p0000000001−p0000000001−p00000ppp01−p0000000p01−p0000000p01−p0000000p000000000p1
解线性方程(A−Mp)E=c,得
E=2p6−10p5+22p4−24p3+16p2−6p+103p4+3p2−2p+13p5−6p4+3p3−8p2+5p−23p6−9p5+12p4−11p3+16p2−9p+3−2p5+10p4−19p3+24p2−13p+43p6−14p5+29p4−35p3+32p2−17p+5−p5+8p4−22p3+32p2−21p+63p6−19p5+52p4−78p3+69p2−33p+70
鞅和之前的一样(因为段位机制没变,只是停止条件变了),停时变成T={首次到达n=5∨n=−3},此时
p+=f(5)−f(−3)−f(−3)=2p6−10p5+22p4−24p3+16p2−6p+1(p2−3p+3)p5
简单分析
胜率
我们把K=4和K=5时的胜率-升段率曲线画出来:
- 一个卡组要在天梯上保持不升不降,其胜率并不需要达到50%:在白金/钻石段只需要46%的胜率,而在大师段则需要48%
- 一个单局胜率在50%的卡组实际上有60%左右的概率是能升段的
游戏局数
把K=4和K=5时的胜率-期望局数曲线画出来:
- 除非单局胜率特别高(>78%),不然大师段升降段会比钻石段更快(大概是因为掉段更容易?)
- 期望局数在略小于50%胜率的地方取到最大(不过并不是总体胜率50%的点,还要更小一点)
- 期望上来说,大师段10把升降段,钻石白金13把升降段
一般情况
总结一下计算结果,如果某小段需要累计N胜升段,0胜场M连败掉段,卡组单局胜率为p。
升段率
由于段位机制没有变化,因此对应的鞅{f(Xn)}也不变:
f(Xn)=⎩⎨⎧2p−1p[1−(p1−p)Xn]1−(1−p)Xn,Xn≥0,Xn<0
于是能成功升段的概率就是:
p+=f(N)−f(−M)−f(−M)
期望
升降段发生所需的期望局数由线性方程(A−Mp)E=c给出。其中,
A=2IN+M−12,c=01N+M−10,Mp=1qq⋱qqpp⋮p⋱pq⋱qpp1, q=1−p
解得的列向量E中的每一个元素代表从某个胜负场状态开始到达升段/降段的期望局数。
当然,也可以把上述矩阵形式的线性方程组写成大家更熟悉的形式:
⎩⎨⎧Ei=(1−p)Ei−1+pEi+1+1Ei=(1−p)Ei−1+pE1+1EN=E−M=0,i∈{0,1,⋯,N−1},i∈{−1,⋯,−M+1}
如果我们只关心E0,那么和上一节类似,可以直接化简上面的线性方程组:
⎩⎨⎧E1=2p−1N−1+(E0−2p−1N)pN+1−p(1−p)NpN(1−p)−p(1−p)NE0=(E1+p1)[1−(1−p)M]