AI研习丨专题:不完全信息计算机博弈的模型与应用

AI百科5天前更新 快创云
6 0

  摘 要

  本文探讨了计算机博弈中不完全信息博弈的基本概念,对比分析了完全信息博弈与不完全信息博弈的模型差异,并深入研究了不完全信息博弈模型在博弈引擎决策、对战平台及棋谱标准等领域的实际应用。

  关 键 字

  不完全信息;计算机博弈;模型

  0 引言

  人工智能领域对计算机博弈的研究历史悠久。完全信息博弈曾是研究者关注的焦点,并已取得显著成就。1997年,IBM计算机DeepBlue击败国际象棋世界冠军卡斯帕罗夫,首次展示了计算机人工智能在复杂棋牌智力游戏中超越人类的能力。2017年,Google程序AlphaGo战胜围棋世界第一人柯洁,再次在这一被誉为最复杂智力游戏中展现了超越人类的实力。

  然而,与完全信息博弈不同,不完全信息博弈中游戏双方并不完全掌握决定胜负所需的所有信息。这类游戏包括幻影围棋、军棋、桥牌、斗地主、德州扑克和麻将等。由于玩家掌握的信息不完整,在较短的对局过程中,很难作出准确判断或对即将形成的局面进行准确估值。

  1.1 完全信息博弈

  完全信息博弈是指每个参与者都准确掌握所有参与者的信息。例如,在象棋中,玩家不仅知道自己的棋子位置和大小,也知道对手棋子的位置和大小;在围棋中,玩家都知道双方的棋子位置。因此,这类游戏的人工智能研究更侧重于规则描述、计算及搜索优化

  1.2 不完全信息博弈

  另一类博弈是信息不完备的博弈,即参与者仅掌握自身信息,而无法知晓对方的信息,导致博弈状态信息隐蔽且不可见。例如,在二人游戏中,每个玩家只知道自己的棋子位置和大小以及对方的棋子位置,但不知道对方棋子的大小;在幻影围棋中,玩家仅知道自己的棋子位置而不知道对方的棋子位置。这类游戏需要裁判来完成信息沟通、规则检验和胜负判定。与完全信息博弈相比,不完全信息博弈更为复杂且更具现实意义。

  在传统完全信息博弈项目的计算机对战中,影响胜负的因素对双方都是信息完备的,研究者更多关注战法策略研究和搜索速度优化。而在不完全信息博弈项目的计算机对战中,除了按照规则合法获取对手信息外,非法获取更多信息将导致游戏不公平。例如,在即时策略类单机游戏中,设计者为了弥补人工智能的短板,可能为机器提供更多信息,使玩家处于信息劣势以维持游戏平衡性。

  当两个或多个程序采用统一对战平台系统时,为了提高博弈效率,通常将多方信息存储在平台上且对单独参与者不透明。

  3.1 对战引擎的设计

  通过分析幻影围棋博弈模型发现,信息空间和收益函数之间存在紧密联系。在9路围棋中,玩家难以确定孤立棋子是否处于危机中而在幻影围棋中由于信息不完备防御布局策略通常比松散进攻策略更有优势。同样在斗地主中由于无法事先知道其他参与者手中的牌分布玩家在手中的牌有很大优势或成功率时才会叫牌而不是高于平均水平就叫牌坐庄。因此设计引擎时需考虑获取信息的代价与收益是否相符并侧重与信息描述的棋谱实际应用价值更高阅读者收益更大。

  3.2 博弈规则、对战平台和交互协议的设计

  计算机博弈研究中比赛是检验研究成果的主要方式。为了提高比赛效率需使用独立的比赛对战平台系统加载选手引擎完成比赛但由于不完全信息的特征所设计的平台需充分考虑保护信息的特殊需要。因此对战平台应准确区分哪些信息可以提供给哪些玩家哪些信息需要加密保存。在设计选手引擎与裁判平台交互协议时也要把握好交换信息的尺度对各种棋位和棋子或牌花色点数进行高效编码。同时设计军棋计算机博弈规则时需考虑传统军棋规则未对消极防御进行惩罚约定导致选手倾向于不进攻对方使对局容易陷入平局的问题并改进规则以提高比赛效率并避免平局的出现。

© 版权声明

相关文章