本文目录一览

1,图搜索与或树搜索博弈树搜索的特点与区别

树是图,图不一定是树,树是图的子集树有一个根节点,图没有树可以递归遍历,图要看情况树有层次划分,图没有树的非根节点必定有一个父节点,图不一定树是一种“层次”关系,图是“网络”关系希望对你有帮助

图搜索与或树搜索博弈树搜索的特点与区别

2,田忌赛马的博弈树是怎样画

田忌 王孙上等 上等 ↘ 中等 ↗ 中等 ↘ 下等 下等

田忌赛马的博弈树是怎样画

3,三方博弈如何建立模型

首先应考虑动态博弈模型,要三方有先后的行动顺序;其次,加上各方的行动策略;再次,加上对应的效用或得益(payoff,现多译为“支付”);最后进行基于得益或支付的均衡分析。 博弈本意是:下棋。引申义是:在一定条件下,遵守一定的规则,一个或几个拥有绝对理性思维的人或团队,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。时候也用作动词,特指选择的行为或策略进行选择并加以实施的过程。
你应考虑动态博弈模型,要三方有先后的行动顺序;其次,加上各方的行动策略;再次,加上对应的效用或得益(payoff,现多译为“支付”);最后进行基于得益或支付的均衡分析。我们做过一个与你的要求类似的模型。 一个博弈,只要建立了以下信息就可以了。 1.行为人(参与人)——政府、个人、地方 2.各自的支付函数和可能的行动集 3.博弈顺序和信息集 4.博弈规则。权力在以上三者间的分配。
可以建个博弈树试试
简单模型的话应该是建立博弈树吧
我知道两方博弈可以像囚徒困境那样建立一个2*2的图标然后分析
三方博弈建立博弈树可以建立模型,但是好像先后顺序也有关系 呵呵 时间久了 我也记不清楚了

三方博弈如何建立模型

4,逆推归纳法 博弈论

逆推归纳法是解析动态博弈的一般方法。其方法是∶从博弈树最后的决策结为起点,求出对应的参与人的最优选择;然后在给定这种选择的情况下,倒推至该决策结的前一个决策结求出对应的参与人的最优选择;然后再向前倒推,直至初始的决策结。当这个倒推过程完成后,则得到一个路径,这个路径给出了每一个参与人一个特定的战略,所有这些战略构成一个纳什均衡就是动态博弈的解,这个纳什均衡被称为子博弈精炼纳什均衡。 例如“海盗分宝”中,最先提分配方案的1号海盗是这样思考的∶该博弈的最后阶段是剩下4号、5号两个海盗,由4号提分配方案,5号表决。很显然,无论4号提出的任何分配方案(哪怕提出5号得全部100块宝石),5号都会否决,因为轮到5号时,他会理直气状的得到全部宝石,故在最后阶段,4号被扔进大海,5号独吞全部宝石。倒推到剩下3个海盗的情形,这时由3号提分配方案,由于3号预见到最后阶段的结局,他知道4号会力阻博弈进入最后阶段,自己提出的任何方案4号都会同意而保住性命,故3号提出自己得100块宝石,4号、5号什么都不得的方案会通过。倒推到剩下4个海盗的情形,这时由2号提分配方案,由于2号预见到下一阶段的结局,故2号提出自己得98块宝石,4号、5号各得1块宝石,3号什么都不得的方案会得到4号、5号的同意而通过。倒推到博弈的开始阶段,这时由1号提分配方案,由于1号预见到后面各阶段的结局,他提出的方案只要有2人支持就能通过。故1号提出自己得97块宝石,3号得1块宝石,4号或5号得2块宝石,2号什么都不得的方案会得到2个人的同意而通过。这就是在“完全理性”假设下,1号海盗得以通过而又使自己得益最多的分配方案。

5,什么是极大极小博弈树

博弈论简介  (关键词:策略空间,合作博弈,非合作博弈,纳什均衡,团体理性,委托代理关系,激励理论)  博弈论(game theory)又称对策论,起源于本世纪初,1994年冯·诺依曼和摩根斯坦恩合著的《博弈论和经济行为》奠定了博弈论的理论基础。20世纪50年代以来,纳什、泽尔腾、海萨尼等人使博弈论最终成熟并进入实用。近20年来,博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到广泛的应用。  简单地说,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡。博弈论由3个基本要素组成:一是决策主体(player)?,又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是效用(utility),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数。参与人,策略集和效用构成了一个基本的博弈。  博弈论可以分为合作博弈和非合作博弈。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能,则称非合作博弈(non-cooperative game)?,非合作博弈是现代博弈论的研究重点。比如两家企业A、B合作建设一条VCD的生产线,协议由A方提供生产VCD的技术,B方则提供厂房和设备。在对技术和设备进行资产评估时就形成非合作博弈,因为每一方都试图最大化己方的评估值,这时B方如果能够获得A方关于技术的真实估价或参考报价这类竞争情报,则可以使自己在评估中获得优势;同理,A方也是一样。至于自己的资产评估是否会影响合作企业的总体运行效率这样的“集体利益”,则不会非常重视。这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益。  合作博弈强调的是集体主义,团体理性(collective rationality),是效率、公平、公正;而非合作博弈则强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。  博弈论非常强调时间和信息的重要性,认为时间和信息是影响博弈均衡的主要因素。在博弈过程中,参与者之间的信息传递决定了其行动空间和最优战略的选择;同时,博弈过程中始终存在一个先后问题,参与人的行动次序对博弈最后的均衡有直接的影响。  博弈的划分可以从参与人行动的次序和参与人对其它参与人的特征、战略空间和支付的知识?信息是否了解两个角度进行。把两个角度结合就得到了4种博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。其代表人物是纳什、泽尔腾和海萨尼。严格地讲,博弈论并不是经济学的一个分支,它只是一种方法,这也是为什么许多人将其看成数学的一个分支的缘故。博弈论已经在政治、经济、外交和社会学领域有了广泛的应用,它为解决不同实体的冲突和合作提供了一个宝贵的方法。  利用博弈论可以证明现实生活中许多有趣的问题。如:多劳者不多得,公共资源的过度使用,非合作者在一段时间内选择合作坏人做好事。虽然这些结论都是建立在一个很强的假设,即参与人是理性的,有最大化自己效用的趋势。但是其结论有深刻的哲学内涵。  目前经济学中的委托——代理制、激励理论都可以用博弈论来分析。现代的企业间竞争有很多情况都是在合作的背景下进行的。比如垄断市场的寡头A、B,他们可以协议指定一个产量如海湾国家的石油产量,来维持自己的最大利润。但是在许多情况下总有为了维护自己的局部利润而提高产量的情况如沙特常擅自提高产量,结果导致价格下降,利润流失。竞争情报往往在这种情况下 起重要作用,如果A掌握了B的实际生产能力这类竞争情报,就可以调整自己的产量甚至突破协议,从而形成新的均衡

6,什么是博弈树怎么用来分析

博弈树 探讨一下难度较大的棋类游戏程序,比如国际象棋和西洋跳棋 等等。用这些程序来同人或其他程序对弈。然而,有些程序是把计算机精心设计成一个棋 盘,人们可以在其上对弈(或者是一种单人玩的棋盘游戏)。这种程序更接近于系统模拟 的领域,而不属于人工 智能的范畴。我们此处所要介绍的却是让计算机能够“思考”如何下棋。 假定有两个人或者两台机器在下棋。我们把其中一名称为棋手,另一名称为对手。而我们 始终从棋手的角度来观看这场竞赛。这样一来,如果棋手赢了、对手输了,我们就说这盘 棋赢了;如果棋手输了、对手赢了,我们就说这盘棋输了。 假设现在该轮到棋手走了。在大多数情况下,棋手对这步棋可以有若干种选择。对于棋手 的每一种选择,对手也有若干可供选择的相应棋步。对于棋手的每一步棋以及对手的每一 步回棋,棋手又有自己进一步的选择。显然,这里所遇到的分支情况同我们在状态搜索中 遇到的情形相同的。 实际上,我们可以把一盘棋想象成具有一个入口(起始位置)和一组出口的迷宫。有些出 口标上了赢的记号;有些出口标上了输的记号;而有些出口标上了和局的记号。在入口处 ,棋手选择某条路径起步,在路径的一个岔口,对手挑选了自己的路径回步,棋手和对手 就这样轮流选择自己的 路径走下去。棋手总是力争通向胜利的出口,而对手却总是把棋路引向输的出口。有时双 方各自的努力不相上下,最后在和局出口结束棋局。或者他们一直在这个迷宫中徘徊,直 到形势变得非常明朗:双方循环兜圈子,这时只好双方握手言和。 因此,下棋游戏同状态图搜索是相似的,就是要在状态图中找出一条从初始状态到目的状 态的路径。但是,它们之间却有一个很大的差别。在状态图搜索中,总是由一名选手来选 择下一步往哪走。而在棋类的对弈中,棋手只有一半选择的权利,另一半由对手作出决定 。棋手是一直朝着目标 努力,而对手却是通过它每一步棋对此设置障碍。寻找机会把棋手从通往目标的路径上引 开。 对于任何一种博弈竞赛,我们可以构成一个博弈树。它类似于状态图和问题求解搜索中使 用的搜索树。博弈树的结点对应于某一个棋局,其分支表示走一步棋;根部对应于开始位 置,其叶表示对弈到此结束。在叶节点对应的棋局中,竞赛的结果可以是赢、输或者和局 。 所谓棋局,就是所有那些必须记录下来的信息。根据这些信息,比赛在按计划暂停以后能 够得以继续进行下去。显然,这些信息包括了此时棋子在棋盘上的位置以及指出下一步是 轮到棋手走,还是对手走。 博弈树是一棵与/或树,不同于在状态搜索中使用的纯粹的或树。 其原因是:当轮到棋手走时,他可以决定选择哪一步棋走。如果起码有一步可以担保棋手 能够到达赢的棋局,那么棋手就会选择这一步并保证能够取胜。因此对应于棋手走的节点 是一个或节点。 当轮到对手走时,选择是由对手决定的。棋手没有任何选择的权利。只有对手的所有可以 走的棋布都会导致棋手赢时,这时棋手才能保证会赢。因此,对于对手走的结点是一个与 节点。 对于一场经过深思熟虑地棋局来说,其博弈树是非常庞大的(国际象棋来说有10^120个节 点)。以至于不可能把这样大的博弈树装入计算机,也不可能在任何合理的、有限的时间 内进行详细的搜索。尽管如此,首先深入的考察一下完整的博弈树,然后再看看如何来修 正我们的原来的想法, 以便把搜索树修整到一个合理的范围。这样做还是很有意义的。 博弈策略 假设我们对所讨论的博弈问题构造了一棵完整的博弈树,我们希望能从中找出棋手应采用 的策略。这种策略应当确保棋手会赢,或者起码能够得到和局的结果。 首先我们把该博弈树的每一个节点标上w(对应于赢)、d(对应于和局)或者l(对应于 输)。如果当前的棋局对应于标有w的节点,那么就存在一种策略可以担保棋手会赢;如 果结点标的是d,那么除非对手失误,否则棋手最好的前景就是争取和局;如果节标的是l ,那么棋手只好认输了, 除非对手下错了棋。 对一个节点标以w、d和l的过程,可以如下进行。 我们的讨论从叶节点开始,每一个叶结点对应于一场棋赛的结束的终局。根据博弈的规则 ,叶节点确定了棋手的赢,输和和局。这样,我们就把每一个叶节点标上相应的值。 现在我们按照从叶往根本方向进行研究。按照每一节点的子节点的标号来标记该节点本身 。节点标注的规则如下: 轮到棋手走步时,如果该节点的子节点至少有一个标有w,那么 ,该节点就标为w;如果所有子节点都标为l,那么该节点标为l。其他情况标上d。 轮到对手走步时,如果该节点的子节点都标上了w,那么该节点标为w;如果有一个以上的 子节点标上了l,那么该节点标为l。其他情况标上d。 根节点的标注表明,在对手不失误的情况下,棋手能够得到的最好结果。如果根节点为w ,那么棋手稳操胜券;如果为l,那么对手一定能击败棋手;如果为d,那么在对手不失误 的条件下,棋手能够得到的最好结果就是平局。 一场比赛,如其根节点能够标上w或l,并且是很简单易于分析的话,就可以成为骗人的棋 局。该节点标作w的话,无论是谁先走,先走者都能赢;根节点为l的话,无论谁后走,则 后者也一定能赢。当然需要采取正确的策略。骗子知道哪一方面能够赢,以及要赢所需要 采用的策略。而这些, 受骗者肯定是不知道的。 棋手的策略应该遵循这样的原则:如果有一步棋能走到节点为W的棋局,那么就应当走这 步棋;如果所有的棋步都通向节点为l的棋局,那么就只好放弃这盘棋认输。其他情况下 ,就要走到标为d的节点。 对手采取的策略正好相反:如果有一步棋能走到节点标为l的棋局,那么就下这步棋,如 果所有的棋步都通向节点为w的棋局,那就只有放弃认输。其他情况下,就要走到标为d的 节点。 当有两条以上的路径都能通往l节点,或者有两条以上的路径通往d节点时,棋手所采取的 策略就不再是决定性的了。在实际对弈中,棋手总是想选择w节点,达到了w节点,就使得 往后的对弈过程变得简单了。这样做就能减少棋手失误以致失去优势的机会。基于同样的 理由,棋手在达不到节 点时,应该选择d节点。这样就可以导致最复杂的情况产生。希望对手在这种情况下失误 以便使自己重新得到优势。到现在为止,我们的讨论还是很不充分的。因为在所有的w节 点或者所有的l节点之间,我们并没有给出任何差别。

文章TAG:博弈  博弈树  搜索  与或树  博弈树  
下一篇