美高梅mgm1888(中国)有限公司-baidu百科

博弈论：现代商业致胜的思想利器——记王铮副教授的一堂公开课

作者：庞海时间：2013-06-17 点击数：责任编辑：

博弈论：现代商业致胜的思想利器——记王铮副教授的一堂公开课

发布人:庞海来源部门:国际贸易系浏览人次:

次发布时间:2013年6月17日

当下，无论是在人们的工作、生活还是学习中，“博弈”已成为经常使用的高频词。而大多数人对于“博弈”的理解与使用仍然局限于竞争环境中，甚至直接将其作为竞争的同义词。事实上，在现代的商业环境中，对于竞争的过分强调会使人误入歧途，如果一个企业家始终固守“商场如战场”的信念，他就有可能错失与其他企业合作双赢的良机。要在市场经济中获得成功，必须对竞争和合作都有深刻的理解。“竞合”无疑已成为现代商业哲学的一个重要组成部分，是最终获得商业成功的不二法门。战争博弈是“零和博弈”，对于经济学家和企业家而言，最有意义的博弈是“非零和博弈”（合作博弈），只有“非零和博弈”才会产生双赢的结果。

案例导入——了解博弈论的基本思想

王教授首先利用案例讨论与讲解帮助学生建立对博弈论的感性认识。“制药公司的销售大战”案例主要介绍了美国制药公司间通过大量招聘推销员而展开的推销大战，医院的医生经常会碰到同一家医药公司的多位推销员重复上门推销同样的药品的情况。因为每一家制药企业都相信：只要推销员与医生推销一种药越频繁，医生就越有可能多开药。尽管宏大的销售员队伍使得制药公司的成本居高不下，也没有一家公司愿意通过削减销售员队伍来降低成本。这一案例即是博弈论中著名案例—“囚徒困境”在现代商业中的真实再现。在每一家公司都从自身利益出发考虑自己的策略的情况下，大家都不可能实现利益最大化。“囚徒困境”博弈的这一结论也构成了对亚当•斯密每个人都从私利出发就一定会导致社会的经济效益最大化这一经典理论的最有力的质疑。

以互动为基础建立动态战略——博弈论的基本理论模型

博弈论的核心思维在于互动，它要求每一位参与者都要做到从对方的立场想问题，在考虑对方可能的行为的基础上采取有利于自己的行动，根本上讲这是一种在与竞争者的互动中确定自身最佳策略、建立自身动态竞争优势的过程。扩展式博弈是博弈论的一个基本模型，逆向归纳法是对这一博弈模型的求解方法，也是制定相应的商业战略的一个基本思维。以商业进入博弈为例，小镇原有一家咖啡馆，你计划在小镇上开设第二家咖啡馆，但却受到了原咖啡馆主的威胁：如果进入，就采取严厉的价格战，使你无利可图。尽管他也将因此蒙受损失，但对你会形成更加致命的打击。你该如何行动？显然，一个理性的新到者不应全然不理会任何威胁，但也不应该盲目相信任一威胁。假设你清楚他可能采取的行动，也了解到如果你进入他采取价格战策略，他的收益为0，而不进行价格战的收益为100,000（见图1），显然，如果你相信对方是理性的话，一定不会采取价格战的策略，他的威胁就是不可置信的威胁，你也就应该不理会威胁而在小镇开设第二家咖啡馆。

“囚徒困境”（prisoners’ dilemma）博弈模型是博弈论的一个著名案例。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果两个犯罪嫌疑人都坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪，各被判刑8年；如果只有一个犯罪嫌疑人坦白，另一个人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。表1给出了这个博弈的支付矩阵

表1 囚徒困境博弈（Prisoner's dilemma）

A╲B坦白抵赖

坦白-8，-80，-10

抵赖-10，0-1，-1

我们来看看这个博弈可预测的均衡是什么。对A来说，尽管他不知道B作何选择，但他知道无论B选择什么，他选择“坦白”总是最优的。显然，根据对称性，B也会选择“坦白”，结果是两人都被判刑8年。但是，倘若他们都选择“抵赖”，每人只被判刑1年。在表2.2中的四种行动选择组合中，（抵赖、抵赖）是帕累托最优的，因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出，“坦白”是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占优战略均衡。这个案例所揭示的是个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们可以例举出许多类似于“囚徒的两难处境”这样的例子，如价格战、军奋竞赛、污染等等。

上述“囚徒困境”实际上是一个典型的标准式博弈（策略式博弈），这一博弈模型可以最终求解出纯策略的纳什均衡。但有一类情形，尽管可以构建标准式博弈，但却没有纯策略的纳什均衡，监督博弈即是这样一种类型的博弈。假设你和你的员工是这个博弈的参与者，你有两个选择：视察和不视察，员工也有两个选择：勤奋和偷懒。你们的选择导致的收益由表2给出：

雇主/员工勤奋偷懒

视察270，150-60，0

不视察330，150-270，270

这个博弈没有纯策略的纳什均衡。如果你选择视察，则员工会选择勤奋。但如果员工选择勤奋，你就不必去视察。但是如果你不视察，员工会偷懒。而如果员工偷懒，你就应该视察。最终又回到了起点。对于这一模型我们可以尝试寻找混合策略的纳什均衡。求解的过程不甚重要，最终的结果却着实有着一定的参考价值。结论是，如果员工勤奋的概率高于7/9，雇主最好不视察；如果员工勤奋的概率小于7/9，雇主最好去视察。运用到实际管理中，如果你的员工都比较勤奋、自觉，作为管理者就可以考虑少视察甚至不视察。

建立机制达成合作—理解博弈论的精髓

在现代商业中，比在互动的基础上建立动态竞争战略更为重要的是通过建立机制来达成与商业对手的合作，与商业对手形成既有竞争又有合作的关系。在此之前的分析中主要采用的都是非合作的观点，而事实上，如何找到在不改变博弈参与者自利性的前提下，帮助博弈参与者找到实现合作双赢的策略更为重要。仍以囚徒困境为例，每个参与者选择他们的占优策略，但最终导致了一个集体劣势的结果。恶性价格竞争就是这样一个例子。有没有办法摆脱这个困境呢？根据博弈论的重复博弈模型，答案是有可能的。这要求企业必须从长远的观点来考虑问题，以长远的眼光来审视企业之间的关系。如果这两个企业在未来的许多时期共存，每个企业今天的合作行为会受到另一家企业明天的回应，而每个企业今天的机会主义行为会受到另一家企业明天的惩罚。这样的话，即使每家企业都是自利的，即使企业不能够直接地同谋，他们还是可能达成合作。当囚徒困境博弈重复无限多次，双方参与者足够耐心时，在均衡中维持长期合作是完全可能的。这个结论是非常直观的，只要你的对手在过去是合作的，你就通过合作奖赏他。然而，如果合作曾经破裂，你将永远或者阶段性地转到非合作策略。

百思买的最低价格保证条款也是通过机制设计来达成合作的一个典型案例。美国家用电器零售商巨头百思买（Best Buy）近年来业绩出众，业绩自然归功于各方面的原因，但它采用最低价格保证条款防止与对手展开价格战的策略确实是其中一个很重要的原因。根据该政策，如果顾客在百思买购买某产品后发现其它商店同样产品的价格更低，百思买将偿付顾客价格差价。百思买的这一策略不仅是给消费者看的，主要是给它的竞争对手看的。对手知道这一策略后，对手采取降价策略并不能有效地争取更大的市场份额，相反会令对手得到更大的市场份额，降价就不是一个有效的市场策略。通过这一策略，百思买实际上与对手达成了默契合谋，避免了无益的价格战，这是一个真正的双赢格局。