高考零分作文|本手、妙手和俗手
文/新江湖
文/新江湖
本手,妙手,俗手来自于围棋。围棋是个零和博弈的游戏,参与的双方利益取得是以对方的利益损失为代价。参与方博弈的结果只有一输一赢。
本手就是在规则允许下,双方利益均衡的一种策略。
在围棋中最常见的本手就是围棋定式,双方的每一步都是利益均衡的策略。一方取得实地,一方取得厚势,一方着重眼前利益,一方看重未来收益。守住本分,即为本手。
围棋的奥妙在于,棋盘上有361个点,是个奇数。假如双方每一步都是本手,最终的结局也会出现因为先手得利一方获胜,或因先手方贴目而失利。
所以在信息充分透明的情况下,(因为棋盘上的局势,大家都有目共睹。)双方都要下出妙手,而让自己获得更大的利益。
所以,妙手就是打破均衡状态下的一种追求已方利益最大化的策略,即损人利己的策略。
妙手就如同站在紫禁之巅的叶孤城和西门吹雪这两位高手决战时,西门吹雪的一招妙手,把叶孤城一剑封喉。
而俗手是相对本手和妙手而言,俗手可能是局部的本手,但放到全局来看就是全局利益最小化的策略。是落入俗套的策略。有时被讥笑为俗不可耐。
妙手和俗手的成立是以时间为条件,往往呈现出滞后性。
落子时,旁观者无法察觉这招是俗手,或许当局者也未必知道这招是妙手或是俗手。只有随着时间推移和事实的检验,妙手和俗手才会显现出来。
妙手和俗手是以对方的应对为前提,对方假如应对本手或者俗手,则已方的妙手会越快凸显出来。
假如对方应对出更好的妙手,则已方的妙手可能会黯然失色成为本手或俗手。
在阿尔法狗和柯洁的对战中。阿尔法狗下出了第133手的妙手。让本已经大局优势的柯洁瞬间瓦解。
在阿尔法狗下出133之前,柯洁作为对局者眼中好像已经放出光来,似乎已经看到了通向胜利的道路。
在激烈的劫争中,阿尔法狗下出了133挤的妙手,确保劫材多一个。
也就是随着133凌空一挤,柯洁先是一愣,然后陷入了大长考,眼中的光辉也逐渐暗淡。
也就是这着133妙手,令我们看清其实这个劫白棋打不过,人类只能再一次感慨***阿尔法狗的计算实在太深远。
在阿尔法狗与李世石的第4局中,出现了令人惊异的情况。
李世石在劣势下弈出的“神之一手”令机器判断失据,随后“阿尔法围棋”像是发疯似的下出一连串莫名其妙的俗手和自杀式损招,局势瞬间逆转。
李世石终于在先输3局之后在第4局顽强逼出机器的失误,取得宝贵一胜。
围棋是零和博弈,毕竟现实生活中,人与人之间,企业之间,国家之间更多的是正和博弈。是以双赢或共赢为目标。
在正和博弈下,本手,妙手,俗手又是怎样的呢?我们以囚徒困境为例来看看。
两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;
若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑两年。
由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。
假如两个罪犯事先沟通,在相互信任的前提下,他们的妙手(最佳策略)是:选择沉默。结果是:都是一年监禁。
假如两个罪犯无法事先沟通,信息不透明,无法形成互信的前提下,他们各自(局部)的最佳策略是:选择揭发。
因为思考的逻辑是:
1、假如我选择沉默但对方选择揭发。则我获得五年监禁的最坏后果,而对方则是无罪释放。这是我的俗手。
2、假如我选择沉默,对方也选择沉默。则双方可以获得监禁一年。这是次妙手。
3、假如我选择揭发,对方选择沉默,则我可以获得无罪释放。这是我的妙手。
4、假如我选择揭发,对方也选择揭发,大不了大家一起监禁二年。这是我的本手。
假设俗手的收益值是-1,本手的收益值是0,次妙手的收益值是+1,妙手的收益值是+2;
则选择沉默的收益值=0.5*(-1+1)=0。
则选择揭发的收益值=0.5*(2+0)=1。
所以两个罪犯都会选择各自局部的所谓妙手:揭发。而这个局部妙手确实全局的俗手。
在零和博弈中,取胜的关键是妙手。俗手会加快落败的可能。即使是招招本手,也不能保证利益最大化。
在正和博弈中,双赢和共赢的关键是信任,局部的妙手有可能是全局的俗手。因为你的妙手获得局部利益最大化只是个幻像,如同镜花水月一样。
只有使双方的利益最大化的策略才是最大的妙手,哪怕它是局部的俗手,也未可知呢。
............试读结束............
查阅全文加微信:3231169 如来写作网:gw.rulaixiezuo.com(可搜索其他更多资料) 本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3231169@qq.com 举报,一经查实,本站将立刻删除。如若转载,请注明出处:https://www.rlxzw.com/60456.html