在博弈论中,类似问题,有相亲问题、见好就收、苏丹嫁妆问题、挑剔的求婚者问题等 。首先通俗解下类似问题:相亲问题,售房问题。
相亲问题描述如下:
假如一个非常优秀的人相亲,已知追求的他的人有有限个,例如10位,并且根据个人的评价,给这10个人给予了综合打分。现在规定,交往中他不能脚踏两只船,即不能同时和两个人交往,如果在交往之后他没有接受这个人,那么,以后也没有机会再选择这个人作为对象。然后接着和下一个人交往。
这个问题可以看出,无论什么时候选择都会面临很多不确定性,比如无法预知是否错过了最优秀的人选,或者在选择后,后面会不会有更好的人选。那么,他随机和这些人交往,在和第几个人交往时,他能选择到最优秀的人作为对象呢,即何时停止交往可以使他选择到最优秀的人最为对象呢?
下面是停止规则的一般归纳,它是通过两个对象来定义的:
(1)一系列随机变量X1,X2,…,它们的联合分布规律是已知的,
(2)一系列奖励函数Y0,Y(X1),Y(X1,X2),…
在考虑这两个对象时,你可以一直观察随机变量X1,X2… 在观察变量Xn时,你可能会选择停止,这个时候你获得的奖励是函数Yn(X1,X2,X3…,Xn),当然这个函数值也可能是负数,比如女青年相求问题,加入相亲了N个人(N很大),那么她会经历从“剩斗士”到“必剩客”再到“齐天大剩”的过程,想想,还是很吃亏的(不仅木有回报,并且逝去了最美丽的年华)~~你也可能是持续观察下一次的过程,记为N 趋于无穷大,那么这时候也有一个对应的回报函数值。现在要解决的问题是,在何时停止观察随机变量x,可以是我们的回报函数值最大。
这里给出了理想的情况下,如何求解经典秘书问题:
问题描述:要聘请一名秘书,

本文介绍了最优停止理论中的经典秘书问题,探讨如何在有限的面试者中以最大概率选择到最优秀的人选。通过策略分析,指出在面试前36%的人后选择下一个最优秀者的方法能最大化选到最佳秘书的概率。当面试人数趋向无穷大时,这一概率接近0.368。

5467

被折叠的 条评论
为什么被折叠?



