最优停止理论OptimalStoppingTheory经典秘书问题ClassicSecretaryProblem

最新推荐文章于 2024-01-07 16:20:51 发布

原创

最新推荐文章于 2024-01-07 16:20:51 发布 · 1.0k 阅读

标签

#面试 #职场和发展

本文介绍了最优停止理论中的经典秘书问题，探讨如何在有限的面试者中以最大概率选择到最优秀的人选。通过策略分析，指出在面试前36%的人后选择下一个最优秀者的方法能最大化选到最佳秘书的概率。当面试人数趋向无穷大时，这一概率接近0.368。

在博弈论中，类似问题，有相亲问题、见好就收、苏丹嫁妆问题、挑剔的求婚者问题等。首先通俗解下类似问题：相亲问题，售房问题。

相亲问题描述如下：

假如一个非常优秀的人相亲，已知追求的他的人有有限个，例如10位，并且根据个人的评价，给这10个人给予了综合打分。现在规定，交往中他不能脚踏两只船，即不能同时和两个人交往，如果在交往之后他没有接受这个人，那么，以后也没有机会再选择这个人作为对象。然后接着和下一个人交往。

这个问题可以看出，无论什么时候选择都会面临很多不确定性，比如无法预知是否错过了最优秀的人选，或者在选择后，后面会不会有更好的人选。那么，他随机和这些人交往，在和第几个人交往时，他能选择到最优秀的人作为对象呢，即何时停止交往可以使他选择到最优秀的人最为对象呢？

下面是停止规则的一般归纳，它是通过两个对象来定义的：

（1）一系列随机变量X1,X2,…，它们的联合分布规律是已知的，

（2）一系列奖励函数Y0,Y(X1),Y(X1,X2),…

在考虑这两个对象时，你可以一直观察随机变量X1，X2… 在观察变量Xn时，你可能会选择停止，这个时候你获得的奖励是函数Yn(X1,X2,X3…,Xn)，当然这个函数值也可能是负数，比如女青年相求问题，加入相亲了N个人（N很大），那么她会经历从“剩斗士”到“必剩客”再到“齐天大剩”的过程，想想，还是很吃亏的（不仅木有回报，并且逝去了最美丽的年华）~~你也可能是持续观察下一次的过程，记为N 趋于无穷大，那么这时候也有一个对应的回报函数值。现在要解决的问题是，在何时停止观察随机变量x，可以是我们的回报函数值最大。

这里给出了理想的情况下，如何求解经典秘书问题：

问题描述：要聘请一名秘书，