这章似乎开始进行数学抽象了
单参数环境 在单参数环境中,有个智能体,每个智能体
都对单个物品有非负的估值,此估值为私人信息,记作
。最后,有一个可行集
。
中的每个元素
都是
维向量
,其中
表示智能体
获得的物品数量。
(单参数环境为什么叫单参数环境呢,查了些资料,感觉比较贴合语境的说法如下: 一种简化的博弈环境,其中所有参与者的策略选择只依赖于一个关键参数或变量,如这里对物品的估值。到现在为止还是没感出本书侧重是算法还是博弈论TT,再次吐槽概念的引入毫无铺垫,越发像是本讲义了)
(维向量
是某种可能的分配方案,可行集
可理解为所有可能的分配方案的集合),下面是几个例子:
- 单物品拍卖 可行集
是满足
(总分配量不超过1)的0-1向量
所组成的集合,
- k物品拍卖 有
个相同物品进行拍卖,并且每个竞拍者最多获得其中一个。那么可行集
就是满足
(总分配量不超过
)的0-1向量
所组成的集合
- 关键字搜索拍卖 一个竞拍者最多获得一个广告位,并且一个广告位最多分配给一个竞拍者,如果竞拍者
得到了广告为
,那么
的
分量就等于其获得的广告位的点击率
。(我的第一直觉这种情况下,
应该是广告位的一个排列组合,不过显然用点击率来代表
的分量给未来分析计算会带来很大的方便)
- 公共项目决策 决定是否修建一个供所有人共享的公共项目,比如一座桥。其可以被建模为可行集
(建了就是给所有人分配了,不建就所有人都不分配)
二价拍卖需要完成以下步骤:
- 收集所有智能体的出价
,称为出价向量或出价组合
- 【分配规则】选择一个可行的分配


1446

被折叠的 条评论
为什么被折叠?



