姿态估计Bottom-up系列中的Grouping方式三:PersonLab

原文:PersonLab: Person Pose Estimation and Instance Segmentation with a Bottom-Up, Part-Based, Geometric Embedding Model
代码:octiapp/KerasPersonLab


Abstract


Introduction


Related work


Methods

Person detection and pose estimation

文章提出了一种box-free的bottom-up的姿态估计方法。方法包含连续的两步:

  1. 检测K个关键点。
  2. 把他们聚类成人体实例。
    在这里插入图片描述

Keypoint detection

这个阶段的目的是,以实例无关的方式检测出所有人的所有可见关节点。文章生成heatmaps和offsets。对于heatmap,每一个关节一个通道;对于offset,每一个关节两个通道分别表示水平和垂直方向。

假设 x i x_i xi 是图片中的一个2D位置,其中 i = 1 , . . . , N i = 1,...,N i=1,...,N 是图中坐标的索引, N N N 是像素的个数。假设 D R ( y ) = { x : ∥ x − y ∥ ≤ R } D_R(y) = \{x:\left \| x-y \right \| \leq R\} DR(y)={ x:xyR} 是以 y y y 为中心的半径为 R R R 的圆盘。假设 y j , k y_{j,k} yj,k 是第j个人体实例的第k个关键点, j = 1 , . . . , M j = 1,...,M j=1,...,M,其中 M M M 是图中人体实例的个数。

对于每一类关键点 k = 1 , . . . , K k = 1,...,K k=1,...,K, 我们设置一个分类任务,我们为所有人体实例预测一个heatmap p k p_k pk, p k ( x ) = 1 p_k(x) = 1 pk(x)=1 如果 x ∈ D R ( y j , k ) x \in D_R(y_j,k) xDR(yj,k),否则 p k ( x ) = 0 p_k(x) = 0 pk(x)=0,因此我们有K个独立的稠密二分类任务,每个任务对于一个关键点类别。每个都相当于预测图像中所有人的特定关键点类型周围半径为 R R R 的圆盘。训练时,我们使用 logistic loss 来计算整张图片的 heatmap loss,并回传。除了图片中没有被完全标注好的区域(如拥挤场景,小尺寸的人体实例等)。

除了heatmaps,我们还预测了一个 short-range offset 向量 S k ( x ) S_k(x) Sk(x), 用来提高关键点定位的精度。对于每个关键点类别 k k k,在关键点的圆盘内的每个位置 x x x ,short-range offset S k ( x ) = y j , k − x S_k(x) = y_{j,k} - x

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值