论文梳理（图像标注）

最新推荐文章于 2026-05-07 17:43:52 发布

原创最新推荐文章于 2026-05-07 17:43:52 发布 · 1.9k 阅读

10 ·

本内容遵循CC 4.0 BY-SA版权协议

论文专栏收录该内容

10 篇文章

订阅专栏

自动图像标注是图像语义理解的关键，旨在为无标注图像添加语义关键词。该技术涉及计算机视觉、机器学习和信息检索，主要方法包括基于全局特征和基于区域划分的标注。现有的挑战在于解决低层视觉特征与高层语义之间的语义鸿沟。自动图像标注在图像检索、个人照片管理和互联网广告等领域有广泛应用。

自动图像标注总述：

是图像语义理解的热点，是无标注图像内容的语义关键词
属于图像检索领域，是图像语义检索（相当成熟）关键
涉及计算机视觉，机器学习，信息检索
总实现思路：用（已标注图像集）或关联，映射关系（可获信息自动学习语义空间与视觉特征空间）。预测未知图像标注。

现实现方法：

基于分类的标注，概率关联标注，图学习的标注

题目：自动图像标注技术研究进展

搜索源：知网
关键词：自动图像标注; 多示例学习; 多标记学习; 图学习; 概率建模;

摘要

自动图像标注（AIA）：是图像语义理解的热点，是无标注图像内容的语义关键词
思想：用（已标注图像集）或关联，映射关系（可获信息自动学习语义空间与视觉特征空间）。预测未知图像标注。
现实现的方法：基于分类的标注，概率关联标注，图学习的标注
基于全局特征，基于区域划分

0 引言

基于内容的图像检索，瓶颈，巨大挑战（语义鸿沟：低层视觉特征，颜色纹理形状，不能完全匹配用户查询信息）
基于语义的图像检索，仍旧是难题
为什么出现了 AIA：用户喜好关键词查询，互联网搜索引擎基于文本的图像检索，人工标注费时费力
AIA：解决语义鸿沟（高层语义，底层特征间联系）
现有算法：在图像级别实现关键词标注，未建立一一对应关系（图像和关键词之间），
标准方法：标注，区域命名
不同角度分析标注：
图像特征表示机制：图像全局视觉信息，基于区域划分

图像全局视觉信息：面向图像场景语义，图像特征，文本标注词完全分离，纯视觉比较图像相似性，有监督
已经标注图像（图像特征，标注词间关系），标注（比较视觉特征，传播标注词）
图像划分若干同质区域，图像子块。基于区域划分（主流），图像语义标注。图像分割算法，有效划分语义对象单元。

本文：

基于全局特征，基于区域划分（根据特征提取，表示机制的不同）
其中，基于区域划分：分类的标注算法，概率关联模型的标注方法，基于图学习的标注方法（学习算法不同）

1 基于全局特征的自动图像标注方法

早期：相当于图像场景的自动分类

ova：面向图像场景语义（图像空间属性，产生现实场景有意义描述，验证全局统计特征，分析场景的对象存在与否），免去（图像分割）
面向显著兴趣点：显著区域的局部描述子向量空间，通过相似图像传播语义实现自动标注
Yav sk：单纯用（图像全局特征）语义标注，建模框架（鲁棒的非参数密度估计法），核平滑技术–>用全局的颜色信息可以标注性能。分割方法硬划分

优点：