多模态：图像分割SAM

原创

已于 2024-02-04 14:51:46 修改 · 3.5k 阅读

标签

#人工智能 #深度学习 #AIGC #计算机视觉 #图像处理

收录于

于 2024-02-01 18:10:32 首次发布

文章目录

前言
一、SAM基础架构
二、数据引擎
三、数据工程
总结

前言

图像生成领域爆发性的技术增长让传统计算机视觉技术再次崛起，如目标检测，图像分割，这些技术引入图像生成相关技术的pipeline中，可以设计出更多创新性的算法。而这些基础技术也有了一些大模型，如目标检测的GroundingDINO，图像分割的SAM（segment anything model）。本文主要对SAM进行介绍。SAM是一个交互式分割模型，可以根据提示词对目标进行分割。可有效解决通常自然图像的下游分割任务。
paper：https://arxiv.org/abs/2304.02643
github：https://github.com/facebookresearch/segment-anything/tree/main