谷歌开源MobileNets：在移动设备上高效运行的计算机视觉模型

最新推荐文章于 2026-05-05 09:13:16 发布

转载最新推荐文章于 2026-05-05 09:13:16 发布 · 1.3k 阅读

TensorFlow 专栏收录该内容

43 篇文章

订阅专栏

谷歌发布了一组名为MobileNets的计算机视觉模型，专为移动端设计。这些模型可在脱机状态下高效运行，并针对资源受限环境进行了优化。

DCT-Net 人像卡通化模型GPU镜像

图片生成

AI应用

PyTorch

用户输入一张人物图像，实现端到端全图卡通化转换，生成二次元虚拟形象，返回卡通化后的结果图像。

吴唯编译自 Google Research Blog
量子位出品 | 公众号 QbitAI

今早谷歌在自家的科研博客上发文，宣布开源MobileNets——一组移动端优先的计算机视觉模型。通过TensorFlow Mobile，这些模型可以在脱机状态下在移动设备上高效运行。

量子位将原文编译如下：

近几年来，伴随着神经网络不断将视觉识别技术向前推进，深度学习已经为计算机视觉领域的进步贡献了太多太多。而这其中的许多技术，包括对物体、地标、logo和文本的识别等，都是通过云视觉API在联网设备上实现的。

但我们相信，移动设备计算力的不断提升，将可能让用户在脱机状态下随时、随地地接触到这些技术。然而，在设备端和嵌入式应用上的视觉识别面临着诸多挑战——在资源受限的环境下，这些模型必须利用有限的计算力、能耗和空间来保证运行的速度与精确度。

今天我们很高兴地宣布开放MobileNets，一个为TensorFlow所准备、移动端优先的计算机视觉模型包，其设计考虑了设备端和嵌入式应用上首先的资源，力图最大化地提升精确度。MobileNets具有小规模、低延迟、低功耗的特点，为多种不同应用案例中的资源限制进行了参数化设计。和Inception这类主流的大型模型一样，这些模型同样可以用于分类、检测、嵌入、分割等任务。