高速机器视觉已超越以相机为核心的思维。随着索尼新一代 Pregius S 传感器将 100GigE 性能带入更广泛的工业应用,真正的挑战已转向系统架构——如何在没有瓶颈的情况下,将海量图像流从相机传输至主机、GPU 和存储设备。本文阐述了优化的零拷贝 GVSP、GigE Vision 3.0/RDMA,以及 eSDK Pro 和 eCapture Pro 等软件工具如何构建可扩展、面向生产环境的处理流水线。
瓶颈不再存在于相机内部,而是整个系统
大多数机器视觉工程师都能准确判断系统何时出现问题。但他们往往无法解释原因——因为从相机指标看一切正常,接口也以满带宽运行,硬件规格按说绰绰有余。在越来越多的高速部署场景中,答案是:问题从来不在他们一直关注的地方。一台现代工业相机每秒产生的数据,比十年前整个机器视觉系统能处理的数据还要多。如今,多相机系统中常见的数据聚合速率已达到每秒数十GB,而具备这种能力的传感器已不再稀奇或昂贵。瓶颈已经转移,它不再位于相机内部。
这一转变不仅仅是技术上的新奇之处。它改变了工程投入的方向、系统集成商所需的技能,以及哪些供应商真正有经验来交付可靠的方案。图像处理正越来越多地从基于CPU的架构转向GPU加速流水线,并常与靠近传感器的边缘计算相结合。在这种环境下,采集图像已成为最简单的部分。系统成败的关键在于如何处理数据。
过去十年间,CMOS传感器技术以惊人的速度发展。尤其是索尼,凭借其Pregius和Pregius S平台推动了许多技术进步,这些平台已成为现代工业成像的基石。更高的分辨率、更优的灵敏度以及持续提升的帧率,为几年前仍难以甚至无法实现的应用打开了大门。但正是这一进步,从根本上改变了成像系统真正工程挑战的所在。在很长一段时间里,高性能机器视觉的主要瓶颈要么是传感器本身,要么是用于将图像数据传输到主机系统的相机接口。而今天,情况已不再是如此。现代传感器能够产生巨大的数据流,而100GigE等高带宽接口也完全有能力传输这些数据。真正的挑战,始于图像数据离开相机之后。

100GigE相机系统的配置:利用标准以太网组件实现扩展
当PPT成为现实
近几个月来,几家相机制造商终于开始推出他们的首款100GigE相机——这些平台在过去多年里大多只存在于产品路线图和演示幻灯片中。这些产品的逐步面市,对机器视觉行业来说是重要的一步。高速以太网成像为那些以前需要专用且昂贵的硬件接口的应用打开了大门,同时也使机器视觉系统能够向现代数据中心架构靠拢,从而获得其带来的所有灵活性和可扩展性。
在当前的这一波发布热潮中,人们很容易忽略一点:高带宽以太网成像本身并非新鲜事物。Emergent Vision Technologies在十二年前就推出了首款10GigE相机,八年前推出了25GigE相机,而基于Gpixel传感器的100GigE相机问世也超过了六年。从一开始,这些平台就针对那些传统机器视觉架构会迅速达到极限的应用而设计:大规模多相机检测系统、容积捕捉工作室、科学成像平台,以及高速运动分析装置——这些场景中的相机数量不是个位数,而是数十台。在超过十年的时间里,这些环境中的实践工作得出了一个直截了当的观察结论:相机本身很少是真正的瓶颈。决定性的因素几乎总是其背后的系统架构。
这一观察并非抽象理论。最近的一个客户部署案例使其变得具体。一家食品加工行业的制造商需要一套基于AI的自动光学检测系统,该系统需同时运行多达21台相机,所有图像数据通过单一网络交换机路由至配备三块GPU的单台主机。客户自己的AI推理代码直接在该硬件上运行,实时处理全部相机数据流,且不允许丢帧或处理延迟。在过去两年多时间里,该客户一直尝试用某家全球最大的机器视觉制造商之一的相机来实现这一架构。该硬件在纸面上规格足够。然而在实际中,系统无法在所需相机数量下维持稳定运行。在GPU流水线成为限制因素之前,标准GVSP实现带来的CPU开销早已使主机过载。丢帧、延迟不一致、AI推理结果不可靠。当Emergent介入后,完整的21相机系统就在同一台主机上稳定运行起来——采用10GigE相机,配合优化的GVSP驱动栈,以及基于eCapture Pro(Emergent的实时多相机采集与处理软件,提供用于系统设置、监控和数据处理的可视化用户界面)的交钥匙方案。客户的AI推理代码作为自定义插件集成在此框架内,从而能够直接处理传入的图像流,无需额外的数据处理开销。这避免了从头构建采集、可视化和运行时基础设施的大部分工作,并显著缩短了系统进入稳定运行所需的时间。三块GPU终于各司其职:运行客户的AI代码,而不是与网络协议栈争抢CPU周期。相机从来不是问题所在——数据流水线才是。
索尼传感器扩展100GigE平台
迄今为止,Emergent所有的100GigE面阵和线阵相机平台都基于Gpixel的传感器系列,该系列已被证明在高速成像方面能力出色,并推动了第一代高带宽以太网相机系统的实现。这一演进的下一步,现在正由索尼的新一代传感器驱动。
索尼基于Pregius S第四代技术的CMOS传感器,在紧凑的像元架构内结合了高分辨率、高帧率和更高的灵敏度。这些传感器的像元尺寸从5.48μm到2.74μm不等,在保持工业检测系统所要求的图像质量和效率的同时,实现了显著更高的分辨率。其产品线涵盖从高速中分辨率传感器到超过1亿像素的平台,覆盖了广泛的应用需求。

新一代的首批型号,包括HZ-12000-SB(搭载IMX926)、HZ-25000-SB(搭载IMX925)和HZ-100-SB(搭载IMX927),已投入生产。根据索尼持续的传感器发布路线图,2026年底至2027年初还将有更多相机型号跟进。从系统角度来看,这些传感器所代表的远不止是更高的分辨率数字。在全性能状态下,单台相机每秒可生成数GB的图像数据。在多相机环境中,总数据速率迅速攀升至每秒数十GB甚至数百GB,这使得数据的传输与处理方式比以往任何时候都更为关键。
索尼的路线图还包括这些大画幅传感器的较低帧率版本,例如IMX937和IMX938系列,主要面向需要最高分辨率但不需要全速传感器性能的应用。这些型号提供了额外的设计选择,因为根据应用需求,它们可以与10GigE或25GigE等较低带宽接口搭配,从而在保持高图像质量的同时,实现更具成本效益的系统架构。基于这些传感器的未来相机平台,将补充现有的100GigE产品组合以及成熟的10GigE EROS和25GigE BOLT系列,让系统设计人员在不同应用场景下能够更灵活地平衡分辨率、带宽和整体系统成本。
GVSP挑战及其解决之道
在机器视觉领域,GigE Vision长期以来一直是较低带宽应用下的既定接口标准,涵盖了1、2.5和5GigE的部署。GigE Vision流协议(GVSP)是该标准中负责实际图像数据传输的部分,其吸引力始终如一:标准的网络基础设施、广泛的软件兼容性,以及无专有硬件锁定。Emergent在业内其他公司跟进之前,就已经将GigE Vision推向高速领域超过十年,这也正是为什么扩展到10、25和100GigE所带来的实现挑战,对该公司而言并非全新的领域。
数据路径:挑战在于该协议如何在这些更高带宽下实现。许多集成商最初归咎于CPU利用率的问题,实际上更准确地说是一个内存带宽问题。在传统的GVSP实现中,传入的图像数据要经过多次缓冲区复制。每次复制都会消耗内存带宽,在高数据速率和多个同时传输的相机数据流下,这种累积负载远在CPU本身成为限制因素之前,就会迅速使系统饱和。其结果大家都很熟悉:丢帧、行为不稳定,以及主机系统即使在纸面上看起来CPU利用率尚可的情况下也难以应付。
Emergent从一开始就通过零拷贝GVSP架构解决了这个问题。该实现方式不是将数据通过连续的内存缓冲区进行路由,而是将图像数据通过单次传输直接放置到其最终目的地。这消除了传统方法高达三倍的内存带宽开销,并将CPU交互降至标准要求的最低限度。如图3所示,传统GVSP实现与零拷贝架构之间的差异是巨大的,并且系统中每增加一路相机数据流,这种差异就会变得更加明显。

图3:传统GVSP数据流示意图,展示了多次内存拷贝和基于CPU的帧重建过程,这些操作会增加高速100GigE成像中的系统开销。

图4:优化后的零拷贝GVSP数据流示意图,采用直接DMA方式从网络接口卡传输帧,最大程度减少内存拷贝,并将CPU参与降低至仅处理控制任务。
RDMA与GigE Vision 3.0
该领域的下一个演进方向是即将推出的GigE Vision 3.0标准,它原生支持RDMA(远程直接内存访问)。RDMA在标准层面实现了零拷贝数据传输,允许网络接口将图像数据直接传送到应用程序内存缓冲区,无需中间拷贝,也无需CPU干预每个数据包。在这方面,它解决了与Emergent优化后的GVSP架构多年来相同的内存带宽问题,但使这种方法在整个行业内更易于普及。截至本文发布(2026.06.08)时,该标准预计已正式批准或正处于批准的最终阶段。
对Emergent而言,这并非陌生领域。零拷贝原则从一开始就是公司GVSP实现的核心,这是在高带宽多相机部署中因运营需要而发展出来的——在这些部署中,架构效率低下没有任何容错空间。GigE Vision 3.0现在将这一能力带到更广泛的实现中,而Emergent完全支持这两种方式。话虽如此,RDMA本身也带来了权衡。某些实现会对组播流引入限制,而组播在可扩展的多相机系统中仍然扮演着重要角色。如图4所示,每种传输方式都具有不同的特性,正确的选择取决于完整的系统环境,而不仅仅是带宽数字本身。
特性对比表
| 特性 | 传统 GVSP | 优化 GVSP (Emergent) | RDMA (GigE Vision 3.0) |
| CPU 负载 | 高 | 非常低 | 非常低 |
| 数据拷贝次数 | 1 | 0 | 0 |
| 通用网卡支持 | 是 | 是 | 是(与优化 GVSP 类似) |
| GPUDirect(Linux) | 否 | 是 | 是 |
| GPUDirect(Windows) | 否 | 是 | 否 |
| 组播支持 | 完全支持 | 完全支持 | 不支持 |
| 集成难易度 | 符合标准 | 符合标准 | 符合标准(GigE Vision 3.0) |
| 可扩展性(多相机) | 有限 | 经实践验证 | 取决于具体应用 |
从相机数据流到数据处理流水线
一旦图像数据到达主机系统,真正的工作才刚刚开始。现代高性能成像系统越来越依赖基于GPU的处理流水线来进行检测、重建或AI推理,而将数据从网络接口高效地传输到GPU内存本身就是一个重大的工程挑战。在Windows系统下,GPU Direct等技术允许图像数据以最小的开销从网络接口传输到GPU内存,从而避免了原本会限制吞吐量的CPU瓶颈。
在实际应用中,将这些机制高效地集成到应用程序流水线中并非易事,尤其是在处理多个高带宽数据流时。在多相机环境中,当总数据速率达到每秒数十甚至数百GB时,相机接口、系统内存、GPU处理流水线和存储基础设施之间的集成需要进行仔细的端到端设计。如图5所示,这些架构的规模涵盖了从紧凑的单相机边缘系统,到围绕网络交换机和多个GPU工作站构建的大型多相机装置。这与传统的基于图像采集卡的方法形成了显著对比:基于以太网的系统允许使用标准的网络基础设施进行灵活扩展,而图像采集卡架构则需要为每组相机配备专用硬件,其复杂度和成本也随之相应增长。

图5:基于以太网的可扩展多相机架构与基于传统图像采集卡的系统对比。
经济因素同样不容忽视。在某些高速部署场景中,系统通过简单地增加更多硬件来实现稳定:额外的服务器、专用网络接口、用于分担负载的独立处理节点。这种方法虽然有效,但往往导致架构不必要地复杂且成本高昂。通过从一开始就优化数据传输、降低CPU开销并设计高效的处理流水线,就可以在更少的主机系统内支持数量显著更多的相机。稳定的多相机系统并非需要"一台电脑配一台相机"。经过精心设计的系统能够扩展至数十台相机,同时将硬件需求和运维复杂性控制在合理范围内——而性能、稳定性和成本之间的这种平衡,往往决定了一个高速成像项目是能够成功投入生产,还是停留在概念验证阶段。
为了简化这种集成,像eSDK Pro这样的软件框架——今年早些时候被InVision评为"2026年度十大创新"——提供了包括GPU Direct在内的优化数据通路。这些方法无需进行大量的底层开发,让系统设计人员能够专注于应用逻辑,在构建高性能成像流水线时,免于耗费数百个工程小时在传输、内存处理和接口级优化上。
高速视觉的下一阶段
随着索尼新一代传感器投入量产,以及GigE Vision 3.0将RDMA支持带给更广泛的行业,高速以太网成像正在进入一个新阶段。高性能传感器、高带宽以太网基础设施和现代GPU计算架构正在融合,为大多数系统集成商以前难以企及的应用打开了大门。越来越多的公司将开始探索这一领域,技术本身也将继续快速成熟。
然而,过去十年实际部署的经验一致表明:决定成功与否的很少是相机的规格参数。能够在生产中可靠运行的系统,是那些成像流水线的每一个阶段都充分考虑了完整数据流的系统——从传感器到接口,从接口到主机,从主机内存到GPU,再到存储或输出。那条运行了两年都没有可用解决方案的21相机食品加工线并非特例,而是普遍规律。在高速视觉领域,真正的瓶颈从来不是相机,而是系统架构。而要构建正确的系统架构,需要一份数据手册无法提供的东西:在实际运行条件下、经过大规模真实部署所积累的经验。
携手盈美智,让高速视觉方案落地中国
北京盈美智作为Emergent在中国地区代理商,双方已携手服务了多个国内高速成像与多相机系统应用场景。当100GigE与索尼新一代Pregius S传感器相遇,高速视觉的下一阶段已经开启。北京盈美智,正是您将这一前沿架构在中国市场落地为稳定生产力的可靠伙伴。

510

被折叠的 条评论
为什么被折叠?



