项目文件位置:
CenterFace-master/prj-tensorrt/demo.py
【问题】在用这个demo.py跑视频检测的时候,遇到了显存溢出的问题,如下:

结果38s的视频运行完就只有20多s了,后面部分因为显存溢出的原因没有继续进行检测。
问题出现在创建engine context上,源代码每读取一帧,对这一帧图像进行检测的时候,都创建了一次engine context,就会消耗一定的内存。其实创建上下文只需要进行一次即可。
对tensorrt engine不了解的建议看下官方文档:https://docs.nvidia.com/deeplearning/tensorrt/developer-guide/index.html#build_engine_python
【解决办法】将源代码中创建engine context的两行代码移至__init__函数中,就只会执行一次。
源代码:
engine = self.net
context = engine.create_execution_context()

在使用TensorRT优化CenterFace进行视频检测时,遇到显存溢出导致视频处理中断的问题。原因为每帧图像检测时都创建新的engine context。通过将创建engine context的代码移至初始化函数,确保只执行一次,成功解决了问题。

1万+

被折叠的 条评论
为什么被折叠?



