VoTT是微软发布的用于图像目标检测的标注工具,它是基于javascript开发的,因此可以跨Windows和Linux平台运行,并且支持从图片和视频读取。此外,其还提供了基于CNTK训练的faster-rcnn模型进行自动标注然后人工矫正的方式,这样大大减轻了标注所需的工作量。
github地址:https://github.com/Microsoft/VoTT/
它最主要的三大特性:
- 能够标注图像,也能支持从单独视频中标志。
- 使用Camshift跟踪算法对视频中的对象进行计算机辅助标记和跟踪,不用每一帧每一帧的标注。
- 能够导出CNTK、tesnorflow(VOC)和YOLO等各种格式的标注数据用于训练。
我用最简单的安装方式,使用预编译的包,可以点此下载
双击VoTT.exe运行

Frame Extraction Rate: 每秒钟从视频中提取多少张图片。比如一段帧率为30帧每秒的视频,如果此处设为1,就是每隔30帧标注一张
Tagging Region Type: 标注区域的类型,有Rectangle和Square可选
Suggested Region Method: 可选(1)Tracking: 用camshift 来预测下一帧标注的位置。(2)Co

VoTT是微软发布的一款基于javascript的图像和视频标注工具,支持跨平台运行,具备自动标注与人工校正功能,大幅减少工作量。采用Camshift跟踪算法简化视频标注流程,能导出多种格式数据用于模型训练。

3519

被折叠的 条评论
为什么被折叠?



