菜鸟踩坑记录

在复现CMX的代码的时候遇到了这个问题。后面就百度发现很多人都说是标签的问题。然后我发现确实是我没有读取到标签转换后的路径,然后改完路径之后发现,又又又又出现了这个问题,我人都懵了,一直找不到答案。因为我检查过标签没问题啊。然后我发现 在代码中加了os.environ['CUDA_LAUNCH_BLOCKING'] = '1'之后,他就能详细打印出来错误了!!!!!

非常长的错误报出来,都是这个问题,Assertion `t >= 0 && t < n_classes` failed,然后我百度了一下发现是损失函数哪里报错了,他有其他除了255和类别之外的标签值,然后我确认了所有训练集图片,发现都是对的。然后读取时也使用numpy.unique(label)发现没有问题,但是在minibatch加载时出现了254这个标签值,百思不得其解,然后!我发现代码有一个操作是gt-1 我真的气死,它把255也-1了!!!!!后来终于改好了!!!!
作者在复现CMX代码时遇到标签问题,通过网络搜索发现可能是标签路径问题和损失函数中的异常标签值(如254)。通过设置CUDA_LAUNCH_BLOCKING环境变量,作者得以获取详细错误信息,最终发现是代码中一个将255减1的操作导致的。

1万+

被折叠的 条评论
为什么被折叠?



