赛题简介:https://blog.csdn.net/qqMiSa/article/details/109264698,除此之外决赛还新增了一个ASR题,由于ASR了解不多,赛程时间短,基本只是采用了https://github.com/Z-yq/TensorflowASR中的开源实现
一点总结:
我们建模方案与其他团队不同,A榜在我们之前的队伍大多使用BERT滑窗分类进行平均建模输出的base,这类队伍在B榜名次下滑严重。
bert在处理长文本上做滑窗存在两个缺点:
1. 滑窗文本标签引入大量噪声
2. 滑窗文本关注局部,丢失大量全局信息
B榜在我们之前的团队几乎都使用了传统特征结合建模的方式(哈哈我们也想用来着,但是队友之间建模沟通出现了失误后面没时间做了),多特征构造在帮助模型捕捉全局信息上增益很大,且稳健性强。
如果想要进一步刷分,还是应该进一步通过构建文本特征加入stacking做模型融合的方式。













博客分享了AI质检竞赛相关内容,给出开源代码和赛题简介链接,决赛新增ASR题采用开源实现。总结建模方案,指出A榜前列用BERT滑窗分类有引入噪声、丢失全局信息的缺点,B榜前列用传统特征结合建模增益大、稳健性强,还建议构建文本特征做模型融合刷分。

1451

被折叠的 条评论
为什么被折叠?



