教育领域分类器优化与知识构建教学法研究
1. 鲁棒对话行为分类器研究
1.1 模型训练与损失函数
在对话行为分类器(DA 分类器)的训练中,为了使用替代 AUC 损失来训练模型,在第 4 阶段(P4)会对 sigmoid 结果进行处理。以 FP 类为例,其替代损失计算如下:
[AUC(FP) = E[(m - \sigma(z_{FP}) + \sigma (z’ {FP}))^2]]
其中,(\sigma(z {FP})) 表示标记为 FP 的句子的预测概率,(\sigma(z’_{FP})) 表示未标记为 FP 的句子的预测概率。通常,边际 (m) 设置为 1,其作用是区分 FP 类的正确和错误预测,使两者更易区分。在第 5 阶段(P5),会收集并汇总 K 个类别的 AUC 损失,然后进行反向传播,以调整 BERT 编码器参数 (\theta) 和依赖于类别的线性分类器参数 (\omega)。不断重复此过程,直到无法再改进,从而获得用于 DA 分类的最优 DA 分类器。
1.2 研究设置
为评估 AUC 最大化方法在 DA 分类中的有效性,研究在两种场景下进行:
- 低资源场景 :模拟实验中,从完整训练集中随机抽取不同大小的训练集({25, 50, 100, 200, 400, 800}),以研究 AUC 方法与传统交叉熵(CE)方法在多类 DA 分类中的性能差异。对每个训练集大小,在 10 个随机训练分区上训练由 AUC 最大化方法和 CE 基线优化的 DA 分类器,并分析其平均性能。
- 不平衡场景 :模拟两
超级会员免费看
订阅专栏 解锁全文

235

被折叠的 条评论
为什么被折叠?



