16、教育领域分类器优化与知识构建教学法研究

最新推荐文章于 2026-06-20 11:53:46 发布

原创最新推荐文章于 2026-06-20 11:53:46 发布 · 39 阅读

0 GEO检测

标签

#AUC最大化 #对话行为分类器 #低资源场景

收录于

AI赋能教育的未来专栏收录该内容

99 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

教育领域分类器优化与知识构建教学法研究

1. 鲁棒对话行为分类器研究

1.1 模型训练与损失函数

在对话行为分类器（DA 分类器）的训练中，为了使用替代 AUC 损失来训练模型，在第 4 阶段（P4）会对 sigmoid 结果进行处理。以 FP 类为例，其替代损失计算如下：
[AUC(FP) = E[(m - \sigma(z_{FP}) + \sigma (z’ {FP}))^2]]
其中，(\sigma(z {FP})) 表示标记为 FP 的句子的预测概率，(\sigma(z’_{FP})) 表示未标记为 FP 的句子的预测概率。通常，边际 (m) 设置为 1，其作用是区分 FP 类的正确和错误预测，使两者更易区分。在第 5 阶段（P5），会收集并汇总 K 个类别的 AUC 损失，然后进行反向传播，以调整 BERT 编码器参数 (\theta) 和依赖于类别的线性分类器参数 (\omega)。不断重复此过程，直到无法再改进，从而获得用于 DA 分类的最优 DA 分类器。

1.2 研究设置

为评估 AUC 最大化方法在 DA 分类中的有效性，研究在两种场景下进行：
- 低资源场景 ：模拟实验中，从完整训练集中随机抽取不同大小的训练集（{25, 50, 100, 200, 400, 800}），以研究 AUC 方法与传统交叉熵（CE）方法在多类 DA 分类中的性能差异。对每个训练集大小，在 10 个随机训练分区上训练由 AUC 最大化方法和 CE 基线优化的 DA 分类器，并分析其平均性能。
- 不平衡场景 ：模拟两