macbert4csc纠错

本文探讨了MacBERT4CSC模型在错字识别任务上的应用,与Electra模型进行了对比。作者指出,尽管MacBERT4CSC通过同义词替换改进了预训练,但Electra的生成-判别结构可能更适合任务需求。通过调整损失函数权重,实验发现不同超参数设置对模型性能的影响,并提出考虑使用所有隐藏层的特征进行分类的优化思路。

简介

此篇文章是对macbert4csc模型的一次尝试与思考,废话不多说,看内容。

模型结构

这个模型分成两部分:

  1. 使用BertForMaskedLM对预训练模型做mask训练。
  2. 对预测的结果输入linear,判断预测的结果和真实的结果是否相同,即二分类。

举例:
比如错句为我和你在一其,正确的句子为我和你在一起,错句输入MLM,得到的结果假设为我和你在一器。然后输入linear判别器,判断和正确的句子做二分类。最后两个loss进行相加。

思考

为什么选择macbert

首先看看什么是macbert,全称是(MLM as corrector),它是哈工大和讯飞一起训练的模型。主要做的内容有两点:

  1. 修改bert mask预处理代码,将bert做[mask]的地方用同义词来替代。同时引入全词mask。
  2. 替换NSP任务,使用SOP来替代。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ox180x

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值