NLP任务中常用的损失函数

本文详细介绍了文本分类、情感分析等任务中常用的损失函数,包括二分类和多分类交叉熵,以及语言模型中的困惑度概念。同时探讨了生成式问答和文本生成的对数似然损失。此外,文中还涵盖了各种文本相似度度量方法,如余弦相似度、皮尔逊相关系数、Jaccard相似度和欧几里得/曼哈顿距离。

损失函数类型

适用于:文本分类,情感分析,机器翻译,抽取式问答的有:
y,y^y,\hat{y}y,y^分别表示真实和预测值

  • 二分类交叉熵损失
    L(y,y^)=−(ylogy^+(1−y)log(1−y^)L(y,\hat{y})=-(ylog\hat{y} + (1-y)log(1-\hat{y})L(y,y^)=(ylogy^+(1y)log(1y^)
  • 多分类交叉熵损失函数
    L(y,y^)=−∑i=1myilogyi^L(y,\hat{y})=-\sum_{i=1}^{m}y_{i}log\hat{y_{i}}L(y,y^)=i=1myilo
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值