损失函数类型
适用于:文本分类,情感分析,机器翻译,抽取式问答的有:
y,y^y,\hat{y}y,y^分别表示真实和预测值
- 二分类交叉熵损失
L(y,y^)=−(ylogy^+(1−y)log(1−y^)L(y,\hat{y})=-(ylog\hat{y} + (1-y)log(1-\hat{y})L(y,y^)=−(ylogy^+(1−y)log(1−y^) - 多分类交叉熵损失函数
L(y,y^)=−∑i=1myilogyi^L(y,\hat{y})=-\sum_{i=1}^{m}y_{i}log\hat{y_{i}}L(y,y^)=−i=1∑myilo

本文详细介绍了文本分类、情感分析等任务中常用的损失函数,包括二分类和多分类交叉熵,以及语言模型中的困惑度概念。同时探讨了生成式问答和文本生成的对数似然损失。此外,文中还涵盖了各种文本相似度度量方法,如余弦相似度、皮尔逊相关系数、Jaccard相似度和欧几里得/曼哈顿距离。

1033

被折叠的 条评论
为什么被折叠?



