双语评估替补(BLEU,Bilingual Evaluation Understudy)

双语评估替补(BLEU,Bilingual Evaluation Understudy)是一种用于评估机器翻译质量的自动化指标,其核心思想是通过计算机器翻译结果与人工参考译文之间的相似度来量化翻译质量。

在这里插入图片描述

一、基本原理

  1. 核心目标
    BLEU旨在替代人工评估,通过统计机器翻译结果中与参考译文匹配的**n-gram(连续n个词)**数量,衡量翻译的准确性和流畅性。例如,若机器翻译的句子与参考译文在词汇、短语层面高度重合,则得分较高。

  2. 修正精确度(Modified Precision)
    为避免机器翻译通过重复高频词(如“the the the”)虚高得分,BLEU引入修正机制:每个n-gram的计数上限为参考译文中该n-gram的最大出现次数。例如,若参考译文中“the”最多出现2次,则机器翻译中无论重复多少次“the”,最多仅计2次匹配。

  3. 简短惩罚因子(Brevity Penalty, BP)
    当机器翻译结果过短时,BLEU会施加惩罚。BP的计算公式为:
    [
BP = \begin{cases}
1 & \text{若机器翻译长度} > \text{参考译文长度} \
e^{(1 - \text{参考译文长度}/\text{机器翻译长度})} & \text{否则}
\end{cases}
]

    这一机制防止短句因匹配少量词而得分虚高。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值