m2 scorer

论文: Better Evaluation for Grammatical Error Correction(2012NAACL)

Github https://github.com/nusnlp/m2scorer

  • m2格式:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-k6tNR5uP-1599300978720)(GEC.assets/image-20200828203148949.png)]

S开头的行表示原始句子,A开头的行表示注释。

每个注释行均包含编辑的开始和结束标记偏移量、错误类型、标记化的更正字符串。

出于历史原因,包含了下两个字段,可以将其忽略(请参阅CoNLL-2013共享任务).

最后一个字段即数字(0、1、2)是注释者ID

  • 目的:提出了一种计算system edit的方法,寻找最贴近gold的edit,phrase-level edits
  • 难点:

(1)the set of edits that transforms one string into another is not necessarily unique(编辑的不唯一性)

(2)edits can consist of longer phrases which introduce additional ambiguity.(编辑的长度不定性)

符号含义
S = { s 1 , . . . , s n } S = \{s_1, . . . , s_n\} S={s1,...,sn}source sentences
H = { h 1 , . . . , h n } H = \{h_1, . . . , h_n\} H={h1,...,hn}hypotheses
G = { g 1 , . . . , g n } G = \{g_1, . . . , g_n\} G={g1,...,gn}gold standard annotations
g i = { g i 1 , . . . , g i r } g_i = \{g_i^1, . . . , g_i^r\} gi={gi1,...,gir}set of edits
(a,b,C)start and end offsets a and b;
correction C【gold可能含多个,系统的只有1个】

步骤:

(1)construct an edit lattice from a source-hypothesis pair.【finding the optimal sequence of edits is equivalent to solving a shortest path search through the lattice】

(2)evaluate the edits using F1 measure.

  1. 构造编辑矩阵

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MWGQVQ64-1599300978723)(GEC.assets/image-20200905180259163.png)]

  1. 寻找最短路

评价指标:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tTr6rFBU-1599300978724)(GEC.assets/image-20200905171942508.png)]

补充:

数据对齐-编辑局里算法: Levenshtein distance

[wiki 链接]

第一个删除;第二个插入;第三个是否匹配

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值