论文: Better Evaluation for Grammatical Error Correction(2012NAACL)
Github https://github.com/nusnlp/m2scorer
- m2格式:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-k6tNR5uP-1599300978720)(GEC.assets/image-20200828203148949.png)]
S开头的行表示原始句子,A开头的行表示注释。
每个注释行均包含编辑的开始和结束标记偏移量、错误类型、标记化的更正字符串。
出于历史原因,包含了下两个字段,可以将其忽略(请参阅CoNLL-2013共享任务).
最后一个字段即数字(0、1、2)是注释者ID
- 目的:提出了一种计算system edit的方法,寻找最贴近gold的edit,phrase-level edits
- 难点:
(1)the set of edits that transforms one string into another is not necessarily unique(编辑的不唯一性)
(2)edits can consist of longer phrases which introduce additional ambiguity.(编辑的长度不定性)
| 符号 | 含义 |
|---|---|
| S = { s 1 , . . . , s n } S = \{s_1, . . . , s_n\} S={s1,...,sn} | source sentences |
| H = { h 1 , . . . , h n } H = \{h_1, . . . , h_n\} H={h1,...,hn} | hypotheses |
| G = { g 1 , . . . , g n } G = \{g_1, . . . , g_n\} G={g1,...,gn} | gold standard annotations |
| g i = { g i 1 , . . . , g i r } g_i = \{g_i^1, . . . , g_i^r\} gi={gi1,...,gir} | set of edits |
| (a,b,C) | start and end offsets a and b; correction C【gold可能含多个,系统的只有1个】 |
步骤:
(1)construct an edit lattice from a source-hypothesis pair.【finding the optimal sequence of edits is equivalent to solving a shortest path search through the lattice】
(2)evaluate the edits using F1 measure.
- 构造编辑矩阵
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MWGQVQ64-1599300978723)(GEC.assets/image-20200905180259163.png)]
- 寻找最短路
评价指标:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tTr6rFBU-1599300978724)(GEC.assets/image-20200905171942508.png)]
补充:
数据对齐-编辑局里算法: Levenshtein distance
[wiki 链接]
第一个删除;第二个插入;第三个是否匹配

1万+

被折叠的 条评论
为什么被折叠?



