实现语义解释与解析器的独立性
1. 引言
在机器翻译领域,当前大多数可用的系统采用了各种复杂程度不同的注释技术。其基本操作是将源文本中的单词和短语替换为目标语言的对应翻译,并依据源语言和目标语言之间的句法对应关系进行重新排列。在许多情况下,这种方法能够产生可接受的翻译结果,对于一些欧洲语言,已经有系统能够为诸如指示性翻译和摘要提取等应用提供足够的覆盖范围和质量。
然而,当处理结构差异显著的语言时,如日语和英语,就需要对源文本进行更深入的分析。例如,下面两个日语名词短语:
- “tyokkei(直径)zyuumeetoru(10 米)no suisha(水轮)”,对应的英文翻译是 “a water wheel with a diameter of 10 meters”。
- “toukyou(东京)orimpikku(奥运会)no kaisai(开幕式)”,对应的英文翻译是 “the opening of the Olympics in Tokyo”。
可以看到,这两个日语名词短语的句法结构几乎相同,但英文翻译的结构却大相径庭。显然,仅依靠对日语短语的句法和形态分析所提供的信息,不足以实现准确的翻译。不过,如果考虑到这些成分的含义,借助如 Sensus 本体等工具,就能够实现准确的英文翻译。
目前,正在开发的 Gazelle 机器翻译系统旨在通过语义解释和后续的文本生成,为不受限制的日语报纸文本提供质量合理的英文翻译。该系统目前按句子进行翻译,其工作流程如下:
graph LR
A[文本提交] --> B[预处理]
B --> C[
超级会员免费看
订阅专栏 解锁全文

624

被折叠的 条评论
为什么被折叠?



