机器翻译(简称“机译”),又称为自动翻译,是利用计算机把一种自然语言(源语言)转变为另一种自然语言(目标语言)的过程。机译涉及数学、语言学、逻辑学、计算机科学和语音技术等多种学科和技术。它是一个充满挑战的研究领域,被列为21世纪世界十大科技难题的第一位。
机译技术经历了从规则翻译到统计翻译的发展历程。前者由词典和规则库构成知识源,以语法规则为主;后者由经过划分并具有标注的语料库构成知识源,以统计规律为主。最近十几年,由于人工智能技术的飞速发展,机器学习的翻译方式开始出现。目前一些基于搜索引擎的在线翻译,如谷歌翻译、必应翻译、脸谱翻译、百度翻译等就是机器学习在机译系统的初步应用。
无论是哪种机译方式或方法,目前影响机译发展的最大因素在于译文质量。就已有的成就来看,译文质量离理想目标(达到人工翻译的水准)仍相差甚远。众所周知,人工翻译(简称“人译”)的过程是人工译者集理解、分析、选择及再创造为一体的综合过程,是大脑思维活动的过程。因此,机译的译文质量要达到人译的水准,就必须解开大脑处理语言信息之谜。正如中国数学家和语言学家周海中教授所言:在人类尚未明了大脑是如何进行语言的模糊识别和逻辑判断的情况下,机译要想达到“信、达、雅”的程度是不可能的。这一观点精辟到位,道出了制约译文质量提高的瓶颈所在。
有人预言,当人工智能超越人类智能时,机译的译文质量就有可能超越人译的水准。事实上,机译超越人译那是不可能的,也是没有意义的,能达到人译的水准已经很不容易了。美国发明家和企业家雷·库兹威尔博士曾预言,“到2029年机译的译文质量将达到人译的水准。”这一预言也未免过于乐观。
遗憾的是,至今机译的若干理论难题(如深层次语义)都没有从根本上得到解决;某些方法和技术也没有实质性的改进;机译系统的性能(在消歧和调序方面)还不尽如人意。因此,机译的译文质量要达到人译的水准还有很长的路要走,尤其有待于脑科学、语言科学和人工智能的重大突破。可以预言的是,即使今后机译技术取得重大突破,其译文质量不可能超越人译的水准。
顺带一提,伴随着机译技术的不断进步,人们也不得不面对这样一个问题:机译最终会取代人译吗?大可不必对这个问题心存疑虑。虽然机译会对翻译行业带来一定的冲击,但类似于文学艺术一类的机译将永远无法取代人译。
作者:刘世杰
本作品为“科普中国-科学原理一点通”原创,转载时务请注明出处。