4 月 10 日,可能是同声传译从业者最开心的一天,因为他们的“竞争对手”机器翻译又闹出了大笑话。
这起“翻译事故”发生在 4 月 9 日,但到了 4 月 10 日早上才火起来,火的这家是腾讯翻译君,起因是一场发生在今年博鳌亚洲论坛的“同声传译车祸”。
当然,这样高规格的会议肯定是有人工同声传译的。而在博鳌亚洲论坛分论坛“未来的生产”会场两侧的大屏幕上,各国嘉宾的演讲内容被腾讯翻译君实时识别、并翻译成中英双语字幕进行投屏展示。同时,现场观众不断利用微信小程序对嘉宾演讲的双语同传内容进行回看、收听和记录。
不少嘉宾在小程序上看到了这起翻译事故,具体情况是这样的:
其中人工翻译肯定不会出现的“低级错误”是“Have”、“When”、“AND”这样多次的无意义重复。
这样的翻译错误在另外一句英译中的过程中再次出现,这次不仅没有翻译成很通顺的中文,而且出现了英文单词的大量重复,比如“for”。
这不是机器翻译第一次闹笑话。据中国新闻网报道,今年 2 月 4 日,在韩国平昌冬奥会上,为了给121名运动员备餐,挪威队主厨用号称是神经网络翻译的 Google 翻译订了1500 个鸡蛋,却因翻译错误收到 15000 个鸡蛋。收到这么多鸡蛋主厨心情应该是绝望的:这么多鸡蛋什么时候能吃完?
中文科技圈最近也发现了 Google 翻译的另外一个笑话。在中译英的环节,输入“安卓手机很卡顿”,你得到的英文翻译却是“Android phone is very fast”。
当然,更好玩的是 Google 一视同仁,不偏袒自家的 Android。输入“苹果手机很卡顿”,翻译结果是“Apple phone is very fast”。
Google 的这个翻译错误很容易破案,它完全不理解中文的卡顿是什么意思,输入“卡顿”,Google 翻译给出的是“caton”。
测试同样的语句,在搜狗等本地化更好的翻译中就可以翻译成“iPhone run very slow”。
不过腾讯翻译君这次的“事故”还不止于此,在一个翻译群里还有人招募同声传译去帮忙直播博鳌论坛,时间是下午一点半,地点正是腾讯北京的办公地希格玛大厦。
群里的气氛开始变得十分微妙了,同声传译从业者“报仇”的机会终于来了:“他们还是需要人类”,“他们不是有自己的同传机吗?”。画面不亚于落魄的孔乙己在酒馆里被众人嘲弄的场景。
腾讯翻译君随后进行了辟谣:这是个乌龙事件,外界提及的邀请人工同传,并非“腾讯同传”团队用于此次海南博鳌的现场AI同传,而是用于服务腾讯新闻团队北京直播间的专业报道。
至此,这个乌龙事件基本上已经收场了,但人工同传们“惊弓之鸟”的心态暴露的很明显了。
这就又回到了被讨论了很长时间的话题:机器翻译能否替代人工翻译。按照目前各家同声传译机的表现,机器翻译的确无法替代人类。
但是人工同传们也无法像以前那样风光了,有了机器翻译这个对手的存在,同声传译这一行的竞争更加激烈了—简单一些的翻译场景机器已经可以胜任,人工同声传译只有向高端化方向发展。
我的一位学语言的同学告诉我,现在学语言越来越难找工作了,不仅要求翻译水平高,而且翻译的相貌打扮也需要好看。“我们上课都需要化妆,老师在正式讲课之前会逐一检查我们妆化的这么样。”
在这样的背景下,人工翻译们在微信群里集体 diss 腾讯翻译君也就不难理解了。
最后,腾讯翻译君也对这次博鳌论坛的翻译错误进行了解释和技术上的反思。
“面对博鳌亚洲论坛复杂的语言环境和高大上的专业内容,’腾讯同传’确实出现了错误,答错了几道题。”
对于中译英出现的大量重复的“Have”、“When”、“AND”,腾讯翻译君称之为“大面积单词无意义重复、大小写及字符混乱”现象。经过排查,腾讯翻译君认为出现这个问题,主要是中英双语切换频率的问题。当声源在两种语言之间不断转换时,后台中、英文识别引擎就会同时开始工作,这会导致两种识别引擎互相“掐架”,而翻译结果却只能选择一种语言进行输出,再加上对嘉宾每个语气词也做了精准的“啊啊啊”翻译,导致引发错误。
对于占满了几乎一整页的“for”,腾讯翻译君承认包括神经网络机器翻译在内的深度学习算法,目前在原理上还有一定不确定性,在特定的情况下有一定的概率引发翻译偏差。而且嘉宾演讲内容中正好也包含“for for for for”、 ”that’s that’s that” 等重复内容,翻译引擎放大了这个重复,导致了翻译错误。
总结一下,这次腾讯翻译君的回应首先是辟谣,邀请的人工同传是去负责腾讯新闻的专业报道。其次是承认机器翻译出现的错误。
机器翻译还远未到替代人工翻译的水平,我们也大可不必像旧时代那样因为刚诞生的火车速度比马车还慢就去嘲笑新技术。这届 AI 翻译到底行不行,时间会给出答案。