网络科技

    今日:1221| 主题:246121
收藏本版
互联网、科技极客的综合动态。

[科技] 谷歌中译英新版到底有多好

[复制链接]
风一样的吕子 发表于 2016-10-2 09:24:35
121 7

立即注册CoLaBug.com会员,免费获得投稿人的专业资料,享用更多功能,玩转个人品牌!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

谷歌中译英新版到底有多好-1 (谷歌翻译,谷歌公司,Google,英语,英文)

  9月27日,谷歌推出了新的翻译系统,声称该套翻译系统基于对人类神经思考的模仿,能够与真人翻译竞相匹敌。众所周知,将汉语恰切地译介为英语是一件不易之事。输入中文,翻译系统给出的答案往往是“惨不忍睹”,简单的机械翻译对于那些谷歌翻译的依赖者来说已远远不够。
  在谷歌发表的题为《规模生产中的神经网络机器翻译》的文章中,宣布将机器学习技术纳入网页和手机APP翻译中,从前汉译英的尴尬局面将大为扭转。谷歌公司称,相较之前的算法,谷歌神经机器翻译能减少80%的错误,与通过标准测试的真人翻译所差无几。
  那么,谷歌中译英新版是否真的有这么神?金雯教授亲自进行了测试,她得出了这样的结论……本文经授权转载于“复旦外语(fudanwaiyu)”微信公众号,原文标题:《谷歌新版翻译有多神?英文教授亲证后告诉你...》作者:金雯(莫水田)。
  谷歌中译英新版凌厉登场,“神经网络翻译”和机器学习等字眼引动了许多不彻底的欢呼和不确凿的惶惑。
  我不懂机器学习技术,但我对它是友好的,况且我懂中文和英文,理解翻译这件事。所以我也就不避纷扰,来发表一些我个人对于Google Translate目前中译英水平的观感。
   首先, 谷歌翻译功能不需要翻墙,在国内也可以用 ,所以以下我说的内容,大家都可以重复验证,并提出自己的观点。 谷歌翻译的网址:translate.google.cn   可以选择中译英的设置,因为中译英功能是这次谷歌技术的突破点。
  我的总体感受
   谷歌中译英对写得像英文的中文句子比较能应对自如,就是那些主语谓语宾语等成分清晰的句子。尤其惊艳的是对于包含两三个短句,当中用逗号连接,逻辑关系清晰 (即西化) 的中文句子,谷歌翻译能够正确识别何为主句,何为表达因果、伴随状态的状语从句。当然,对许多四字成语和俗语 (如“梁上君子”、“图样图森破”等) 也有备而来,至少在单独出现的时候能够识别并正确翻译。
   这也就是说, 谷歌中译英比较适用于一板一眼的中文,比如写得干涩而又十分清晰的科学论文和人文社科类论文 (即便是这类论文,也会出现机器无法处理的长难句) ,或许也适用于一部分新闻社论 。这类中文用谷歌翻译成英文后,经人工修改把关,问题就不大了。这样的确可以节省许多初级、机械的翻译人工,对翻译生产力是一种解放。 至于会不会引发大量翻译失业的问题,还不能就此作出判断。
   然而,  谷歌中译英对于大部分散文作品、日常电邮交流 (可能有官话,可能有省略式表达) 、口语化的生动表达、诗词曲艺、文字游戏等,都还只能望洋兴叹。  而且,我发现,即使是谷歌认识的短句式和俗语,出现在有些复杂蜿蜒的句子中时,也会让谷歌犯迷糊。
   中文与英文也有许多不兼容的地方,有自己独特而狡黠的语法。况且,自然语言是灵动的,不论中英文,写的灵动的时候都是不机械,不容易理解的。 对语言的灵动,机器目前是无能为力的,不知未来如何。 还是希望研究语言文学的人与科技界人士多多交流互补,虽然主力军还是人工智能人士。
   有的人说, 为了使用谷歌翻译,可以将自己的中文句子写成机器可以辨认的样子。这个技巧当然是没错的,为了论文能够顺利快速地翻译成英文,也不失为一个权宜之计。 可是这项技术不应该是为人服务的吗?  如果让自然语言削足适履,科技就真的变成禁锢人类语言才华的枷锁了。
  下面就具体地谈谈谷歌中译英功能的一些问题
  由此也可以发现许多自然语言的奥秘和中英文差异。
  1、主语的问题
  汉语中主语的位置非常灵活,也往往会在句子中省略,这会给机器带来不少困惑。而且,如果主语比较长,本身就是一个词组(这种情况中英文实际上都有)的话,谷歌翻译就更加吃力。例证如下:
  1) 原句:您预约的馆际互借图书已到馆,请尽快至闵行图书馆馆际借书处取书。
  机器翻译:You have booked the interlibrary loan book has been to the Museum, as soon as possible to the Minhang Library Interlibrary borrow books from the book.
  正确翻译:The interlibrary loan book you ordered has arrived at the library. Please come as soon as possible to the Minhang Library to pick it up.
  “你预约的馆际互借图书”是用一个词组做主语,机器还没明白,以为“你” 才是主语。而后面的半句里主语省略了,在机器的翻译中也就发生了句子残缺不全的情况。

  2)    原句:这本书只好去网上买了。
  机器翻译: This book had to go online to buy.
  正确翻译:I will have to order this book online.
  这个句子的主语缺席,可以是“我”,也可以是“你”,要看语境,但机器以为主语是“这本书”。(另外还有一个问题,那就是机器默认的时态是过去时,而原句实际上是将来时,机器还不能辨认。)

  3)你想看的电影已经上映。
  机器翻译:You want to see the film has been released.
  正确翻译:  The film you want to see has been released.
  机器又以为主语是你,而不是电影。

  2、动词的问题
  汉语中经常出现用形容词或形容词词组做动词的情况,对谷歌是一个挑战。 例证如下:
  1) 原句: 桃红柳绿。
  机器翻译:Pink willow green
  机器懵了。应该说The peaches are red and the willows are green.

  2) 原句:谷歌新技术面世。
  机器翻译:Google’s New Technology available.
  谓语“is”缺少。

  3) 原句:北京近日多雨。
   机器翻译:Beijing recently rainy. 同上理。
  4) 原句:肉熟了。
  机器翻译:Meat cooked.
  应该是The meat is cooked. 这里不仅动词缺少了,冠词也没了。中文里不用冠词,所以谷歌不知道这里应该加The,这个问题需要比较高水平的人工译者来纠正。

  3、时态的问题
  机器很难确定一个中文句子实际上表达的是什么时态。默认的是过去时,有时候也懂得用一般现在时,但总体比较机械。例证如下:
  1) 原句:他不相信。
  机器翻译:He did not believe it.
  2) 原句:他不相信世界。
  机器翻译: He does not believe in the world.
  这里我要表扬谷歌翻译,它正确地判断出第一句是过去时,第二句是一般现在时,令我惊叹!

  3)原句:一星期前我回家了,第二天就有小偷来摸索北房的铁丝窗。
  机器翻译:A week ago I went home, the next day there is a thief to explore the north room of the wire window.
  第二个短句应该也是过去时,但机器用了现在时,不明白要与前面一个短句承接的道理。

  4)原句:他回想起过去的三年,不禁有些悲凉。
  机器翻译:He recalled the past three years, can not help but some sad.
  道理同上,第二个短句也应该是过去时。

  4、灵动的散文句子
  对于这些句子,机器还没有学会解读。其实在人工翻译中,这类句子也是最难翻译的,要用既符合英语语法,又精炼灵巧的方法译成英语,非常困难。以前我上高级英语课,会讲一点这类散文句子的翻译。
  1)原句:周作人《苦雨》-北京近日多雨,你在长安道上不知也遇到否,想必能增你旅行的许多佳趣。
  机器翻译:Beijing recently rainy, you do not know Chang'an Road, also encountered no, must be able to increase your travel a lot of good fun.
  机器彻底没辙,这属于不能看的英文句子。不知所云。

  2)原句:他自小受家庭影响,不爱说话。
  机器翻译:He was affected by family, may not talk.
  这里,谷歌翻译没弄明白后面一个短句是一个结果。如果把这句中文改成: 因为他从小受家庭影响,所以不爱说话,那么机器应该是可以理解的。当然,有人要说了,我凭什么要改的这么累赘。

  3)原句:他回想起曾经为他做的事,觉得自己实在委屈,又没处申诉,便郁闷起来。
  翻译:He recalled what he had done for him, feel that they really wronged, and no place to appeal, they depressed.
  同理,句子各部分之间的逻辑关系谷歌翻译没有弄明白,这个句子缺乏表示逻辑关系的连词,各部分的语法关系不明确,所以对机器构成挑战。

  5、古诗词
  1) 原句:青鸟不传云外信,丁香空结雨中愁。
  机器翻译:Bluebirds do not pass the letter of the cloud, cloves empty knot rain.
  前半句语法还比较清晰,谷歌翻译还可以勉强为之,后半句的“空”不符合一般语法要求,所以机器对后半句是完全崩溃的。
  2) “比较”这个词。
  原句:我感到比较郁闷。
  机器翻译: I feel more depressed.
  中文里的‘比较’不一定要和其它东西或人比,就是表示一种中间程度。而英文里一定是两相比较。这是中英文差异的一个小小侧面,是英语学习者的难点,也是机器翻译的难点。

   我的测试当然不完全,但是足以说明,机器翻译的难点和人工翻译的难点有不少重合的地方,人觉得难的,机器也一样不会处理。但 机器在处理简单翻译任务的时候比初级水平的人工译员要可靠,这大概就是机器的神奇之处吧。
  祝谷歌翻译前程似锦,而我们人类也会不断磨砺翻译和语言能力,与机器联手,既深刻地参透语言的规律和秘密,又超脱不羁地使用真正活着的语言。
  作者:金雯,华东师大教授,美国西北大学博士,2006-2013年在哥伦比亚大学教授核心课程“西方文学史”,“美国文学史”和“亚裔美国文学史”。也可关注金教授的微博或豆瓣(莫水田)获得更多的信息。本文也同步发于文汇客户端。未经许可,禁止转载。联系邮箱: [email protected]
   关注微信公众号虎嗅网(huxiu_com),定时推送,福利互动精彩多

谷歌中译英新版到底有多好-2 (谷歌翻译,谷歌公司,Google,英语,英文)

友荐云推荐




上一篇:VMXNET3 driver now included in Mac OS X 10.11 (El Capitan)+
下一篇:京东正在失去竞争力,创新衰退是关键所在
酷辣虫提示酷辣虫禁止发表任何与中华人民共和国法律有抵触的内容!所有内容由用户发布,并不代表酷辣虫的观点,酷辣虫无法对用户发布内容真实性提供任何的保证,请自行验证并承担风险与后果。如您有版权、违规等问题,请通过"联系我们"或"违规举报"告知我们处理。

84765005 发表于 2016-10-2 11:54:19
楼猪V5啊
回复 支持 反对

使用道具 举报

kdfrd 发表于 2016-10-2 12:01:19
一楼招租,租金面议!100年起租。
回复 支持 反对

使用道具 举报

陈大蓉 发表于 2016-10-2 12:10:19
美女未抱身先走,常使色狼泪满襟。。。。。。  
回复 支持 反对

使用道具 举报

nmbmly 发表于 2016-10-2 12:10:20
顶起顶起顶起
回复 支持 反对

使用道具 举报

方力眠n 发表于 2016-10-2 12:25:23
有的人聪明得像天气,多变;有的人傻得像天气预报,变天它都看不出来。
回复 支持 反对

使用道具 举报

陈蕊 发表于 2016-10-2 12:25:25
今天怎么了,什么人都出来了!
回复 支持 反对

使用道具 举报

人要忠-心要孝 发表于 2016-10-8 19:47:12
男女关系处理得好会传出佳话,处理得不好会传出闲话。
回复 支持 反对

使用道具 举报

*滑动验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

我要投稿

推荐阅读

扫码访问 @iTTTTT瑞翔 的微博
回页顶回复上一篇下一篇回列表手机版
手机版/CoLaBug.com ( 粤ICP备05003221号 | 文网文[2010]257号 )|网站地图 酷辣虫

© 2001-2016 Comsenz Inc. Design: Dean. DiscuzFans.

返回顶部 返回列表