您当前的位置:创之家科技网快讯新闻正文

硬核测评谷歌翻译被碾压全球首个翻译引擎进化归来细节狂魔搞定方言文言文

时间:2020-04-01 17:03:22  阅读:6690+ 作者:责任编辑NO。姜敏0568

编者按:本文来自微信群众号“大数据文摘”(ID:BigDataDigest),作者 刘俊寰,36氪经授权发布。

最近,一款在线机器翻译软件在日本大火。

这款翻译软件名叫DeepL,大火的原因正是因为它作业太担任了,翻译得过分精确,在日本引起了热议。

从日本网友的民间测评来看,不只日语方言翻译作用杠杠的,连文言文也被拿下,要知道,这可是连谷歌翻译都无法做到的事。

可是有多精确呢?作为一个谨慎的科技软件,当然仍是要用数据来说话,DeepL官方也公开了日英互译和中英互译的盲测成果,如下图所示,能够精确的看出,DeepL几乎便是碾压级的存在嘛:

盲测便是在专业舌人评定们不知道哪个翻译版别是由哪个网站翻译的情况下,对翻译文本进行点评,这也一向是DeepL的测验办法之一。

DeepL因为极好的精确性,也相同引爆了Reddit,有网友指出,DeepL不是像谷歌翻译那样从字词上进行翻译,从Textractor的设置上能够正常的看到,DeepL还支撑用曾经的翻译作为上下文对翻译成果进行改进。

也有不少网友直呼“DeepL牛逼”!

3年前,DeepL刚呈现在群众视界的时分就现已招引到了不少目光,DeepL首席执行官Gereon Frahling曾标明,DeepL的方针不止于翻译使命,神经网络将从了解文本开端,敞开更多或许。

至于更多或许是怎么被开发出来的,文摘菌做了一次小小的测评,然后再一起来围观DeepL的发家史,小板凳现已放好,欢迎就坐~

方言、文言文、学术论文,机器翻译神仙打架!

不管是民间测评仍是DeepL官方的盲测成果,都暗示着DeepL或许是现在精确率最高的机器翻译,究竟成色怎样,仍是要亲自动手试试才知道。

已然本次更新也包含了简体中文,抱着一点点的置疑和一点点的猎奇,文摘菌也对DeepL进行了一次简略的测评,和现在干流的谷歌翻译、微软翻译、百度翻译、有道翻译进行了比较。

本次测评分为三轮,第一轮方言,第二轮文言文,第三轮学术论文。好,现在咱们有请五位选手进场。

第一轮,咱们来看看方言。

咱们都知道,我国方言文明博学多才,要是不能正确译出方言,那这个精确率仍是要打上问号的。

咱们挑选了东北话十级标题:“我嘞个去,你长得也太磕碜了”。本题有两个得分点,一个是“我嘞个去”,一个是“磕碜”。让咱们来看看五位选手的体现。

在第一个得分点上,谷歌翻译成了“I'll go there”,微柔和百度以为这是“I'll go”的意思,有道则给出“I don't know”的答案,DeepL体现很好,正确翻译成了带有惊奇口气的“oh my god”。

在第二个得分点上,五位选手都给出了不同的答案,谷歌“shy”、微软“snobful”、百度“shabby”、有道“bad”,DeepL“ugly”。

从得分点上看,百度在第二题体现尚可,有道…牵强过关吧,谷歌和微软则全军覆没。咱们来赏识一下DeepL的满分试卷:

这才第一题,不要忧虑,还有翻身的时机。接下来咱们来看看文言文,已然DeepL都能翻译古日文,要是不能翻译古汉语可就不对了。

第二轮,文言文。

文言文部分咱们以闻名唐代诗人张九龄《望月远怀》中的名句“海上生明月,天边共此刻”为考题,这句诗的意思是,在广阔无边的大海上升起一轮明月,使人想起了远在天边海角的亲朋,他此刻此刻也该是望着同一轮明月吧。

本题的得分点是看看各位选手能否用英文把整句诗的意境表达出来。好了,中文版的标准答案现已发布,那么五位选手的体现怎么呢?

首要从句意上看,谷歌、微柔和百度都直接抛弃了后半句的翻译,有道把后半句译成“Tianya at this time”;在前半句的翻译上,微柔和百度都用到了born这个词,可是微软的译文是“The sea is born”????

咱们来看看DeepL,前半句和谷歌的答案如出一辙,可是后半句的翻译是不是达到了信达雅的水平文摘菌不知道,可是读上去感觉十分舒畅,咱们也来品品:

第三题,也是最终一道压轴题,咱们要查询的是各位选手对学术论文的中英互译。

学术论文的要害除了语句通畅外,还需求在专业词汇上做到精确,这也是本次查询的要点。

中译英部分,咱们挑选的是上一年刊登在《世界新闻界》上的一篇文章,研讨者查询的是社会化媒体信赖对隐私危险感知和自我披露的影响。

原文:实证成果显现:1.隐私危险感知与自我披露并无明显相关性;2.社会化媒体信赖负向影响用户的隐私危险感知,网络人际信赖在其中发挥中介作用;3.社会化媒体信赖正向影响用户的自我披露,网络人际信赖在其中发挥中介作用。

从翻译成果上看,五位选手给出的答案都比较让人满足,句型和语法也都没问题,只是在一些详细的用词上各有千秋。比方,“自我披露”,DeepL和微软用的是“self-expression”,其他三位选手用的是“self-disclosure”;而“网络人际信赖”,有道、百度和微软译成“network interpersonal trust”,谷歌给出“online interpersonal trust”的答案,DeepL则译为“cyber-interpersonal trust”。

按例,咱们仍是来看看DeepL的答案。

在英译中部分,咱们挑选了上星期文摘菌报导的帝国理工大学论文的导论部分。在运用者实在的体会上文摘菌要插播一下,从中译英切换到英译中的时分,只需百度、有道和DeepL做到了自动识别,谷歌和微软仍需求手动挑选言语。

原文:The global impact of COVID-19 has been profound, and the public health threat it represents is the most serious seen in a respiratory virus since the 1918 H1N1 influenza pandemic. Here we present the results of epidemiological modelling which has informed policymaking in the UK and other countries in recent weeks. In the absence of a COVID-19 vaccine, we assess the potential role of a number of public health measures – so-called non-pharmaceutical interventions (NPIs) – aimed at reducing contact rates in the population and thereby reducing transmission of the virus. In the results presented here, we apply a previously published microsimulation model to two countries: the UK (Great Britain specifically) and the US. We conclude that the effectiveness of any one intervention in isolation is likely to be limited, requiring multiple interventions to be combined to have a substantial impact on transmission.

从成果上看,五位选手的学术造就都比较高,学术言语运用的规范性也都相差不大。可是,细节见真知,只需有道保留了双破折号的运用,但这在中文中其实并不常见;除有道外,其他三位选手在“非药物干涉办法(NPI)”的表达上都没有做到一无是处。

依然,笑到最终的仍是DeepL,尽管还存在各种小问题,无法得到满分,但也是一张妥妥的高分试卷了:

以上便是本次测评悉数的考题了,能够精确的看出DeepL不愧是头号种子选手,不管是方言、文言文仍是学术言语,都有不错的体现,看来DeepL官方仍是很诚笃的嘛。

从Linguee蜕变,机器学习赋能DeepL

才智到了DeepL的“独秀”体现,接下来,咱们就要点介绍一下本次测评体现最佳的头号种子DeepL。

不知道DeepL?那Linguee应该听说过吧,便是那个运营十多年的在线外语词典,DeepL的前身正是Linguee。Linguee是一款呈现多年的翻译东西,尽管运用广泛,也有一批忠诚用户,但其翻译质量尚无法与谷歌翻译混为一谈,尤其是考虑到后者品牌和位置的巨大优势。

但实在重要的是Linguee的技能堆集,Linguee的联合创始人Gereon Frahling之前就在谷歌研讨院作业,2007年,他挑选敞开新的征途,团队数年来一向致力于机器翻译,直到2016年,他们才开端全力开发全新的体系,建造新公司,也便是DeepL。

Linguee的中心竞赛优势便是爬虫和机器学习体系,前者能够抓取互联网上超越10亿句翻译成果和查询的大型数据库,后者在网页上查找类似片段的实在翻译办法并对其点评,两者结合使Linguee成为了其时“世界上首个翻译查找引擎”。

十年堆集下来,Linguee不管在数据和对算法的研讨上都不行小觑,而这也直接成为DeepL的绝对优势,为团队练习新模型打好了坚实的根底。

DeepL革新性的神经架构在冰岛的一台超级核算机上运转,该核算机才能为5.1 petaFLOPS(每秒5100万亿次操作),不到一秒内能翻译100万单词。“冰岛可再生能源丰厚,因而咱们咱们能够在这里用十分低价的本钱练习咱们的神经网络。咱们将持续专心于高性能硬件”,DeepL的CTO Jaroslaw Kutylowski说。

“咱们的神经网络架构现已完成了多个明显改进”,Gereon Frahling标明,“经过用不同的办法组织神经元及其衔接,咱们的网络比现在其他神经网络更全面地映射天然言语。”

大学、研讨组织和Linguee的竞赛对手发布的研讨进展标明,卷积神经网络才是机器翻译的正确路途,而非DeepL之前运用的循环神经网络,但现在不是讨论二者差异的时分,关于相关词语的长、杂乱字符串,只需你能够操控其缺点,卷积神经网络作用会更好。

例如,CNN一次处理一个单词,当句末单词决议句首单词的构成时,这就成了问题。查找整个语句寻觅句首单词,假如网络获取到的第一个单词是过错的,就太浪费了,还得运用该常识重新开端,因而DeepL和机器学习范畴的其他组织在CNN转向下一个单词或词组时,运用能够监控此类潜在问题的“注意力机制”来处理。

DeepL在最新版别增加了对日语和中文(简体)的支撑,包含日语汉字,平假名和片假名以及数千个汉字。现在,DeepL支撑的言语数量增加到11种,尽管言语支撑不如其他翻译服务广泛,如Google Translate和Bing Microsoft Translator均支撑一百多种不同的言语,但翻译精度也是不行忽视的要害点。

把握多国言语的Techcrunch修改Frederic曾这么点评DeepL:“谷歌翻译的风格十分直接,但却错过了一些细节和习语(或许把这些习语翻译错了),而DeepL 常常能够供给愈加天然的翻译作用,就像练习有素的人类翻译相同。”

说了这么多,仍是那句话,真真假假仍是自己试了才知道,有爱好的同学能够亲自动手试试,要是遇到什么好玩的翻译成果还记得告知文摘菌噢~

最终,官网链接双手奉上:

https:///translator

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!