近期,国外一份调查报告误将392万和83万的采购费用翻译为39.2亿和830万,闹出国际笑话。有分析认为,此乌龙事件是国外机器翻译软件造成的。
让很多人意想不到的是,看似简单的数字,在机器翻译中向来是一大痛点。就以「392.687694万元」为例,我们测试不同翻译软件的翻译结果。
数字翻译「中译英」测试
首先测试「中译英」,国内外9款主流翻译软件中,只有火山翻译和腾讯翻译君准确地翻译出了392万。其余7款产品,有翻译成392的,有翻译成39.2亿的,甚至还有翻译成392万亿的,比正确结果扩大一亿倍,另外4款都翻译成了3.92亿。测试结果如下列组图所示。
火山翻译:
腾讯翻译君:
深圳:积极参与央行数字人民币跨境支付、国际合作试点:2月9日消息,《深圳市服务业发展“十四五”规划》提到,促进要素跨境流动便利化。积极参与央行数字人民币跨境支付、国际合作试点,探索扩大跨境资产转让业务,研究开展本外币合一跨境资金池业务试点,积极探索资本项目可兑换的有效途径。(金十)[2022/2/9 9:40:33]
以下为其他7款翻译产品的测试结果。
翻译为39.2亿:
翻译为392:
翻译为392万亿:
现场 | 邢春晓:区块链数字经济的发展必须正本清源 营造风清气正的氛围:金色财经现场报道,12月21日,由中国(深圳)综合开发研究院与国印金控(海南)科技有限公司联合主办的“2019中国通证数字经济峰会”在北京举行。清华大学信息技术研究院副院长邢春晓提出了四点对区块链数字经济应用的建议。其一,区块链数字经济的发展必须正本清源、营造产业风清气正的氛围,引导社会理性认识,完善政策发展环境;其二,推动区块链数字经济与实体经济深度融合,尽快找到落地项目,体现国家提质争效的战略方针;其三,深入研究区块链中的基础性的核心关键问题,占领区块链竞争高地;其四,培养掌握区块链技术的高端人才,为国家和产业输送高素质、高层次、多样化、创造性的人才。[2019/12/21]
翻译为3.92亿:
行情 | 数字货币22个概念板块18涨4跌:据非小号数据显示,数字货币22个概念板块中18涨4跌。平均涨幅排名第一的是游戏概念,平均涨幅为6.36%,其中1ST领涨,涨幅达122.62%;平均涨幅排名第二的是超级算力,平均涨幅为5.05%,其中MGD领涨,涨幅达12.64%;平均涨幅排名第三的是数据经济,平均涨幅为4.44%,其中PASS领涨,涨幅达42.95%。此外,下跌前三的板块分别是AI人工智能、平台币和基于DAG,平均下跌幅度为3.08%,0.33%和0.33%。[2019/4/17]
数字翻译「英译中」测试
我们用不同软件把英文「3.92687694millionyuan(RMB)」翻译回中文,会是怎么样的结果?
这次只有火山翻译准确翻译出了392万元人民币。其他8款产品,有翻成3.92万的,有翻成39.2亿的,也有翻成392万亿的,另外5家都翻成了3.92万亿。测试结果见下列组图。
动态 | 负利率可能导致瑞典人民将财富转移至数字货币:据News.bitcoin消息,瑞典央行出台了一项有争议的新措施,设定-0.5%的存储利率,以刺激经济和鼓励消费者消费。文中提到,比特币升值背后的一个因素是,人们对贬值的本国货币感到厌倦,因为这些货币几乎没有积累起来的动力。负利率的政策出现,可能导致出现从法定货币向去中心化数字货币的大规模资金转移现象。[2018/10/7]
火山翻译:
其他产品的翻译结果:
Integral新纳入14种数字货币和16个交易所:Integral今天宣布,该公司扩大了其数字货币市场的数据产品,新增14种主要加密货币,并连接包括日本和香港在内的美国、欧洲和亚洲的所有主要交易所。[2018/1/26]
数字的重要性毋庸多言,在商业条款中如果翻译错一个数字,可能会带来成千上万的损失;建筑图纸中一个数字翻译的疏漏,就可能导致一项庞大建筑工程轰然倒塌。想要保证数字翻译的准确度,远不是誊写一串阿拉伯数字再翻译单位这么简单。从上面测试中也可以看到,一些国际巨头的翻译产品,在数字翻译中照样会出现偏差万倍甚至上亿倍的错误。
数字翻译难在哪?
数字翻译对翻译者关于目标语言数字表达的理解要求较高,在中英翻译中,数字翻译的难点主要在以下方面:
a.中英语言中不同的数字单位,如1000万翻译成10million,不能简单地「拷贝」
b.很长的数字容易带来偏差
c.超大数字的翻译问题,如trillion、万亿以上的单位
d.中英语言中不同的计量单位,如中文中的“斤”,容易被翻译成“kg”
e.带有货币符号的数字容易犯错
当前,很多翻译软件对数字没有做额外的处理,采用的是与普通文字相同的sequence-to-sequence神经机器翻译模型。这一模型翻译质量较高,流畅性较好,但存在一个显著的缺陷,就是缺乏常识和推理能力,无法理解对于人类来说比较简单的规则,例如,“万”和“million”的的转换、单位货币之间的不同等。
火山翻译如何解决数字翻译难题?
我们从火山翻译技术分享中了解到,火山翻译的翻译模型见到对应的数字之后,会将其抽取出来,通过推理、计算等智能过程,对数字进行跨语言的语义转换,然后将其置于翻译句子适当的位置中,类似人类的翻译推理过程。
火山翻译是字节跳动旗下火山引擎的AI中台能力之一,技术能力已经在飞书的文档、消息翻译和火山引擎的企业级客户中广泛应用。由于当前机器翻译场景中存在大量的数字内容,数字翻译也一直是火山翻译团队持续优化的重要方向。目前,火山翻译已经支持56门语言、3080个语向的翻译。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。