The Nimdzi Language Technology Atlas 2020语言技术调研
发布日期:2020-06-24 16:18

原创 云译科技 

2020年Nimdzi语言技术调查数据主要来源于全球25个国家,涉及700多个语言技术解决方案提供商,【云译科技】作为一个在行业中领先的机器翻译解决方案供应商,参与到Nimdzi机器翻译板块中的调研,在疫情当下,助力全球深入了解当前技术变化和发展的现状。


本文摘自:Nimdzi官网
翻译来自:云译机器翻译

在今年的《 Nimdzi语言技术图集》中,我们从700多个技术解决方案的提供商那里收集了数据。



Atlas背后的数据收集基于四个主要来源:
1. Nimdzi语言技术调查答复。这项调查于2020年4月至5月进行,并从全球25个国家的技术提供商处那里收集了答复。
2. 2020年春季,与语言技术公司举行了50多次简报会和会议。
3. 公开可用的数据(公司网站,研究文章,博客文章等)。
4. Nimdzi团队成员的个人经验,他们经常使用几十种语言工具。
这些资源使我们全面了解了我们渴望分享的工业技术发展的现状。

Nimdzi语言技术调查结果:来自25个国家的技术提供商


与2019年版的Atlas 相比,地图集中的单个产品数量从400种增加到500多种,到2020年,数量增长了20%以上,达到660种单个产品。由于这一增长,我们不得不做出艰难的决定,从图表中删除较小的技术分组,例如翻译记忆库编辑器和国际化工具。当前的地图集代表以下九种主要工具类别:

1. 翻译业务管理系统(BMS)
2. 翻译管理系统(TMS)
3. 集成商(中间件)
4. 质量管理,包括术语管理系统
5. 机器翻译(MT)
6. 虚拟口译技术(VIT)
7. 语音识别解决方案
8. 视听翻译工具(AVT)
9. 市场和平台

让我们看一下过去一年语言技术的变化。

重大变化与发展
向云的迁移将继续积极进行。根据Nimdzi语言技术调查,大多数工具现在都在云中。
Nimdzi语言技术调查结果:部署模型
该MT部门已经看到了新的功能,如MT 自动选择 并利用MT输出的新方法来预测质量 。我们期望与买家方面的行业领导者一起,将有更多的MT质量评估工具独立出现并内置于TMS中。

另一个正在增长的领域是自动语音识别(ASR)。因此,我们将Atlas的单独部分专门用于此类技术。甚至廉价的语音识别软件也比手动处理提供更高的生产率。我们发现,为Happyscribe,Limecraft,Trint和Rev等字幕提供自动转录和同步的服务有所增加。

自动字幕已经取代了人类,并且机器配音也在增加。即使它尚未接近可以称为全机配音,在语音合成 领域也正在取得有趣的进展。当前的自动化技术主要用于画外音录制,例如纪录片,电子学习,新闻,公司视频和音频描述。

由于流行病的限制,配音工作不得不远程。远程配音已经存在了一段时间,但是由于质量问题,该行业似乎不愿采用它。但是,COVID-19加快了采用过程,迫使工作室进行测试并尝试不同的解决方案。受锁定限制的影响,受影响国家的大多数录音棚都被关闭,从而严重影响了配音操作。大多数媒体本地化公司需要非常快速地调整其业务以应对这种情况。为此,他们采用了不同的远程配音解决方案。有些人已经开发了自己的平台(因为他们已经计划在大流行之前这样做),而另一些人则找到了可以适应其当前工作流程的现有解决方案。
 
另一种远程解决方案是虚拟口译。正如我们在VIT部分中进一步讨论的那样,远程口译是2020年主要的语言技术进步之一。相应的Atlas口译系统部分提供了一百多种工具。

除了遥不可及之外,在互操作性领域还观察到一种有趣的趋势。尤其是,该行业看到了不同类型的技术的提供者之间的集成数量正在增长,并且Atlas的中间件部分正在迅速发展。

有鉴于此,致力于集成主题的行业标准正在受到越来越多的关注,尤其是翻译API案例和类倡议(TAPICC),该倡议旨在推进用于多语言内容交付的API标准。Straker,Lingo24,Lionbridge,Languagewire等公司已采用它。

说到API,经常支持的API的数量也从只有两个(REST,SOAP)增加到了五个以上。但是,由于各个系统之间缺乏通用的API,因此不同工具之间很难相互连接。

Nimdzi语言技术调查结果:API
由于开发新解决方案的公司数量迅速增长,因此非常需要技术之间的通信。例如,去年我们在Atlas中只有20个翻译业务管理系统(BMS),而这次有33个这样的解决方案。

继续开发这种技术:
• 出售(例如,著名的Plunet,Protemos,XTRF解决方案,以及新到货的Taia和Space TMS)
• 供内部使用(例如,客户门户,例如Acclaro的MyAcclaro和Janus Worldwide的Janus GTP)。
这里的新功能是一些BMS工具可以免费使用,例如Rulingo。除此之外,许多TMS提供商(例如Smartcat和Wordbee)都具有广泛的业务管理功能。


在Atlas的最大部分,翻译管理系统方面也取得了进步。连续本地化(CL)仍然是这里的流行语。一些公司一直在遵循这种趋势,将其交付方式宣传为持续的,但实际上并不提供。

对CL的需求将继续增长,但是它将需要绕过当前文件交换连接器的限制。CL的提供者之一,Transifex,指定了一个开放源代码软件开发工具包(SDK),以通过API检测字符串和字符串的无文件传输,以此作为其开发路线图中主要功能的示例。

具体趋势和挑战

虚拟口译技术

不可否认,COVID-19对远程口译市场的积极影响。自2020年3月以来,一些VIT公司的入站咨询增加了250%。在医疗保健领域,对电话口译(OPI)和视频远程口译(VRI)的请求增加了50%以上。这尤其是由于远程医疗的激增。随着全球医疗保健提供者敦促患者在亲自访问医生的办公室、诊所和医院之前打电话给他们,所以OPI正被用作支持所有语言背景的人的一种手段。此外,律师事务所已经开始以VRI呼叫的形式利用虚拟口译。

由于全球旅行禁令,现场活动的口译服务已被取消。反过来,各种活动以及支持这些活动的口译服务也已在线转移。鉴于需求量激增,需要更多资源来满足新客户的额外培训和设置要求,并配备和培训新的口译员。例如,VIT提供商KUDO在短短一个月内将其内部人员增加了一倍。同期,经过KUDO认证的口译员数量也增加了2,000,至总数为3500。因此,尽管全球流行病严重打击了现场口译业务,但它促进了虚拟口译的增长。


在目前这类技术的市场渗透速度略有下降的挑战中,VIT 提供者 将其命名为:
• 培训客户使用新技术
• 未能找到愿意在国际上测试该平台的合作伙伴
• 继续利用微软,亚马逊和谷歌等主要技术公司的巨额投资
• 认真应对增长的迅猛增长,并在新兴的语言技术解决方案和服务领域中使用新的光学系统

由于在COVID-19大流行的最初高峰之后向“正常”的过渡很缓慢,我们希望虚拟口译将继续增长。一些VIT提供商认为,随着对专用远程口译技术和服务的可用性,实用性和价值有了新的认识,虚拟口译实际上将成为新的规范。

远程配音
媒体本地化公司一直积极主动,迅速适应和重塑自己,以在保持质量标准的前提下继续在线提供多语言录制。

尽管对于许多公司而言,这已经是灾难恢复解决方案,并且他们希望回到录音棚,但事实证明,远程配音技术可用于类似情况(新一波的COVID,地震,洪水等)或其他情况。应用此技术的更多创新方法(例如,正在休假并需要录制几条线路的语音人才,混合解决方案,增加旺季的配音能力等)。

配音公司在远程路径上面临的主要挑战是:
1. 尊重录音室的工作流程,并能够在配音过程中联系不同的涉众(语音人才,艺术总监,音响工程师)。
2. 考虑到配音演员在家录音时没有录音室的质量条件,因此要保持可接受的录音质量标准。
3. 确保安全措施以保护客户资产。

字幕,自动字幕和语音识别
看到支持视听翻译技术的需求,TMS系统继续在其翻译环境中添加字幕编辑功能和视频预览。这就是为什么我们在本节中包括Cloudtranslation,memoq,SDL,Smartcat和Wordbee之类的公司的原因,尽管这些公司不是字幕编辑器,而是带有用于字幕本地化的插件和环境的工具。

关于自动字幕,还需要注意另一个重要注意事项:诸如AutoCap,iPhone的Clips,Quicc之类的一些应用程序以及添加到此类别的其他一些应用程序都旨在为社交媒体内容提供字幕(例如,Instagram,Facebook,Snapchat和类似)。

语音识别功能正在迅速添加到许多工具中,例如在线会议平台。该领域的最新发展包括Google的Zoom实时字幕或Android的Transcribe都出现在2020年春季。

上下文审查

语境审查是语言服务购买者仍在苦苦挣扎的一个重要(虽然不是新的)利基市场。上下文审查工具可帮助您识别翻译内容中的错误,并在工作环境中随时进行修复。最受欢迎的用例之一是在线工具,可以对基于Web的产品,桌面应用程序和网站进行上下文内翻译和国家/地区审查。

即使市场上有行之有效的解决方案,例如Lingoport的InContext Translation和QA,Rigi.io或translation5的visualReview,它们都可以帮助进行国内审核,但全球的营销和本地化团队仍将这项审核活动称为“持续的问题。这可能就是某些LSP开发自己的解决方案的原因,例如Venga Global的InView for Product。

专注于TMS
在论文中,TMS代表翻译管理系统。然而,本地化行业对这一名称所涵盖的特征和功能存在分歧。这是语言技术市场上发展最快的部分。

Nimdzi语言技术图集的TMS部分提供了150多种技术解决方案。在对Nimdzi语言技术图集的调查中,TMS类别占43.75%。

这是最原始的语言技术之一。自2010年以来,该细分市场一直在蓬勃发展,因此我们决定就其在35年来的发展历程和发展历程制定历史时间表。

Nimdzi专刊:TMS的历史,1980年代至2010年

在TMS之前,有CAT工具。一个CAT(计算机辅助或计算机辅助翻译)工具软件,它允许用户与双语文本的源和目标(翻译)工作。它的核心组件包括翻译记忆库(TM),术语库(TB)和(有时但不一定)机器翻译选项。通常还包括一个内置的质量保证(QA)功能。

随着时间的流逝,为了更快地完成翻译工作并使其具有更高的可扩展性,这些组件已不再足够。这就是CAT环境中出现各种管理功能的方式,从而催生了TMS。为了更轻松,更快捷的性能,云中也出现了许多CAT工具。它们是TMS的本质。

让我们来看一下这项技术的历史和最古老的工具的沿革
——从1980年代到2010年

1984年
该ALPS计算机辅助翻译系统在语言研究的沃里克郡,英国考文垂的兰彻斯特理工大学系出现了。

1986年
STAR Transit:始于1986年。然后,在1991年,Transit 1.0(32位DOS版本)成为最早出现的专用于翻译的工作站之一。其背后的概念不同于该时期在市场上推出的其他(CAT)工具。Transit基于用户输入数据库的不同语料库,而CAT系统是源文本和目标文本之间的一对一分段对应。

80年代末
Trados GmbH在80年代后期开始开发翻译软件。在90年代初,他们发布了套件的两个主要组件的第一个Windows版本,即1992年的MultiTerm和1994 年的Translator's Workbench。

1997年,当微软决定使用Trados满足其内部本地化需求时,公司获得了极大的推动。在2005年,Trados被SDL收购。此次购买继续了语言服务和工具行业的一轮整合,该合并已经开始成形。

1992年
GlobalWare推出了XL8代码(DOS)-交互式工具,用于翻译和维护C语言源代码中的用户界面文本字符串。它的优势在于重用以前的翻译并自动处理修订;它的模糊匹配算法扫描了新的源语言文件,以查找先前翻译的材料并进行替换。听起来像是翻译记忆库!

XL / 8支持其他平台(包括Windows,Macintosh和Unix)上的字符集。在1994年,GlobalWare还推出了名为XL8帮助和XL8文档的补充软件包。

1993年
Atril的DéjàVu的开发是对MT(机器翻译)系统和TM工具进行试验的结果。初步版本于1993年6月完成,Windows 3.1的翻译工具诞生了。1993年11月,向公众发布了与Microsoft Word for Windows 2.0集成的界面,该界面创建了DéjàVu的版本1。

1994年
MultiTrans(最初为MultiCorpora) 在加拿大安大略省渥太华成立。

1990年代中期
启动了IBM Translation Manager(通常称为TM / 2)。

1998年
北京雅信信软件技术有限公司成立,专门从事翻译软件的开发,是中国第一个CAT工具。
在年底,SDL发布了SDLX,这是一套翻译记忆库工具。SDLX最初是在SDL内部开发和使用的。

1999年
最初的Wordfast产品,现在称为Wordfast Classic,由Yves Champollion开发,是Trados的更实惠的替代产品。
上海交通大学双威软件产业有限公司从北京雅信软件技术有限公司收购了雅信CAT,并发布了雅信CAT v1.0。

2002年
XTM由Bob Willans和Andrzej Zydron创立,“比其他基于云的TMS要早得多”。
在加拿大,MultiTrans 3发行了,引入了新的高级杠杆翻译记忆库(ALTM)。
华健IAT在中国发布。

2003年
GlobalLink(最初由eTranslate于1999年作为支持工具开发)在母公司被TransPerfect收购后进行了巨额投资。 

2004年
memoQ(Kilgray)由三名语言技术人员在匈牙利建造:BalázsKis,IstvánLengyel和GáborUgray。公司的名称Kilgray源自其创始人的姓氏。第一份memoQ于2006年发布,并很快开始与SDL Trados竞争。

2005年
Across Systems GmbH成立。

2006年
Lingotek由Jeffrey Labrum在美国犹他州德雷珀创立。

2008年
Wordbee由JoséVega和StephanBöhmig创立。

2009年
斯文C.安德拉作为安德拉AG于1999年创立,ONTRAM成为可与2009年的商业产品
Smartling是由杰克焊接部和安德烈Akselrod成立于纽约市。

2010年
IBM TM2的核心于2010年向开源社区开放。(TM2代表TranslationManager2。它起源于IBM Translation Manager)。
Memsource成为针对LSP的工具,具有易于访问Web应用程序,较低的初始成本以及免费的翻译许可的功能。

2010年之后,该行业开始突飞猛进地发展,每年都有数十种TMS被推向市场。从那时起,平均每个月发布一次新的TMS。

未来一年的前景
与企业级购买者一方的领导人一起,在2020年实现这一目标的同时,我们更多期望:
• 支持CL方法的工具
• CMS连接器,中间件和集成商
• 与其他领域(例如,多媒体,设计)的现有工具的内置集成
• MT质量评估和预测工具
• 商业智能驱动的运营(例如后期编辑)
• 上下文中的翻译和审阅解决方案  

市场上工具太多的主要问题是难以整合工具或在一个工具与另一个工具之间进行切换(杠杆损失,迁移成本,定制成本)。对于大型组织而言,数十年来积累的大量遗留工具和内容进一步加剧了这种情况。尽管他们可能会密切关注市场,但他们现有业务的重心却在积极地阻止他们进行技术转换。行业标准化的举措可能会在这方面有所帮助,但只能从更长远的角度来看,而且随着这些标准的采用者数量的增加而出现。我们不希望在2020年之前彻底解决此互操作性问题。

更重要的是,技术解决方案过多并不一定会对买家有太大帮助,尤其是当他们想要的是针对其独特问题的解决方案时。买家反复表达的一种观点是,在功能方面需要灵活性-他们需要定制的解决方案。这给了我们一个想法,即本地化技术将继续在价值链中向上移动,将更多的用户友好的现成解决方案和集成与来自互联域的流行工具相集成。


更新和可用性
这项研究的信息图表可公开获得,并且可以与引用的来源一起重复使用。当可获得有关新工具的信息时(或根据创新的速度更频繁地),它会每年进行更新。



深圳云译科技有限公司

深圳云译科技有限公司由厦门大学资产经营有限公司、厦门大学自然语言处理实验室、深圳新宇智慧科技有限公司共同成立,结合最先进的神经网络学习技术与专业资深的翻译团队,为世界提供行业领先的机器翻译解决方案。服务包括: 
 

机器翻译引擎定制

1、采用最先进的神经网络机器翻译模型
2、根据客户的数据和需求定制机器翻译引擎
3、内网部署满足客户数据保密需求
4、私有云定制及部署,领先的数据安全保障技术

云译翻译平台
目前支持28种语言互译,包括英文、日文、俄语、法语、德语印尼语等,以及藏、维等中国少数民族语言。
该平台不仅支持文本翻译,同时也支持文档翻译(Word、Excel等),一键上传,秒速翻译,为您解决多语言交流的难题。

扫下方二维码免费试用:

云译机器翻译引擎垂直细分领域平台
目前支持17个专业垂直领域的翻译平台,其中包括中英通信、中英专利、中英学术、中英财经、中英新闻、中英医疗、中英电商、中英口语、中文繁体英文财经、中英IT、中英汽车、中英学术与中英法律领域。
   
云译公有云平台
1、提供免费的高质量机器翻译服务
2、强大的云计算和云储存能力,提供翻译记忆匹配、智能输入和术语识别,支持多种文件格式
3、实现人机、人人、机机全方位合作,突破传统翻译工作模式,带来全新翻译工作体验

教学教育
1、为高校提供云译MT+PE模式相关教材及教学工具,实现翻译教学新突破
2、开展神经网络机器翻译培训,打造神经网络机器翻译教学及实训平台

云译官网:

每周更新最新AI与机器翻译类资讯
长按二维码关注我们
新闻分类
最新行业动态