如何利用机器翻译以敏捷方式完成海量内容的本地化

当今时代,移动设备与我们如影随形,内容的制作、传播和消费方式也因此而彻底改变。企业如今面临的最大难题是,他们翻译内容的速度能否赶得上内容的消费速度。这一难题的唯一可行解决方案是,采取一种动态、敏捷的本地化策略,将量身定制的机器翻译整合到本地化工作流程中。

云技术让我们得以专注于长期可扩展性,大规模提供敏捷型统计机器翻译解决方案是一项很有趣味性的挑战。它涉及到一系列领域,包括引擎定制、改进和部署。除此之外,还需要开发一种具有弹性且经济合算的分布式软件体系结构;要想成功,还需要将这些组件与一种高度自动化机制捆绑在一起,以便加快定制、改进和部署过程的速度。

云提供了我们大规模运行 MT 系统所需的一切,本演示将简要介绍 KantanMT.com 如何利用云作为交付机制直接化解这些挑战,从而交付一个高度可扩展的引擎来向数百名 KantanMT 社区用户提供 SMT 服务。

统计机器翻译需要大量的内存、磁盘空间和计算能力。云能够以十分经济合算的价格提供这三个要素,并且可让我们向全球范围内的客户提供机器翻译服务;他们不需要任何专用硬件或软件,而只需登录,然后便可即时配置应用程序环境并构建自己的 MT 引擎。

云端机器翻译

  • 开发高速、高质量 SMT 解决方案的完美平台
  • 开发可弹性使用的可扩展云端 SMT 解决方案
  • 确保云端 SMT 安全可靠 – 涉及哪些因素?
  • 运用分布式软件体系结构来充分发挥云的强大功能、灵活性和
  • 经济性
  • 大规模部署 SMT
  • 这意味着什么?如何实现?
  • 99.999% 正常运行时间,全年全天候可用

提高质量的关键 – 量身定制的 MT, 如果能采用一种可直接纳入本地化工作流程中的动态统计机器翻译解决方案,您企业的本地化难题就已经攻克了一半。如果再能够实施一种可通过定制来保障最高质量结果的 MT 解决方案,您便大功告成了。

为了确保机器翻译结果的准确性,KantanMT 采用了多种不同的引擎定制策略,例如译后修改自动化规则、预测性质量估算和命名实体识别。

KantanMT 客户采用命名实体识别成功改进了翻译流程,减少了翻译出来的产品信息中的大小和尺寸错误数量。通过在机器翻译过程中识别并正确转化命名实体,我们可以在翻译包含度量值、大小和部件号的内容时获得更高的译文准确性和一致性。命名实体可以改进海量/一次性内容(例如用户生成的产品说明)和度量值数据的翻译质量。

量身定制的机器翻译

  • 命名实体识别
  • 使用情形示例
  • 混合 SMT – 充分利用 MT、TM 和规则
  • 利用自动化的质量评估和分析提高引擎性能
  • 在 SMT 环境中进行预测性质量估算 本演示最后将安排观众讨论在实施动态、敏捷本地化策略方面目前采用的最佳做法。