当前位置:主页 > 翻译软件 >

开源翻译软件 OmegaT

一、CAT 简介 (计算机辅助翻译)

在文档或软件翻译以及本地化领域,CAT是重要的翻译辅助工具。CAT是 Computer Assisted Translation 的缩写,即计算机辅助翻译,这种工具的核心是利用翻译记忆(Translation Memory,缩写TM)和词汇表(Glossaries),可以在翻译人员在遇到类似句子和相同词汇时提供之前的翻译作为参考,让翻译人员选择较适合的翻译。这种方式对原文频繁更新(例如软件的说明文档)和多人协作翻译时能较大的减少重复劳动,同时保持翻译和术语的一致性,这样能有效减少翻译时间和成本,并保持翻译品质和风格。提到CAT,必须提到的是机器翻译(Machine Translation,经常简写为 MT),这是通过语料库技术自动从一种语言翻译成另一种语言,因此它和CAT的不同点是在翻译的过程中无需人工介入而直接得到结果。如果您还不是很明白, 那么可以尝试使用并对比谷歌翻译和谷歌译者工具包,其中前者是机器翻译,后者是计算机辅助翻译。

翻译

商业软件中较有代表性的 CAT 工具是 Trados,它的使用较广泛。不过在开源软件中,也有在辅助翻译的功能上不亚于它的工具,例如OmegaT、 Open Language Tools 等,比起商业软件,这些开源工具一般都使用跨平台语言(如Java、Python等)编写而成,因此通常可以在多平台中运行,同时由于在翻译记 忆和词汇表中一般使用开放的格式(对于翻译记忆如TMX,对于词汇表如TBX)开源翻译软件,所以外包翻译业务时可以减少翻译记忆转换的时间和可能的匹配度的损失,或当某个时候需要换其他工具时可以很方便的转换过去。

开源的计算机辅助翻译工具有许多(请参阅前面的维基百科CAT词条),其中的 OmegaT 有一定的代表性,比起 Trados 它上手快速的多,并且它也被其他许多CAT和ITE项目作为套件中的核心部分,例如Autshumato translation suite、OmegaT+等。

二、需求分析

我不是专业译者,使用CAT工具辅助翻译 AutoHotkey 帮助文件,当时考虑到 AutoHotkey 的更新频率较快,若采用人工比对进行翻译则每次都 需要花费相当多的时间在不相关的事情上,同时曾考虑到多人协作中保持风格的一致。经过约半年的努力,终于把整个帮助文件的翻译基本存入翻译记忆,在最开始 进行时开源翻译软件,使用的帮助文件是1.1.00.00版本,到最后更新结束时,版本升级到1.1.05.06,而这英文帮助的更新没有对我的工作造成多少影响。倘 若我仍采用手工更新,那么要完整的更新某个版本的工作是难以想象的(只能像以前那样重点更新),同时现在也无法发布紧跟最新版本的中文帮助,更重要的是, 以后AutoHotkey更新时,中文帮助仍将无法及时更新。所以这样的努力尽管艰辛,却仍是非常值得的。

在我一开始苦恼帮助的更新问题时,曾尝试过多种CAT工具,从谷歌译者工具包、Trados、DejaVuX,到现在的OmegaT。因为缺乏经验,这期间走了许多弯路。AutoHotkey 的帮助文件是CHM格式,解压出来为 HTML 文件。从谷歌译者工具包导出的已翻译文件的版面会变得面目全非,而 Trados 和 DejaVuX 在这方面稍好,却仍存在问题,尤其对于其中的示例代码部分(如果从一开始关注我发布的帮助文件,可能对这些印象深刻)。曾尝 试过对这些问题进行修正,结果不够理想。同时,谷歌译者工具包中的翻译记忆无法导出,而Trados、DejaVuX 的翻译记忆需要转换,于是在它们上面 进行的工作除了帮助我找到正确的方向外,几乎全部白费。这时逐渐确定了寻找合适CAT的要求:1. (尽可能)完整保持HTML板面;2. 使用开放的翻译记忆格式;3. 入门尽量简单(在多人协作时需要考虑的)。在这三点上 OmegaT 完全满足,同时还是自由软件,尽管在某些功能上略显不足,也成为我目前的较好选择。