查看原文
其他

专访 | 韩林涛:文科生如何学习机器翻译?

程黛圆 翻译技术教育与研究 2023-11-22

如今,人工智能的时代大势引发了深刻的技术革命、教育变革和数据革命,同时翻译技术也成为了翻译教学和实践中不可分割的部分,进一步推动了语言服务行业和高校教育的创新变革,促进了技术与人的和谐共生。为提升语言服务行业各方对翻译技术的认识和应用能力,加强语言服务人才的技术素养,加速语言技术成果的高效转化,整合当前优质和有效的翻译技术资源,推动翻译技术与翻译教学的融合发展,促进政、产、学、研的协同创新,WITTA翻译技术教育研究会(TTES)特别策划了【大咖专栏】,本期专栏将聚焦“机器翻译和译后编辑”,对话业界和学界的专家教授,聆听业内名家的精彩观点,洞见未来翻译技术发展趋势。


本期专访嘉宾是北京语言大学外国语学部高级翻译学院硕士生导师、国家级和北京市一流本科专业翻译(本地化方向)专业负责人韩林涛老师。让我们来听听他对译后编辑的看法。

 在人机共生时代,您认为文科生应如何学习机器翻译?


机器翻译的出现源自人们对不同自然语言间转换的迫切需求,这种需求可以是军事领域的、可以是学术领域的、可以是商业领域的,也可以是与日常沟通相关的,当人工翻译无法满足其中的一部分需求时,全自动的机器翻译应运而生,从高成本低质量逐步演变至今日的低成本高质量,与之相关的争论也持续至今。


随着神经机器翻译技术的出现,越来越多的人开始认可机器翻译,也促使更多人想去探究“机器翻译”。现在似乎人人都在谈机器翻译,但仔细一看,却发现大家对“机器翻译”的理解是不同的。假如一所大学的人工智能学院开设了一门“机器翻译”课,这所大学的高级翻译学院也开设了一门“机器翻译”课,你会选择去修哪一门呢?


东北大学肖桐教授和朱靖波教授合著的《机器翻译:基础与模型》一书的内容如下:

(来源:https://github.com/NiuTrans/MTBook)


如果一周学一章,一个学期下来正好学十八周。


我们再来看世界翻译技术教育联盟(WITTA)翻译技术教育研究会在2019年推出的《机器翻译与译后编辑》教学指南:



显然这门课程就更“文”一些了,少了很多“模型”,多了很多“技能”、“工具”和“方法”。所以,对于翻译专业的文科生而言,按这门课程的内容来学习机器翻译要更实际一些。


以上两门课程一武一文,前者更偏向于机器翻译的原理,后者更偏向于机器翻译的应用。


一个人工智能学院的学生毕业后进入翻译公司,老板说“我想拥有一套机器翻译系统”,于是这位同学会打开一台电脑,部署一套开源的神经机器翻译源代码,然后瞪着水盈盈的大眼睛问老板:您的数据在哪儿?


一个高级翻译学院的学生毕业后进入翻译公司,老板说“我想拥有一套机器翻译系统”,于是这位同学会打开一台电脑,打开某个计算机辅助翻译工具的页面,然后瞪着水灵灵的大眼睛问老板:十几个机器翻译系统,您想选哪一个?


不知道大家有没有看懂这两个例子,如果你学机器翻译的目的是想造一个新的机器翻译引擎,那么可以去人工智能学院,神经机器翻译模型是现成的,优化神经机器翻译模型的技术是现成的,网上开源的小规模双语数据也是现成的,学完之后可以直接用开源的机器翻译模型来部署一套新的机器翻译,也可以自己依据神经机器翻译的算法来从零做一套机器翻译系统。你可以过不了四六级,但这不影响你开发出一套有模有样的在线机器翻译系统,然后起个酷炫的名字发布到网上供别人免费使用。但慢慢你会发现,你渴望更多的双语高质量数据,没有更多的数据你没法进一步提高机器翻译的质量;慢慢你会发现,你需要更大的模型更好的硬件,否则也没办法进一步提高机器翻译的质量。


但如果你学机器翻译的目的是为了用更快的速度完成更多的翻译任务,那么你可以去高级翻译学院,那里有人告诉你怎样的机器翻译引擎适用于怎样的领域,那里有人告诉你怎么去修改低质量的机器翻译结果。你可以完全不懂编程,但这不影响你在一个精密的计算机辅助翻译工具去自如的切换不同的机器翻译引擎,你可以在翻译完几十万字后对不同的机器翻译引擎评头论足,你可以构建一整套机器翻译应用于某个具体领域的语言服务解决方案,然后给这套解决方案起个酷炫的名字去说服你的客户购买你的语言服务。但慢慢你会发现,你渴望机器翻译系统能够根据你的质量反馈意见来优化它未来的翻译结果,否则你只能重复修改一样的错误;慢慢你会发现,不仅机器翻译的质量还有很大问题,你自己的中外文水平也有很大问题,限制你翻译业务发展的反而是你自身的语言水平。


当然,也有一部分人,他们既没有去人工智能学院学过机器翻译,也没有去高级翻译学院学过机器翻译,但也有不少与机器翻译有关的雄论。对文科生而言,两种类型的课程都可以去学习,如果你还是本科生,不妨趁年轻都深入学习一下;如果你还是研究生,不妨先照着机器翻译与译后编辑课程的大纲学习如何让机器翻译质量的变得更好,然后再花点时间去了解机器翻译的原理。但我奉劝大家,没有学这两门课程之前,切勿瞎说。


在翻译实践和翻译教学中,如何选择合适的机器翻译系统?

翻译实践和翻译教学所使用的文本是不同的,所面临的场景也是不同的。


在翻译教学中,往往要根据学生的能力发展路径来设置典型的文本案例,而这些案例又要根据培养目标来从不同领域甄选,甚至还要在甄选后重新调整文本以满足教学需要。因此,并非所有的翻译教学环节都需要与机器翻译系统相结合,也并非所有的翻译类课程中都要嵌入机器翻译相关的教学内容。比如在一门文学翻译课程中,适当嵌入机器翻译系统给出的文学作品译文来进行对比分析是可以的,而且可以同时对比多个机器翻译系统的译文,这样做的目的是让学生意识到文学翻译与机器翻译的关系,帮助学生培养批判思维能力。而在一门非文学翻译课程中,针对文本的题材来选择合适的专利翻译引擎、财经翻译引擎、IT翻译引擎等则是必要的,毕竟在专业领域垂直的机器翻译系统往往给出的译文质量更高。授课老师应当对自己所擅长领域的常用机器翻译系统有全面的了解,熟知通用领域机器翻译、垂直领域机器翻译的优缺点和调用方法,尤其是与计算机辅助翻译工具相结合的方法,为日后开展翻译实践做好准备。


而在翻译实践中,选择机器翻译系统则需要十分谨慎,假如我们要基于机器翻译来对1万字进行译后编辑,明明小牛翻译的质量更好,但我们习惯上认为谷歌翻译更好,便立刻使用谷歌翻译来预翻译这1万字,并投入大量时间和人力来做译后编辑,最后非但没有提升效率,甚至会降低质量,还会造成无谓的成本损失。


我们建议长期从事某个翻译实践的个人或企业对该领域的不同机器翻译系统产品进行定时定量的翻译质量评估。质量评估的方法优先采用国内外通用的翻译质量评估模型,如MQM、DQF等。针对翻译质量评估的结果形成专门领域的机器翻译译后编辑指南,如中国翻译协会本地化服务委员会推出的《技术文档机器翻译译后编辑入门手册》。根据此类指南再选定多款常用的计算机辅助翻译工具(如国外的、国产的、线上的、客户端的等),针对不同计算机辅助翻译工具的功能特点编制机器翻译译后编辑工作流程。从而为未来的翻译实践做好相应准备,针对翻译实践的文本特点、客户需求、人员组成等快速构建适应的机器翻译译后编辑流程。


目前高校开设机器翻译课程所面临的主要问题是什么?

问题一:缺乏足够的翻译实践项目

纯粹的翻译类课程往往以翻译能力提升为主,许多高校甚至没有足够的翻译类课程,有些高校则没有足够的翻译实践项目,无法在实战中接触机器翻译译后编辑流程,所以这些高校对机器翻译课程的诉求并不强。


问题二:缺乏能够讲解机器翻译的师资

与计算机辅助翻译课程早期普及面临的问题类似,能够针对翻译专业文科生讲解机器翻译原理和应用的师资严重匮乏。虽然现在市面上可以找到许多机器翻译的教材和视频资源,但均不是以翻译专业文科生作为授课对象来讲解,因此这些资源无法直接为翻译专业授课教师所用。机器翻译的原理涉及线性代数、概率论、微积分等数学知识,且原理部分即便能够以通俗易懂的方式讲解清楚,翻译专业授课教师也难以给学生演示这些原理是如何应用于实际的机器翻译系统开发的,所以翻译专业授课教师仅能将机器翻译作为一个工具,重点讲解如何开展机器翻译的译后编辑。

请您结合自身经验谈谈如何更好地在BTI和MTI开设机器翻译课程?

如果高校能够引入大量真实的机器翻译译后编辑项目,就会倒推高校在既有的计算机辅助翻译课程中纳入机器翻译相关的课程资源,进而形成机器翻译译后编辑课程,最终形成完整的机器翻译课程。


对于BTI而言,本科阶段应当尽早在大一开设数学基础课程,讲解线性代数基础、概率论基础、微积分基础,并在大一阶段开设Python课程,以此为未来开设机器翻译课程打好基础;本科阶段最早可在大三开设自然语言处理基础课程,并在其中嵌入机器翻译的原理,教会学生如何部署一个简单的开源机器翻译引擎;本科生不必过早接触机器翻译译后编辑课程。


对于MTI而言,绝大部分进入研究生阶段的同学在过去的四年间并没有足够的数学基础、编程基础和自然语言处理基础,因此并不能在研一阶段充分理解机器翻译的原理,所以可以在开设计算机辅助翻译课程的前提下,开设机器翻译译后编辑课程,帮助学生了解如何评估机器翻译的质量、如何在计算机辅助翻译工具中应用机器翻译、如何管理机器翻译译后编辑项目等;对于学有余力的研究生,可以进一步讲解机器翻译的原理,帮助他们进一步分析机器翻译的优缺点成因。


您认为机器翻译技术对高校翻译专业的发展和翻译专业的学生职业发展有什么样的影响,对此您有什么样的建议?

高校教师必须系统性学习机器翻译的原理和应用方法,尤其是机器翻译译后编辑模式,结合真实的大量的翻译实践来产生正确的“机器翻译观”,否则教师将无法在课堂上正确引导学生使用机器翻译。


对于翻译专业学生而言,如果没有合适的机会来学习与机器翻译相关的基础知识(数学、自然语言处理、编程等),那么应该熟练掌握机器翻译质量评估的方法,否则未来将会在翻译实践中错误选择机器翻译;应该熟练掌握计算机辅助翻译工具,将机器翻译连同翻译记忆库、术语库等一同应用于真实的翻译实践中。


翻译专业师生应当对机器翻译技术保持敬畏,甚至适当恐慌,因此激发自己不断提升中外文水平和翻译水平,并根据机器翻译的优缺点来选择适合自己的专业领域,将机器翻译作为工具,形成一套属于自己的个性化的机器翻译应用工作流,并等待未来机器翻译应用技术的不断改良升级,为搭建专属于自己的机器翻译系统做好心理准备和技术准备。


韩林涛

北京语言大学外国语学部高级翻译学院硕士生导师,担任国家级和北京市级一流本科专业翻译(本地化方向)专业负责人。在校主讲本科阶段和研究生阶段术语学、翻译项目管理、计算机辅助翻译、数据库原理、翻译与本地化实践、翻译项目管理等课程,长期致力于探索“翻译”与“技术”的深度融合之道。著有《译者编程入门指南》,由北京市教委评为北京高校优质本科教材。在语料库研究方面,韩林涛担任冬奥术语平台项目负责人,参与设计研发支持八个语种的在线术语检索和管理平台;新冠疫情爆发后,韩林涛研制了在线多语种疫情平行句库Bicovid.org,并将该平台的核心代码开源发布,可以实现多语种平行句库的上传、审核、管理、发布和查询。




各位同仁:

本团队希望从翻译与本地化项目经理的视角出发,调研语言服务企业对翻译管理系统的应用,诚邀您根据实际情况填写问卷。问卷内容不涉及个人隐私,仅做科学研究。若您对问卷结果感兴趣,可以在问卷中留下联系方式。也请您帮忙转发给有类似经历的朋友于同行,感谢您的参与和支持。
世界翻译教育联盟(WITTA)翻译技术教育研究会(TTES)
问卷二维码

问卷链接(或点击下方“阅读原文”)https://www.wjx.cn/vj/QGq7S47.aspx



往期精彩回顾




AntConc简介及索引工具介绍(一)

神经机器翻译 VS 神化机器翻译?博芬联合创始人赵杰

用导图读论文 | 王华树 刘世界:人工智能时代翻译技术转向研究

翻译必备术语库和语料库合集(附网址)!

冯志伟:我老了,机器翻译依然年轻

职业翻译必备的计算机翻译辅助软件| 附网址

专访 | 崔启亮老师:机器翻译对语言服务企业有多大作用?

专访 | 黄书剑:如何评价机器翻译质量的好坏?

关注我们,了解更多资讯
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存