查看原文
其他

ChatGPT ⏐ 投喂语料,提升译文质量

李林 翻译技术教育与研究
2024-09-09
本文约 1400 字,预计阅读时间 6 分钟


利用GPT-4引擎,ChatGPT可以读取网页内容,根据上下文和用户意图生成更加流畅和自然的翻译。如何利用这一特性,让ChatGPT学习语料并最终生成高质量的翻译?本文探索了将双语语料上传至谷歌文档,让ChatGPT读取学习,从而从而提升译文质量的方法。使用这种方法,我们可以将双语语料输入到ChatGPT中,并将其应用于翻译。


1、投喂语料

在 Google Drive 上传语料,此处选择《中华人民共和国民法通则》双语版(22624个字/词)作为语料。上传后在文件右上方修改文件权限为【公用】-【所有人可编辑】,以供ChatGPT读取。

 

【本质】:利用ChatGPT只能读取网页的特性,将语料做成网页版,让它读取。

2、翻译测试文本
选自《中华人民共和国民法通则》中第一百五十四条(注:语料中已将这条删去)

测试文本官方译本:
Article 154   Time periods referred to in the Civil Law shall be calculated by the Gregorian calendar in years, months, days and hours.

When a time period is prescribed in hours, calculation of the period shall begin on the prescribed hour. When a time period is prescribed in days, months and years, the day on which the period begins shall not be counted as within the period; calculation shall begin on the next day.

If the last day of a time period falls on a Sunday or an official holiday, the day after the holiday shall be taken as the last day.

The last day shall end at 24:00 hours. If business hours are applicable, the last day shall end at closing time.


3、测试第一步
在未读取语料、没有任何提示词的情况下,让ChatGPT翻译,结果如下(注:标黄处为和原文本不同的地方):


Article 154: The time
period referred to in the Civil Code shall be calculated in years, months, days, and hours according to the Gregorian calendar.

If the time period is stipulated to be calculated in hours, it shall be calculated from the specified time. If the time period is stipulated to be calculated in days, months, or years, the first day shall not be counted, and the calculation shall begin from the next day.

If the last day of the time period falls on a Sunday or other statutory holiday, the following day shall be deemed as the last day of the period.

The deadline for the last day of the time period is 24:00. If there are business hours, the deadline is until the end of the business activities.


4、测试第二步
加入提示词(法律英语),让其润色。提示词来源于AIPRM FOR CHATGPT。结果如下:(注:绿色为润色内容,黄色为与官方译文不同之处)
Article 154
Civil Law stipulates that time periods in civil law shall be calculated in years, months, days, and hours according to the Gregorian calendar.

If a time period is specified to be calculated in hours, it shall commence from the specified time. If a time period is specified to be calculated in days, months, or years, the first day shall not be counted, and the calculation shall commence from the next day.

If the last day of a time period falls on a Sunday or another statutory holiday, the following day shall be deemed as the last day of the period. The deadline for the last day of a time period is 24:00. If business hours are in effect, the deadline extends to the cessation of business activities.


5、测试第三步:

读取语料,输入提示词,进行翻译,结果如下:

 

(将文档链接输入对话框,分享给ChatGPT

(让ChatGPT简单分析原文的语言风格,确保它正确读取文件,且理解原文)

让ChatGPT翻译)

译文:
Article 154: The periods referred to in the Civil Code shall be calculated in years, months, days, and hours in accordance with the Gregorian calendar.
If a period is specified in hours, it shall be calculated from the designated time. If a period is specified in days, months, or years, the first day shall not be counted and the period shall be calculated from the following day.
If the last day of a period falls on a Sunday or other legal holiday, the day after the holiday shall be deemed as the last day of the period.The deadline for the last day of a period shall be 24:00. If there are business hours, the deadline shall be the end of the business activity.

(输入 prompt,润色译文)

 The periods mentioned in the Civil Code are calculated in years, months, days and hours according to the Gregorian calendar. The first day of the period is not counted for periods in days, months, or years, and the period begins from the following day. If the last day of a period falls on a Sunday or legal holiday, the last day is the day after the holiday. The deadline for the last day is the day after the holiday. The deadline for the last day of the period is 24:00, or the end of business activity if applicable.

6、使用BLEU机器翻译质量评测算法判断这四份译文优劣

使用官方译本作为标准。可以直接在ChatGPT里计算,也可以使用代码计算。此处选择直接让ChatGPT计算数值。

 

(第一份使用BLUE的测试译文)

(第三份测试译文的数据及其它测试的 prompt

(python 指令,如选择使用 python 测试,可使用该指令)

数据如下:

第一份:0.802

第二份:0.892

第三份:0.94

第四份:0.77


发现第三份的相似度是最高的,说明让ChatGPT读取语料库的方法,确实能提高翻译质量

特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。
- END -

翻译技术教育研究会ChatGPT专题小组致力于探索发掘ChatGPT为代表的AI工具在语言服务不同阶段的应用,进而提高从业者的工作效率。专题小组目前的主要方向是探索指令(prompt)及流程变更如何提升交互效果;了解及推介Github等平台上的AI应用,AI应用嵌入语言服务流程及其优化方式。小组通过定期会议及讨论确定选题方向并通过文章、视频等形式分享探索结果,欢迎通过文章留言为大家提供建议意见!


原文作者:李林

推文编辑:周琳
指导老师:陈杲
项目统筹:李林

资讯推荐

网页端机辅翻译 LangrageX


▶ 技术与工具

国内外常见语料工具一览

国内外常见术语管理工具

翻译必备术语库和语料库合集(附网址)

翻译必备的计算机翻译辅助软件(附网址)

AntConc:实用的本地语料库检索工具

TREX:有海量例句、丰富语料的在线词典

Netspeak:一款免费的单词搭配检索工具

WantWords反向词典,内含开发团队公开文档

Cymo Booth:同声传译员的专属虚拟同传间

MateCat:一款免费的在线CAT工具

Visuwords:可视化在线词典,帮你一键构造记忆宫殿

Linggle:语料+搭配检索工具(实操演示)

Ludwig: 地道英文写作辅助神器,告别中式英语

Reverso:辅助写作与翻译神器


▶ 国际语言服务动态

| 翻译公司篇 | TransPerfect简介

| 翻译公司篇 | 全球第2名 RWS如文思

| 翻译公司篇 | “收购狂魔”Keywords Studios

| 咨询机构篇 | Nimdzi Insights简介

| 咨询机构篇 | Slator 简介

| 咨询机构篇 | CSA Research 简介

| 行业机构篇 | 国际翻译家联盟FIT

| 行业机构篇 | 美国翻译协会ATA

| 行业机构篇 | 加拿大联邦翻译局 Canada's Translation Bureau

| 翻译院校篇 | 明德大学蒙特雷国际研究学院(MIIS)

| 翻译院校篇 | 格拉斯哥大学

| 翻译院校篇 | 埃塞克斯大学

| 热点追踪 | ChatGPT的伦理问题(上)

热点追踪 | ChatGPT的伦理问题(下)


▶ 专访

王华树:机器翻译将要取代人工翻译吗?

崔启亮:机器翻译对语言服务企业有多大作用?

韩林涛:文科生如何学习机器翻译?

魏勇鹏:机器翻译质量评估为什么重要?

徐彬:熟练掌握翻译技术,就能做出漂亮的活儿

曹首光:如何打造一款受欢迎的机器翻译产品? 

李梅:机器翻译对未来翻译教育有何影响?

周兴华:高校翻译教师如何学习翻译技术?

丁丽:译后编辑人员与译者身份是否对等?

王巍巍:疫情背景下远程口译的挑战和应对
卢家辉、陈晨:口译员在远程口译中面临的主要问题


▶ 行业洞察

2021年语言服务行业回顾与展望

2022年全球百强语言服务商榜单

2022年翻译行业将迎来哪些新变化

后疫情时代,语言服务行业如何发展转型?

何钦:中国电影对外译介的现状与思考

冯志伟:关于机器翻译行业发展的三点建议

张霄军:伦理视角下,机器翻译的能与不能

黄友义:如何突破中外文化差异,让世界更了解中国?


▶ 教育创新

李长栓:MTI论文千篇一律,如何破局?

王华树 刘世界:新文科背景下翻译技术核心课程教学模式探索

王华树 刘世界:人工智能时代翻译技术转向研究

曹达钦 戴钰涵:人工智能时代高校翻译技术实践环境建设研究

李梅:如何给“技术小白” 开设计算机辅助翻译课程?

实践导向的MTI人才培养模式——以对外经济贸易大学为例

数字化口译教学资源建设:欧洲经验与启示

如何将翻译项目管理模式应用到CAT教学课堂中?


继续滑动看下一个
翻译技术教育与研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存