『大语言模型』翻译的喜与忧(『大语言模型』翻译的新范式是什么) #科技 #语言 #文化 #信息 #传统 #海量

（来源：今日霍州）

转自：今日霍州

光明图片/视觉中国

『大语言模型』（Large Language Model，LLM）作为人工智能领域的标志性成果，正以前所未有的速度重塑全球翻译生态，甚至从根本上改变着整个翻译行业的业务结构与价值链条。依托其深度的上下文理解与交互式迭代等技术红利，『大语言模型』翻译正在把传统的“翻译—审校—排版”流水线升级为“人机共创”的知识增值平台，其价值远超翻译本身，成为促进全球沟通、提升生产力和赋能创新的关键基础设施。然而，技术红利背后的隐忧不容忽视。当一本20万字的书籍可被『大语言模型』在半分钟内“翻译完成”时，我们必须审视这种效率背后的代价。『大语言模型』本质上是一种基『于海』量语料训练的复杂概率统计模型，它依赖表层语言形式，却缺乏人类将自然语言与现实世界建立认知联系的深层理解能力。这一局限使其在面对跨文化语境时，常常陷入“形似而神不似”的困境。更为深层的挑战在于，表面“流畅”的翻译输出可能会掩盖文化偏见，成为新时代语言智能治理的重要议题。

核心优势

与传统机器翻译（如早期的统计机器翻译SMT和后来的神经机器翻译NMT）相比，『大语言模型』翻译的核心优势源于其“以海量数据学习语言规律、以上下文理解语义信息”的底层逻辑，具体表现为：

卓越的理解能力。传统的机器翻译通常只分析单个句子或很短的上下文，经常导致歧义消除错误。例如，“Apple”一词在没有上下文的情况下，无法确定是公司名还是水果。而『大语言模型』翻译拥有强大的长上下文窗口，能够通过上下文关键词与常识整合精准捕捉文本的逻辑关联、情感倾向与专业背景。此外，『大语言模型』能更好地处理不符合语法的句子、口语化的表达、行业黑话甚至混合语言的文本（如中英混杂等）。

灵活自然的适应能力。传统机器翻译模型通常只有一种标准输出，难以变换不同风格，而『大语言模型』用户可以通过领域微调或提示词引导，适配不同场景的专业需求。例如，用户可在指令中添加“请将以下文本翻译成正式的商业信函语气”“请用口语化的、轻松的网络用语翻译这段对话”等。而且，『大语言模型』可根据用户提供的高质量翻译示例进行学习，并迅速模仿这种模式和风格。这特别适合医疗、商业、法律等专业领域的术语统一和风格定制。

多模态翻译能力。传统机器翻译多拘泥于单一模态，而『大语言模型』可实现多模态内容的翻译与解读。如涉及图片（如路牌、菜单、海报）翻译时，『大语言模型』不仅可以翻译文字内容，还能结合图片场景补充信息，帮助用户理解；涉及语音翻译时，『大语言模型』可实时将语音（如会议发言、电话沟通）转为文本并翻译，同时支持翻译文本转语音，产出符合目标语言语调的自然语音；针对视频翻译，『大语言模型』可结合视频画面与字幕，灵活调整翻译内容。

交互式迭代能力。传统机器翻译只能实现人工后期编辑或离线重训，而『大语言模型』拥有强大的交互式迭代能力，用户可直接与模型对话，输入提示词，实现即时重译。这样不仅可以降本增效，还可让知识、文化、信息以前所未有的速度跨越语言壁垒，大幅提升沟通效率。『大语言模型』还可以一站式处理更复杂的任务，如翻译+摘要、翻译+润色、翻译并提取关键信息等。

基于上述优势，『大语言模型』翻译的价值日益突出。对个人而言，『大语言模型』可降低跨语言沟通门槛，帮助个人拓展信息获取边界，获取各种知识，如学习海外在线课程，查阅外文论文和书籍等；对企业而言，『大语言模型』可助力降本增效，赋能全球化业务，减少企业在文档翻译、字幕制作、客服翻译等场景的人力成本；对社会而言，『大语言模型』有助于促进跨文化交流，助力本土文化走出去。例如，中国网络文学在『大语言模型』助力下快速输出至海外阅读平台，2023年海外市场规模突破30亿元。

三重挑战

尽管『大语言模型』翻译有巨大的优势，但也面临不少深层挑战：第一，语言霸权的数字延伸。目前的国际主流大模型，参数数据集以英文为主，中文数据占比较少。『斯坦福大学』研究发现，当要求『大语言模型』处理斯瓦希里语、菲律宾语等低资源语言时，其准确率比处理英语时低30%～50%，且容易生成“非洲村庄=茅草屋”等刻板印象。

第二，文化传播的效能压缩。『大语言模型』翻译对具有丰富文化内涵的话语处理存在明显短板。相关研究显示，在涉及中国特色社会主义核心概念的翻译测试中，主流『大语言模型』的准确率不足50%，文化内涵保留率更低。例如，“江南”一次可能会被『大语言模型』译成South of the River，这种简化处理无法传达出原词所蕴含的深厚历史文化底蕴。

第三，社会伦理的多维挑战。一是知识产权难题，翻译成果的归属权界定不清。二是算法偏见问题，『大语言模型』可能吸收低质量或虚假训练数据，导致输出带有系统性偏见的内容。例如，当源语言性别不明确时，『大语言模型』会默认选择性别，如用“他”指代医生，用“她”指代护士。三是数据安全风险，用户输入的敏感信息可能被模型记忆并在后续翻译中泄露。四是信息生态污染，『大语言模型』生成的低质量翻译内容可能被再次纳入训练数据，形成“误译—学习—再误译”的恶性循环。

语言智能治理体系

面对上述挑战，我们亟须从国家战略高度，构建具有中国特色的语言智能治理体系。

首先，坚持标准引领，建立中国特色的翻译规范体系。国际层面，要积极推动制定更具文化包容性的『大语言模型』翻译国际标准；建议在联合国教科文组织《人工智能伦理建议书》框架下，提出“人工智能翻译文化多样性保护公约”，确立尊重各国语言文化的国际准则。国内层面，加快制定更为完备的“『大语言模型』翻译服务国家标准”和“关键概念翻译规范”；成立“国家翻译技术安全评估中心”，建立关键领域翻译系统的准入机制与动态监管体系。

其次，技术赋能，打造中华文化全球传播新引擎。大力支持发展“文化自觉型”『大语言模型』，增强模型对中华文化的理解能力。例如，开发“文化词汇识别机制”，对“天人合一”“和而不同”“中庸之道”等蕴含中国哲学内涵的概念进行特殊标注；探索“多模态翻译技术”，将文本、图像、音频等多模态结合，立体呈现中华文化元素；推动建设国家级多语言平行语料库，重点支持“一带一路”共建国家语言与中文的平行语料积累，突破低资源语言翻译瓶颈，服务国家战略需求。

最后，生态共建，培育翻译智能化发展新格局。建立“人机协同翻译生态系统”，明确人类译者在翻译中的主导地位，发挥『大语言模型』在效率提升方面的辅助作用，形成“人类主导、『大语言模型』辅助、专家把关”的工作流程，特别是在文学作品、历史文献、外交文件等专门领域，保持人类译者的主体性。可成立由语言学家、文化研究专家、技术专家和政策制定者组成的“国家翻译技术伦理委员会”，对『大语言模型』翻译的文化影响进行常态化评估与指导。要支持高校设立“人工智能翻译伦理”“计算语言学与文化传播”等课程，培养兼具语言文化素养与技术理解能力的复合型人才。加强国际合作，推动成立“全球语言智能治理联盟”，构建多边参与、多方受益的国际合作机制，共同应对『大语言模型』翻译带来的全球性挑战。

（作者：黄文红、尹静，分别系北京语言大学英语和高级翻译学院副教授，北京语言大学中国语言与标准制定研究所、北京交通大学语言与传播学院教授）