腾讯DRT-o1 AI模型：让文学翻译更懂“言外之意”-网界

腾讯研究院近期揭晓了一项创新成果——DRT-o1系列模型，该模型凭借独特的长思维链（CoT）技术，在文学作品翻译领域取得了突破性进展，特别是针对比喻和隐喻等复杂修辞的处理，显著提升了翻译质量。

在神经机器翻译（NMT）技术日益成熟的背景下，日常文本的翻译效率与质量均已达到较高水准。然而，文学作品，特别是富含比喻和明喻修辞的文本，仍然是翻译领域的一大难题。这些修辞往往承载着深厚的文化内涵和语境信息，简单的直译难以精准传达其深层含义。腾讯的DRT-o1系统正是为解决这一挑战而生。

为了训练这一模型，研究人员精心挑选了古腾堡计划中的400本公共领域英文书籍，并从中提取了577,600个句子。经过严格筛选，最终确定了63,000个包含比喻和隐喻的句子作为训练素材。这些句子被用于引导模型进行深度思考，从而提升其理解和翻译复杂修辞的能力。

DRT-o1模型采用了创新的多智能体框架，包括翻译员、顾问和评估员三个角色。翻译员负责初步翻译，顾问则提供修改建议，评估员则根据预设的评分标准对翻译质量进行客观评价。这一流程通过反复迭代，不断优化翻译结果，直至达到预设的评分阈值或迭代次数上限。

在具体的工作流程中，模型首先识别句子中的关键词并进行翻译，然后基于源句子和关键词的双语对应关系，生成初步的翻译结果。接着，顾问对初步翻译进行评估，并提供反馈意见。评估员则根据预定义的评分标准，对翻译的整体质量进行打分。翻译员根据反馈和评分，再次提供新的翻译。这一过程循环往复，直至翻译质量达到最佳。

最终，经过深度思考的翻译结果会由GPT-4o进行进一步的润色，以确保其流畅性和可读性。这一流程产生的数据集包含了22,264个高质量的机器翻译样本。

在腾讯研究院提供的示例中，原文“The mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap.”中的“struck her all of a heap”是一个成语，表示某事产生了强烈的影响。DRT-o1模型通过长思维链过程，将其翻译为“母亲将双脚搭在凳子上，似乎在努力探究那个答案，那答案中女性特有的深刻性令她猛然心生震撼。”这一翻译不仅准确传达了原文的意思，还保留了原文的情感色彩。

相比之下，谷歌翻译的版本为“母亲双脚撑在凳子上，似乎想弄清楚这个答案的真相，其女性的深刻性让她大吃一惊。”而Deepl的翻译则是“母亲把脚支在凳子上，似乎想弄清这个答案的来龙去脉，而这个答案的女性化深刻性让她茅塞顿开。”虽然这两个版本也基本传达了原文的意思，但在情感表达和细腻程度上，DRT-o1的翻译显然更胜一筹。

在性能表现方面，DRT-o1系列推出了DRT-o1-7B和DRT-o1-14B两个规模版本。实验结果显示，与Qwen2.5-7B-Instruct相比，DRT-o1-7B在BLEU分数上提高了8.26分，CometScore提高了3.36分；与Qwen2.5-14B-Instruct相比，DRT-o1-14B的BLEU分数提高了7.33分，CometScore提高了1.66分。DRT-o1-7B的性能甚至超过了更大的模型QwQ-32B，BLEU分数高出7.82分，CometScore高出1.46分，充分展示了其在处理复杂语言结构方面的卓越能力。

腾讯研究院的这一创新成果，不仅为文学作品翻译领域带来了新的希望，也为人工智能技术在语言处理领域的应用开辟了新的方向。