Ethics of AI in Book Translation

# 书籍翻译中的人工智能伦理人工智能通过使书籍翻译更快、更便宜，改变了翻译行业，但它引入了伦理问题。虽然神经机器翻译（NMT）和机器翻译后期编辑（MTPE）等人工智能工具允许作者和出版商以极低的成本和时间翻译书籍，但它们通常难以处理习语、语调和文化参考等细微差别。这可能导致翻译不准确、输出有偏见以及作者声音的丧失。关键挑战包括： - **准确性**：人工智能经常忽视幽默、隐喻和情感深度等细微差别。 - **偏见**：训练数据可能强化刻板印象，如性别角色，并边缘化代表性不足的语言。 - **问责**：没有人工监督，人工智能有改变原文含义的风险。 - **版权**：作者必须保护其权利，因为人工智能系统可能在未经同意的情况下使用受版权保护的作品。解决方案在于将人工智能与人类专业知识相结合。通过使用MTPE，人类翻译人员完善人工智能草稿，以确保质量同时保留作者的意图。伦理实践，如使用多样化的训练数据、保护知识产权和保持透明度，对于公平和准确的翻译至关重要。虽然人工智能提高了效率，但人工监督对于保留文学作品的深度和完整性仍然至关重要。 ## 翻译中的人工智能是伦理的还是只是更便宜？ ## 人工智能书籍翻译的准确性挑战

AI Translation Challenges: Survey Results on Accuracy and Cultural Issues — 人工智能翻译挑战：准确性和文化问题的调查结果

### 翻译准确性的含义把翻译做对不仅仅是技术上的障碍——这是关于忠于作者的意图。书籍翻译的准确性超越了逐字正确性。这是关于保留原文的*含义*、*风格*和*背景*。一个在语言上正确但遗漏文本语调或情感分量的翻译感觉空洞和不完整。文学作品靠细微差别而繁荣。讽刺作家的尖锐幽默或浪漫小说家的诗意流畅性承载了他们讲故事的本质。当翻译人员捕捉到这些元素时，他们保留了作品的身份。人类翻译人员为他们的工作带来创意和判断力，做出有意的选择来反映文本的更深层次。另一方面，人工智能经常产生在语言上准确但缺乏真正反映原文所需的情感或文体深度的翻译^[1]^[3]。当涉及承载沉重文化或情感分量的表达时，这些挑战变得更加明显，如下所述。 ### 人工智能在语境中的困难人工智能在处理习语、隐喻、文化参考和复杂句子结构时面临最大的困难。最近的调查发现，**99.3%的受访者注意到人工智能在习语和隐喻方面的困难**，而**84.7%的受访者发现了文化细微差别的问题**^[1]。这些差距突出了人工智能在掌握更深层含义方面的困难。地区方言增加了另一层复杂性。人工智能经常产生生硬、过于字面的翻译，剥夺了这些方言的文化丰富性。翻译专家Liesl Yamaguchi指出，糟糕的人工智能翻译可能会造成虚假的易接近性，掩盖了对真正文学理解的需求^[2]。对于**代表性不足的语言**，挑战更大。训练数据有限导致波斯语和亚美尼亚语等语言的错误率高达32–45%^[4]。这不仅导致翻译不准确，而且通过未能准确代表来自全球南方的声音而永久化不平等。这些声音在文化和文学意义上都很丰富，值得获得尊重其完整性的翻译。这些缺陷强调了人类参与的重要性，以确保文学作品保留其真实性和深度。人工智能单独还无法满足这一标准。 ## 人工智能翻译中的偏见和代表性 ### 人工智能训练数据中偏见的来源人工智能翻译系统建立在大规模数据集上，通常来自书籍、网站和预先存在的翻译。问题是什么？这些数据集可能反映社会偏见和文化失衡，人工智能然后学习为"正常"。例如，神经机器翻译（NMT）系统经常依赖可能已经承载文化偏见的受版权保护的文学作品和人类翻译^[5]。这方面最清楚的例子之一是**性别刻板印象**。研究表明，谷歌翻译等工具经常默认为刻板印象，例如从性别中立语言翻译"他工作，她做饭"^[5]。一个案例：在土耳其语中，性别中立短语"O bir doktor"（他们是医生）通常被翻译为"他是医生"，而"O bir hemşire"（他们是护士）变成"她是护士"^[6]。这发生是因为训练数据缺乏性别平衡，强化了过时的角色。此外，算法处理可能会剥夺文化细微差别，并强化现有的社会等级制度，即使原文避免了它们^[5]。岭南大学研究员Bo Li强调了这里的伦理挑战："版权伦理是人工智能启用的文学翻译不可或缺的一部分，因为训练数据和参与式NMT涉及版权问题"^[5]。人工智能后期编辑也可能简化或使语言风格同质化，这有可能丧失原作者的独特声音。这种风格的平铺化破坏了准确翻译所必需的文学丰富性。最终，这些偏见不仅仅停留在训练数据中——它们塑造最终产品，影响角色、主题和文化细微差别的呈现方式。 ### 偏见如何影响文学翻译有偏见的翻译的影响远远超出尴尬的措辞。它们可以从根本上改变角色的认知方式、扭曲主题并消除文化深度。例如，当人工智能根据刻板印象为中立代词分配性别时，专业角色通常默认为过时的规范。医生通常呈现为男性，而护士或助手通常是女性^[6]。这些假设可能会显著影响读者如何看待角色及其角色。文化表达也受到打击。考虑一个日本角色用谦虚短语礼貌地拒绝邀请。人工智能可能会将其翻译为生硬的"不"，这可能使角色显得粗鲁而不是尊重^[6]。政治语言是另一个地雷。例如，一种语言中的"自由战士"一词，如果人工智能的训练数据倾向于特定的政治偏见，可能被翻译为"恐怖分子"^[6]。 > "人工智能可能很快，但它不理解后果。只有人类才能评估翻译是否适合特定的受众或情况。"——Gergana Toleva，1StopAsia^[6] 由于人工智能训练数据经常过度代表主导文化，少数族裔声音和方言被推向边缘。这导致翻译作品中的文化多样性"平铺化"，其中不同的地区表达和代表性不足的语言失去了活力^[6]。对于作者和出版商来说，这不仅仅是一个创意问题——这是一个真实的风险。有偏见的翻译可能导致公众反弹、损害声誉，甚至如果内容被视为具有冒犯性或歧视性，可能引发法律麻烦^[6]。 ## 问责和人工监督 ### 将人工智能与人类翻译人员相结合在伦理人工智能翻译的世界中，**机器翻译后期编辑（MTPE）**已成为黄金标准。这种方法融合了人工智能的速度和人类翻译人员的专业知识。人工智能产生初稿，人类专业人员对其进行完善，确保最终产品精美准确。结果是？更快的周转时间，不牺牲质量。该过程分几个关键步骤进行。首先，双语编辑查看人工智能的输出以及原文，重点关注捕捉算法经常遗漏的细微差别。他们还调整习语、幽默和其他文化特定元素，以确保翻译按预期产生共鸣。接下来，校对员介入，纠正打字错误和标点符号等技术问题。必要时，本地测试读者添加额外的审查层，确保保留原文的情感深度。 > "解决方案在于一个精心协调的协作，它利用两个世界的最佳部分。"——Translated.com ^[7] 为了保持一切一致，编辑依赖于在项目开始前建立的风格指南和词汇表。干净的EPUB文件也至关重要，因为它们防止可能引入错误的隐藏格式问题。这种结构化的协作确保了叙事的本质得到维持，同时保持技术准确性。 ### 在人工智能工作流程中建立问责现代翻译平台现在使用先进的指标来衡量人工智能-人类协作的效率和准确性。例如，**编辑时间（TTE）**跟踪编辑每个片段花费的秒数，而**千字错误（EPT）**衡量每1,000个单词的客观错误数量^[7]。这些指标提供了对工作流程质量的清晰见解。一些系统更进一步，使用T-Rank等人工智能驱动的工具，将编辑与特定类型的专业知识相匹配。这确保审查员适合文本的独特需求。反馈循环也起着关键作用——编辑更正被反馈到系统中，帮助人工智能学习并随时间减少重复错误。像BookTranslator.ai这样的平台已经采用了这些问责措施，在人工智能和人类专家之间建立了无缝的合作关系。通过让人工智能处理重复任务，人类翻译人员可以专注于工作的创意和细微方面。这确保每个翻译都保持技术精确性，同时尊重原文的情感和艺术完整性。 ## 知识产权和作者权利 ### 人工智能翻译中的版权问题人工智能生成的翻译通常导致版权法定义的**"衍生作品"**，意味着作者必须保留对这些翻译及其使用方式的控制。当考虑人工智能系统如何被训练时，这变得更加复杂。许多大型语言模型依赖从互联网上抓取的巨大数据集，其中可能包括在未获得作者或出版商适当同意的情况下使用的受版权保护的文学作品^[9]^[5]。另一个关键问题是**数据安全**。消费级人工智能工具可能会将提交的文本用于训练目的，可能暴露未发表的手稿或其他敏感材料^[9]。为了避免这些风险，作者和出版商应选择明确保证非训练政策并提供强加密来保护知识产权的企业级工具。像欧洲文学翻译人员协会委员会这样的倡导组织正在推动更强有力的保护，因为围绕人工智能生成内容的法律继续发展^[9]。 > "人工智能采用的未来取决于信任、伦理和人类专业知识。"——Slator ^[9] 为了进一步保护您的工作，请确保服务协议明确说明您保留翻译内容的完全所有权。为每个语言版本获得唯一的ISBN，并将外国许可限制在特定地区和5–7年的期限内。虽然法律措施有助于保护所有权，但保持作者独特的声音需要仔细的编辑关注。 ### 使用人工智能保持作者声音保护作者的创意表达超越了法律权利——这是关于保留他们独特的艺术风格。人工智能系统擅长确保长篇手稿中的**术语一致性**，但在捕捉使作者作品脱颖而出的创意元素时往往不足。诸如文字游戏、双关语和高度程式化的散文等功能对于人工智能来说可能很难准确复制^[8]。情感深度和文化细微差别也需要人类专业知识的触摸。准备是保持作者声音的关键。首先创建基本术语、角色名称和设置的词汇表，并开发详细的风格指南，概述语调、言语模式和其他文体元素。这有助于人工智能工具和人类编辑都忠于作者的原始意图。使用干净的、经过验证的EPUB文件而不是Word文档也可以保留重要的格式，例如斜体和结构元素。最后，涉及双语编辑和本地测试读者，以确保翻译保留其情感共鸣和文化背景。 ## 伦理人工智能书籍翻译的最佳实践 ### 人工智能翻译的透明度当涉及伦理人工智能翻译时，问责和透明度是相辅相成的。对于读者和作者来说，理解人工智能如何做出翻译决策至关重要。可解释的人工智能可以阐明为什么选择某些单词、短语或解释。这种清晰度不仅建立信任，还允许本地化管理人员及早发现潜在问题。例如，如果作者意识到人工智能擅长维持一致的术语，但可能在习语表达或微妙的文化参考方面失败，他们可以在需要的地方计划人工编辑输入。机密性是另一个关键问题——应该制定严格的数据处理政策，以确保作者他们的手稿不会被重新用于进一步的人工智能训练。这些透明度实践共同确保人工智能增强而不是减少文学翻译的微妙艺术。它们也补充了早期解决偏见和监督等问题的努力。 ### 为人工智能平台创建伦理指南为了加强伦理人工智能翻译实践，清晰和强大的指南是不可或缺的。保留作者的声音和准确传达背景取决于坚实的伦理框架。一个强有力的起点是关注训练数据——高质量、多样化的数据集对于减少偏见和提高准确性至关重要，特别是对于代表性不足的语言。训练人工智能处理整个文档而不是孤立的句子也有助于维持叙事连续性和作者的独特风格。将熟练的双语编辑纳入该过程是另一个关键步骤。这些专业人员可以确保尊重文化细微差别并解决任何偏见。正如坦佩雷大学教授Kaisa Koskinen恰当地指出的那样： > "伦理永远无法一劳永逸地解决，因为道德方面需要不断重新协商，条件和情况会改变。"^[10] 平台还应该通过保证作者保留人工智能辅助翻译的完全版权所有权来保护知识产权。诸如词汇表、经过验证的EPUB文件和结构化的两层审查系统等工具可以进一步保护整个翻译过程中作者的创意声音。 ## 结论：人工智能书籍翻译伦理的未来 ### 关键要点伦理人工智能书籍翻译取决于三个主要原则：**准确性**、**问责**和**公平代表**。实现背景准确性意味着捕捉文本的全部本质，包括其语调和文化细微差别。当人类专家与人工智能协作以完善其输出时，问责就会蓬勃发展。公平代表需要平衡的训练数据，以防止少数民族语言的边缘化并避免永久化刻板印象。这些元素共同帮助建立对人工智能驱动翻译的信任。这些原则为人工智能翻译的未来奠定了基础。 ### 人工智能翻译的下一步伦理人工智能翻译的未来正在由在精心选择的文学数据集上训练的专门大型语言模型的发展而形成。这一转变优先考虑训练材料的质量和多样性，而不是简单地推进算法复杂性。通过纳入持续学习——系统根据真实世界的使用和人类反馈进行调整——翻译工具可以保持与文化和语言变化的一致。这些进步与通过伦理引导的技术维持文学完整性的持续目标相一致。可解释的人工智能将在确保翻译决策如何做出的透明度方面发挥关键作用。为了向前推进，平台必须扩展数据集以包含较少使用的语言，使翻译工具更具包容性和公平性。人工监督将保持至关重要，因为专家翻译人员带来了人工智能单独无法复制的文化理解和情感深度。通过将技术进步与以人为中心的方法相结合，人工智能翻译可以保护知识产权、保留作者的声音，并创建尊重原文和目标受众的翻译。 BookTranslator.ai致力于这些伦理原则，为专家翻译人员配备尖端工具，以提高他们的生产力，同时提供准确、文化敏感和有意义的翻译，供美国各地的读者使用。 ## 常见问题 ### 人工智能翻译何时对书籍"足够好"？当人工智能翻译成功捕捉原文的含义、风格和格式时，它被认为是"足够好"的。然而，它在传达细微差别和情感深度方面常常不足。它在技术或简单内容方面表现良好，特别是与人工编辑配对时。对于文学作品，人工智能可以帮助创建初稿或提高可访问性，但人类翻译人员对于保留习语表达、情感影响和文化细微差别至关重要。 ### 作者如何检查人工智能翻译文本中的偏见？作者可以通过比较敏感术语或短语与人类翻译的呈现方式来发现人工智能翻译文本中的偏见。密切关注习语、隐喻和对社会规范的参考等领域，因为这些通常可能会揭示微妙的文化或语言偏见。重要的是确保翻译不仅忠于原文含义，而且尊重文化背景以确保准确性和敏感性。 ### 翻译合同应包括关于人工智能和版权的什么内容？翻译合同需要通过明确的指南来解决**人工智能生成翻译**的使用。这包括指定版权所有权和知识产权，以及确定谁对最终输出负责。协议还应详细说明人工智能工具的使用方式，确保原文的完整性保持不变，并清楚地定义所有参与该过程的各方的责任。

sbb-itb-0c0385d