| 报告人 | 崔香 |
| 报告时间 | 2025-11-05 |
| 讨论组 | 语法理论与语言工程 |
| 关键词 | 机器翻译质量评估、大语言模型评测、元评测、GEMBA、MQM |
| 摘要或简介 | 人类译员评估翻译质量工作的成本高、时间长,需要有自动化的评估方法。旨在解决这一需求的机器翻译质量评估领域不断推陈出新,从表征匹配指标到深度语义指标,再到近几年使用大语言模型做该任务。本文将任务范围限定为从韩语翻译到汉语、文学体裁的翻译,调用大语言模型在 GEMBA-MQM 框架下评估汉语译文的质量,指出错误片段和错误类型。通过对模型的评估结果的“再评估”,统计召回率和精确率等指标,分析模型在该任务上的表现与特点,探讨“大语言模型能否代替或者辅助人类译员做审核翻译质量的工作”这一问题。 |
| 发布人 | 崔香 |
| 发布范围 | 全网 |
| 讨论记录 | 1. 修改论文题目,光看现在的论文题目其实不知道想要干什么。 |
| 下载次数 | 279 |
| 浏览次数 | 207 |
© CCL of Peking University 2019