报告人 | 崔香 |
报告时间 | 2025-05-08 |
讨论组 | 语法理论与语言工程 |
关键词 | LLM;机器翻译译文质量评估;自动评估 |
摘要或简介 | 机器翻译性能的提升离不开及时反馈,但人工反馈成本高,需要自动评估方法。随着大语言模型的发展,QE领域也有学者尝试用大语言模型给译文进行自动化打分,但表现没有预期好。比如2024年ACL的一篇论文得出提供原文会降低相关系数的结论,但几个月之后EMNLP的一篇论文又得出了不提供原文才会降低相关系数的相反结论。也就是说,目前用LLM做QE任务的方法鲁棒性差且效果不好。本次汇报的目的是尝试用新方法来提升用LLM做QE任务的表现。 |
发布人 | 崔香 |
发布范围 | 全网 |
讨论记录 | 1. 解决llama-13b的评测问题 |
下载次数 | 2 |
浏览次数 | 0 |
© CCL of Peking University 2019