本报告介绍了MC数据集以及gpt-3.5和gpt-4在数据集上的表现,其中MC1的实验结果与人类测试结果进行了比较与分析。报告最后还分析了大模型gpt-3.5在异形同义数据集上的表现。
下载文献(177.7 KB) 查看幻灯片(177.7 KB) 登录后可执行更多操作
确定要删除吗?
© CCL of Peking University 2019