报告人 | 唐乾桐 |
报告时间 | 2019-01-09 |
讨论组 | 语法理论与语言工程 |
关键词 | 词向量;词嵌入;词类推;类推测试 |
摘要或简介 | 学界一般用类推测试来测试词向量的性能,但在汉语研究领域缺少可靠的类推测试集。以往的研究大都是直接将BATS这些针对英语的类推问题集翻译或改写成汉语,这样做的好处是能够快速得到比较有效的语义类推测试集,例如Chen X等(2015);但是,对于语法上的类推测试而言,由于汉英的语法有很大差异,其类推测试集不能直接通过翻译得到。这样一来,汉语词向量就缺少一个全面的类推测试集,这不仅不能满足汉语语法工程、语法研究的需要,也不能全面地测试汉语词向量的性能。因此,建立一个面向汉语的类推问题集迫在眉睫。这篇文章就是对这一问题的一个尝试。 |
发布人 | Ford |
发布范围 | 全网 |
讨论记录 | |
下载次数 | 7320 |
浏览次数 | 8074 |
© CCL of Peking University 2019