毕业论文:基于神经网络语言模型的现代汉语语言学知识探测



报告人王佳俊
报告时间2024-05-15
讨论组语法理论与语言工程
关键词语言模型 语言学知识 探针试验 预训练语言模型
摘要或简介

研究内容:
预训练模型中的词类信息探测;
预训练模型中的句法信息探测;
基于神经文法推断的构式形式特征挖掘;

本研究秉持“符号主义和联结主义互证和交融”的理念,围绕“预训练模型中有什么样的语言学知识”以及“如何使用神经网络从语料中发现语言学知识”这两个话题,基于以预训练模型RoBERTa 为代表的“联结主义”语言模型和以现代汉语语法信息词典、词类标注语料库和树库为代表的“符号主义”知识库与数据资源,使用探针分类器、降维以及神经文法推断等方法,展示了预训练模型对现代汉语的词类和句法知识的捕获程度,以及融合了符号主义和联结主义的神经文法推断算法在挖掘构式形式特征方面的应用。

发布人zwd
发布范围校内
讨论记录

下载次数0
浏览次数14

 登录后可执行更多操作


© CCL of   Peking University  2019