三种面向计算的构式语法:FCG、ECG 和 DisCxG



报告人王佳骏
报告时间2020-11-05
讨论组语法理论与语言工程
关键词构式语法,形式化表示,流变构式语法,体验构式语法,分布式构式语法
摘要或简介

此次汇报介绍了流变构式语法、体验构式语法和分布式构式语法的概况。
流变构式语法取消了词和短语的概念,主张一切类型的知识都是构式,且不为构式设置类型层级。FCG有相应的知识工程实践“BENG”语法。
体验构式语法将认知语义学的研究结果用类型层级组织起来,为各个层次上的构式的语义表示与计算提供支持。
分布式构式语法在基于语符的构式语法的框架对语法单位,语义框架和框架元素进行分布式表示,同时引入“事件”(Event)特征作为语义框架在具体语句中的实现形式。

发布人王佳骏
发布范围全网
讨论记录

流变构式语法(FCG):
属于“激进的构式语法”,取消了词和短语的概念,主张一切类型的知识都是构式。
评价:能够取消的是名称,不是名称所对应的事物。即使现阶段不用“词”和“短语”描述,未来随着知识库规模的增大与丰富,两类知识之间的区别以及父类子类的关系还是会凸显出来。
不为构式设置类型层级:每个构式都有自身的独特性,“只为自己代言”。
评价:没有类型层级的知识库只是处于知识库建设的初级阶段,不能算作优点。
设计短语层级的构式的时候,将语法范畴与语法功能直接组织在一起,并且用同样的名称为条目命名,例如 subject-verb-cxn。
评价:当知识库的规模扩大到一定程度,这样层次混淆的规则条目会令知识库变得难以维护。
在知识工程与语言自动分析/生成方面,还处于用个例证明某个知识条目或分析策略的优越性的阶段,目前距离构建 broad coverage grammar 的水平相距较远。

体验构式语法(ECG):
ECG 最大的特点在于用认知语义学的语义图式来表示语义框架。词和短语构式先调用特定的语义图式,然后规定组成成分与语义图式中的语义论元之间的关系。
语义图式成了用于拼接句子的语义的“基元”,可以看作一种比较高级的“义素分析法”。构建大规模语义图式库的可行性有待探索(如何处理好主观性和图示之间的关系是可能的挑战)。
与 FCG 相比,ECG 区分了语法和语义(topic 和 profiled participant 这样的信息仍然放置在语法构式中),并且引入了类型层级,显得更有条理,也为知识库维护提供了便利:例如,语义库和语法库可以较为独立地进行维护。
细节:ECG 的知识库条目命名比较讲究:类型名是单词首字母大写的字符串,类型的属性名则是从第二个单词开始首字母大写的字符串。体现出知识库管理人员具有比较丰富的程序设计经验。

分布式构式语法(DisCxG):
DisCxG 在 SBCG 的基础上:
引入 PROPERTIES 特征来描写短语型构式的项间关系;
引入向量表示语法构式的分布特性和语义框架中语义角色的分布特性;
引入 event 来表示具体实现了的语义框架中担任论元的词向量的数值。
DisCxG 中引入的统计信息可以更好地定量刻画各个层次的语言单位的性质,与符号层面的刻画结果进行对比,也可以为基于向量的计算任务提供支持。

下载次数6975
浏览次数8514

下载文献(1.8 MB) 查看幻灯片(5.4 MB)  登录后可执行更多操作


© CCL of   Peking University  2019