报告人 | 邱晓枫 |
报告时间 | 2022-09-26 |
讨论组 | 语法理论与语言工程 |
关键词 | 讽刺 讽刺识别 语言资源 语料库 |
摘要或简介 | 讽刺识别”是一个NLP文本分类问题,过去主要用于提高人机对话、情感分析等任务的准确性,近年来随着国家对网络空间信息传播的重视,也服务于舆情检测。中文讽刺识别这个发展中的研究领域,一个公开、完整、可靠的讽刺识别数据集是缺失的。其原因包括本体概念模糊交叉、讽刺这一语言现象形式本身很复杂人工获取成本大难度高,而现在NLP中数据驱动模型也依赖大规模、高质量的训练数据,现有中文讽刺识别研究数据集都是研究单位自己构建且不公开,因此研究结果缺乏对照、模型泛化能力有限,也不利于形成语言资源和方法模型的互相推进。 |
发布人 | obito |
发布范围 | 校内 |
讨论记录 | |
下载次数 | 0 |
浏览次数 | 195 |
© CCL of Peking University 2019