北京大学中文系博雅读书会

报告人	邱晓枫
报告时间	2022-09-26
讨论组	语法理论与语言工程
关键词	讽刺讽刺识别语言资源语料库
摘要或简介	讽刺识别”是一个NLP文本分类问题，过去主要用于提高人机对话、情感分析等任务的准确性，近年来随着国家对网络空间信息传播的重视，也服务于舆情检测。中文讽刺识别这个发展中的研究领域，一个公开、完整、可靠的讽刺识别数据集是缺失的。其原因包括本体概念模糊交叉、讽刺这一语言现象形式本身很复杂人工获取成本大难度高，而现在NLP中数据驱动模型也依赖大规模、高质量的训练数据，现有中文讽刺识别研究数据集都是研究单位自己构建且不公开，因此研究结果缺乏对照、模型泛化能力有限，也不利于形成语言资源和方法模型的互相推进。
发布人	obito
发布范围	校内
讨论记录
下载次数	0
浏览次数	1075