关键词:
事件类型归纳
对比学习
大型语言模型
摘要:
事件类型归纳能够从无标注文本中自动发现并命名新事件类型,可以有效获取多个领域的事件知识。现有研究将所有样本视为单一事件样本,仅考虑样本包含的某个事件类型,忽略了多事件样本对事件语义学习和事件类型命名的负面影响。针对上述问题,提出了一种结合对比学习和迭代优化的事件类型归纳方法。针对多事件样本对事件语义学习的影响,提出了一种基于提示学习的多事件检测方法,在模型训练前检测并剔除多事件样本。为了优化事件语义表示,提出了一种基于抽象语义表示(abstract meaning representation,AMR)的候选触发词识别策略,并引入外部锚点和聚类伪标签,优化对比学习训练效果。为了提升未知事件类型的命名质量,提出了一种基于ChatGPT反馈的事件类型命名迭代优化方法,根据ChatGPT的命名结果,剔除影响事件类型命名的样本,并使用经过处理的数据集微调模型。迭代上述过程,直到生成预期质量的事件类型名称。在ACE2005数据集上的实验结果表明,该方法能够显著提升未知事件类型的聚类效果,并能够有效生成高质量的事件类型名称。