关键词:
高校评教
评教体系
数据增强
文本匹配
数据挖掘
摘要:
高校评教文本存在着评教维度多、文本内容长的特点,造成了评教信息难以挖掘的问题,鉴于此,本文设计了一种融合维度构建与数据增强的无监督评教文本匹配算法。首先,采用TextRank方法提取评教文本中的关键词,并根据关键词进行维度归纳与递进,从而构建评教指标体系。接着,对评教文本进行短文本拆解,利用基于注意力机制的预训练模型挖掘短文本与维度间的匹配特征。最后,在各个预训练模型的基础上,采取SimCSE策略进行数据增强,通过对比实验数据,得到短文本的最佳维度匹配结果。实验结果表明,使用该策略后的模型在准确率RAcc和F1指标上均优于原预训练模型,其中SimCSE-WoBERT模型匹配效果最好,RAcc达72.50%,F1达84.06%,这表明将SimCSE模型引入评教文本匹配领域能取得较好的应用效果。本文算法能够实现评教内容与评教维度的自动化匹配,从而更精准地挖掘高校评教人员关于各个评教维度的细粒度信息,便于分析评教人员在听课中重点关注的教学环节,进而为评教文本细粒度情感挖掘提供理论依据。