关键词:
语料库
语义相似度
文本解译
自注意力机制
误差校正
摘要:
高度文化特定含义的词汇或表达方式复杂,导致语料库文本解译误差暴露概率增加,由此,提出了基于相似度的语料库文本解译误差自动校正。按照选择话题建立样本语料库,提取出关键词,利用文本特征和相似性阈值,计算特征词权重,获得语义特征相似性。应用K-近邻算法标记文本特征,计算并优化解译误差概率,识别出文本解译误差;将注意力函数变换成输出矢量,挖掘序列文本解译信息,获得数据的最大似然度,通过自动化对比与校正,实现文本解译误差自动校正。仿真结果表明,文本解译误差自动校正后,解译准确性较高,优化了解译质量,促进跨语言沟通。