关键词:
情感分析
局部特征
上下文信息
双向编码器
词嵌入
卷积神经网络
Dropout机制
摘要:
针对目前情感分析方法无法解决一词多义、无法获取上下文语义信息、过于依赖局部特征等问题,提出了一种基于双向编码器的卷积失活神经网络(bidirectional encoder representation from Transformer-convolutional neural networks-Dropout,BERT-CNN-Dropout)模型的文本情感分析方法。首先,使用预训练模型BERT作为模型的词嵌入层,充分获取蕴含上下文信息的词向量;再将这些词向量输入到CNN中提取情感特征,同时为了减轻对局部特征的过度依赖和提升模型的训练效率,在模型中引入Dropout机制;最后,通过softmax函数对情感类型进行分类。实验结果表明,当Dropout值设置为0.25,并选择Adam优化器时,情感分析性能最佳,准确率、精确率、召回率、F1值和曲线下面积(area under the curve,AUC)分别为93.05%、93.16%、94.24%、93.7%和0.942,具有一定的研究价值。