关键词:
深度学习
K-均值聚类方法
学习者
情感识别
算法优化
摘要:
学习者情感的表现具有模糊性和时空分离特性,情感状态之间的界限不清晰,如反映在频谱图像上时,不同时间的语音对应的频谱特征可能差异较大。传统识别技术算法往往基于较为固定的特征提取模式,难以准确地从复杂多变的频谱图像中提取关键局部特征,如频谱峰值、谷值等,导致加权和未加权准确率较低。为此,文章提出了一种学习者情感识别技术算法的优化方法。利用K-均值聚类方法,根据语音信号的内在结构,将相似的语音片段进行聚类,生成学习者的语音频谱图像。采用传递函数对生成的语音频谱图像进行加重处理,以改善频谱图的平滑性和均衡性,增强频谱图像中的关键信息。将经过加重处理后的学习者语音频谱图像作为输入向量,输入到深度学习网络的卷积层。在卷积层中,针对加重处理的频谱图像进行特征提取,捕捉频谱峰值、谷值等关键的局部特征。在全连接层,将这些特征映射到情感类别空间,以实现情感分类。根据深度学习网络的输出,将识别样本划分到概率最高的情感类别中,完成学习者情感的识别。经实验证明,经过优化后的学习者情感识别算法,在加权和未加权准确率方面均实现了显著提升,显示出在学习者情感识别领域良好的应用潜力和前景。