关键词:
人工智能
边缘终端声学传感设备
语音活动检测
短时能量
短时过零率
混合信号域
摘要:
随着人工智能的发展,智能终端设备中集成的常开型传感器的数量逐渐增加。然而,这些传感器无法对无用信息进行有效的处理,浪费了大量资源且会严重影响后续数据处理的精度。为了应对边缘终端声学传感设备在追求高精度和低功耗方面所面临的挑战,提出了一种基于语音时域特征的混合信号域语音活动检测架构。该架构能够集成于高精度声学处理系统,如关键词识别系统等,并与其组成逐级唤醒的边缘声学传感系统,从而降低边缘设备的部署成本。在具体实现上,该架构采用了基于短时能量和短时过零率的双门限语音活动检测算法,并通过将模拟域的特征提取与数字域的特征分类相结合,巧妙地规避了在边缘设备中使用功耗占比较高的ADC模块,显著降低了系统功耗。该设计采用TSMC 180 nm CMOS工艺实现,芯片面积仅为0.029 mm^(2)。仿真结果表明,该电路的功耗低至14.4μW,语音检测准确率高达97%,实现了低功耗与高性能的完美平衡,为边缘终端声学传感设备提供了高效、可靠的语音活动检测方案。