关键词:
人工智能
智能合成语音
拟人化
机器学习算法
消费者评论
摘要:
随着智能合成语音产品的快速发展,人工智能(artificial intelligence,AI)技术在有声书领域的应用日益广泛,为传统的有声读物注入了新的活力。然而,是否AI有声书的声音越接近真人,就越能受到消费者的青睐?本研究以喜马拉雅平台上的有声书为研究对象,从抓取的音频中提取低维和高维的音频特征,分别建立了随机森林模型和神经网络模型用以预测有声书的声音来源(真人/AI)。基于此,本研究构建了度量声音拟人化程度的指标,并从技术和行为层面分别对该指标的内在机理进行了深入分析,帮助大家理解该拟人化指标如何刻画AI有声书和真人有声书的异同。最后,本研究通过实证的方法探究了该拟人化指标与消费者行为之间的关系。实证结果表明,有声书的拟人化程度与消费者好感度(即用户评分)之间存在恐怖谷效应,即随着有声书声音的拟人化程度增加,该有声书的评分会呈现先上升后下降的态势。不过,在用户的评论声量方面,恐怖谷效应并不存在。本研究为理解消费者对AI生成内容的接受程度提供了新的理论和实证视角。