轻量化卷积神经网络在音频场景分类中的应用研究
在线阅读 下载全文 下载Pdf阅读器

轻量化卷积神经网络在音频场景分类中的应用研究

为了提高低复杂度神经网络在音频场景识别中的特征提取能力和性能,本文探索了基于卷积神经网络(CNN)的音频场景分类方 法。在传统 CNN 结构的基础上,增加并优化了单独的注意力映射层,比较了两种适用于轻量卷积网络的注意力机制,并在部分卷积层采 用了深度可分离卷积以减少参数量。原始卷积被低成本的分组条状卷积取代,设计了时频分离的卷积结构,最终提出了 SFAC(Sequence Frequency Attention CNN)网络模型。在语音场景多分类数据集上的实验结果表明,与多个基于 VGG 结构的基线模型相比,SFAC 在保持 低复杂度的同时实现了更高的准确度。

联系我们

  • 时间

    9;00-11:30 13:30-17:00

  • 电话

    00852-65557188

  • 邮箱

    sjkxcbs@126.com

  • QQ

    2662583009

  • 地址

    香港九龙新蒲岗太子道东704号新时代工贸商业中心31楼5-11室A03

友情链接

Copyright 2020-2035 世纪科学出版社 版权所有 All Rights Reserved     鲁ICP备2025175347号