Sound-Recognition-Tutorial A simple sound recognition tutorial, including data analysis, feature extraction, model building, model train and model test ... 一个简单的声音识别教程,让大家初步了解一下声音识别的整个过程和中间需要用到的方法。该教程共包含以下几个部分,每个部分都有对应的blog介绍: 1.数据集准备和工具安装。 选取ESC-10作为本次项目的数据集,并且介绍如何安装相关依赖包。 2.数据分析。 对ESC-10数据集进行基本的分析。 3.特征提取。 对MFCC特征提取过程做了详细的描述。 4.构建模型。 使用Keras搭建CNN模型。 5.训练模型。 采用5-fold cross validation的方法训练模型。 6.测试模型。 导入预训练模型并测试。 7.声音数据增强。 使用librosa实现Time Stretch 和 Pitch Shift进行数据增强。 持续更新...