Using Convolutional Neural Networks for Environmental Audio Recognition

Data

Before running, data should be retrieved from the following link: https://www.kaggle.com/c/freesound-audio-tagging/data Unzip data to a folder in the root directory called ./input

Generating feature vectors

Generate feature vectors (spectrogram, MFCC) without directly loading them into the neural networks. This can be done to visualize the inputs, or to simply speed up the training process without performing frequency domain calculations every time. Run extract_features.py located in the ./src/utils. It will generate a directory where the input images will be stored. NOTE: implementation of this was not build into main.py

Required libraries:

librosa
PIL
scipy

Classification without visualization

Run main.py in ./src. The main function has CUDA support and will attempt to run on GPU.

Required libraries:

above
PyTorch
skimage

Classification with layer visualization

Run main_visualize.py in ./src/visualize. CUDA support not build in yet.

Matlab

Matlab code has been deprecated.

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
matlab		matlab
src		src
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Using Convolutional Neural Networks for Environmental Audio Recognition

Data

Generating feature vectors

Required libraries:

Classification without visualization

Required libraries:

Classification with layer visualization

Matlab

About

Releases

Packages

Contributors 3

Languages

andylai2/Audio-Tagging

Folders and files

Latest commit

History

Repository files navigation

Using Convolutional Neural Networks for Environmental Audio Recognition

Data

Generating feature vectors

Required libraries:

Classification without visualization

Required libraries:

Classification with layer visualization

Matlab

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages