mfcc_ctc_speech

Using CTC loss function combine mfcc feature and LSTM architect
test on youtube dataset

Dependency:

for create label (gen_label.py)
python3 - 3.6.1
webvtt-py - 0.4.0
for cuting dataset (mp4_to_cut_wav.py)
python2 - 2.7.14
moviepy - 0.2.3.2
cv2 - 3.3.0
for training (ctc_speech_recognition.py)
python2 - 2.7.14
tensorflow - 1.4.0

Usage:

Step 1 : Download youtube vedio with cc subtitle
Step 2 : python3 gen_label.py - to generate clear label
Step 3 : python mp4_to_cut_wav.py - to generate wav dataset
Step 4 : python ctc_speech_recognition.py - training

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
cut_wav		cut_wav
src		src
README.md		README.md
example.vtt		example.vtt
label.jpg		label.jpg
label.txt		label.txt
mp4_example.jpg		mp4_example.jpg
training.jpg		training.jpg
wav_example.jpg		wav_example.jpg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

mfcc_ctc_speech

Dependency:

Usage:

Dataset description:

Training Process:

About

Releases

Packages

Languages

ss87021456/mfcc_ctc_speech

Folders and files

Latest commit

History

Repository files navigation

mfcc_ctc_speech

Dependency:

Usage:

Dataset description:

Training Process:

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages