Skip to content

Commit d6a5fd4

Browse files
committed
Update transcribe_wav.md
1 parent fcf4aed commit d6a5fd4

File tree

1 file changed

+32
-18
lines changed

1 file changed

+32
-18
lines changed

Docs/transcribe_wav.md

Lines changed: 32 additions & 18 deletions
Original file line numberDiff line numberDiff line change
@@ -21,7 +21,7 @@ Utile per:
2121
- **Supporto Python 3.10**: Verifica e forza l'esecuzione con Python 3.10 se necessario.
2222
- **Installazione automatica di Whisper**: Aggiorna pip e installa (o reinstalla) openai-whisper se non presente.
2323
- **Conversione automatica formati**: Converte automaticamente MP3, FLAC, OGG, M4A, AAC, WMA, Opus, AIFF, WebM, MP4 in WAV utilizzando FFmpeg.
24-
- **Accelerazione audio 2x**: Opzionalmente accelera l'audio a 2x velocità utilizzando FFmpeg per velocizzare la trascrizione.
24+
- **Processamento parallelo**: Opzionalmente divide l'audio in chunk e li elabora in parallelo per velocizzare la trascrizione mantenendo la qualità.
2525
- **Trascrizione automatica**: Analizza tutti i file audio supportati presenti nella cartella specificata.
2626
- **Skip file già trascritti**: Salta i file che hanno già una trascrizione esistente.
2727
- **Salvataggio sicuro**: Le trascrizioni vengono salvate come file .txt nella stessa cartella dell'audio.
@@ -63,37 +63,51 @@ Trascrizione completata per podcast.mp3, salvata in podcast.txt
6363

6464
---
6565

66-
### Esempio Input con Conversione e Accelerazione 2x
66+
### Esempio Input con Conversione e Processamento Parallelo
6767

6868
```plaintext
6969
Inserisci il percorso della cartella contenente i podcast: C:\Users\User\Podcasts
70-
Vuoi accelerare l'audio a 2x velocità per velocizzare la trascrizione? (s/n): s
71-
Modalità velocità 2x attivata
70+
Vuoi utilizzare il processamento parallelo per velocizzare la trascrizione? (s/n): s
71+
Modalità processamento parallelo attivata
7272
Conversione da MP3 a WAV richiesta...
7373
Conversione in corso: episodio1.mp3 → WAV
7474
Conversione completata: episodio1_converted.wav
75-
Accelerazione audio 2x in corso...
76-
Audio accelerato 2x: episodio1_converted.wav
77-
Audio accelerato con successo
78-
Trascrizione in corso per episodio1.mp3...
79-
File temporaneo rimosso
75+
Avvio trascrizione parallela...
76+
Divisione audio in 2 chunk da ~600.0s cadauno
77+
Creazione chunk 1...
78+
Creazione chunk 2...
79+
Chunk creati con successo
80+
Trascrizione parallela di 2 chunk...
81+
Elaborazione chunk in corso...
82+
Trascrizione parallela completata in 450.2 secondi
83+
Chunk episodio1_chunk1.wav rimosso
84+
Chunk episodio1_chunk2.wav rimosso
8085
File WAV convertito rimosso
8186
Trascrizione completata per episodio1.mp3, salvata in C:\Users\User\Podcasts\episodio1.txt
8287
```
8388

8489
---
8590

86-
### Accelerazione Audio 2x
91+
### Processamento Parallelo
8792

88-
La nuova funzionalità di accelerazione audio permette di velocizzare significativamente il processo di trascrizione:
93+
La nuova funzionalità di processamento parallelo permette di velocizzare significativamente il processo di trascrizione mantenendo la qualità originale:
8994

90-
- **Come funziona**: Utilizza FFmpeg per accelerare l'audio a 2x velocità mantenendo il pitch originale
91-
- **Vantaggi**: Riduce i tempi di elaborazione di circa il 50% mantenendo la qualità della trascrizione
92-
- **Requisiti**: Richiede FFmpeg installato nel sistema
93-
- **Processo automatico**: Crea file temporanei accelerati, li trascrive e li elimina automaticamente
94-
- **Fallback sicuro**: Se l'accelerazione fallisce, utilizza il file originale
95+
- **Come funziona**: Divide l'audio in chunk consecutivi e li elabora simultaneamente utilizzando thread separati
96+
- **Vantaggi**: Riduce i tempi di elaborazione fino al 40% mantenendo la qualità della trascrizione originale
97+
- **Architettura intelligente**: Utilizza concurrent.futures per sfruttare tutti i core della CPU disponibili
98+
- **Processo automatico**: Crea chunk temporanei, li trascrive in parallelo e li elimina automaticamente
99+
- **Fallback sicuro**: Se il processamento parallelo fallisce, utilizza automaticamente la trascrizione singola tradizionale
100+
- **Audio ottimale**: Funziona meglio con file audio più lunghi (>10 minuti) per massimizzare i benefici del parallelismo
95101

96-
**Nota**: L'accelerazione audio è opzionale e può essere abilitata/disabilitata ad ogni esecuzione.
102+
**Caratteristiche tecniche:**
103+
104+
- **Divisione intelligente**: Chunk di durata simile per bilanciare il carico di lavoro
105+
- **Thread separati**: Ogni chunk viene elaborato da un thread dedicato
106+
- **Riunificazione automatica**: I risultati vengono uniti nell'ordine corretto
107+
- **Gestione errori**: Timeout e fallback per garantire affidabilità
108+
- **Pulizia automatica**: Rimozione di tutti i file temporanei creati
109+
110+
**Nota**: Il processamento parallelo è opzionale e può essere abilitato/disabilitato ad ogni esecuzione. È più efficace su CPU multi-core.
97111

98112
---
99113

@@ -130,4 +144,4 @@ Oggi parleremo di tecnologia e innovazione...
130144
- **Compatibilità**: Assicurarsi di avere Python 3.10 installato.
131145
- **Output non distruttivo**: Lo script non modifica i file audio originali.
132146
- **Installazione automatica**: Pip e Whisper vengono aggiornati/installati automaticamente se necessario.
133-
- **FFmpeg richiesto**: Per la conversione formati e accelerazione 2x, installa FFmpeg nel sistema.
147+
- **FFmpeg richiesto**: Per la conversione formati e processamento parallelo, installa FFmpeg nel sistema.

0 commit comments

Comments
 (0)