Skip to content

notaTeapot/MemoTrans

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MemoTrans

Programm zur automatischen Transkription von Sprachnachrichten aus Telegramm Gruppen oder anderen .ogg Dateien. Weitere Informationen: https://lingdrafts.hypotheses.org/2282

Installation

Nutzung

  • MemoTrans v0.X.exe starten
  • Ordner auswählen in dem sich die .ogg Dateien befinden
  • überprüfen dass ".ogg Dateien konvertieren und aufteilen" angewählt ist
  • "als Sätze mit Metadaten ausgeben" auswählen falls den Texten Metadaten zugeordnet werden sollen
  • "Dateien Suchen" klicken
  • wenn passende Dateien gefunden wurden "Start" klicken
  • Transkription durchlaufen lassen (kann je nach Dateianzahl auch mehrere Stunden dauern!)
  • text.txt enthält den transkribierten Text mit einer Zuordnung zur jeweiligen Audiodatei (Achtung! Datei ist standardmäßig im ANSI Format und muss ggf. für die weiterverarbeitung in UTF-8 konvertiert werden.)

Funktion

Das Programm liest eine .ogg Datei ein, konvertiert sie in eine kompatible .wav Datei und teilt sie ggf. in 5-Minuten Segmente. Danach werden die Segmente einer Datei an die Google Speech Api weitergegeben, die diese transkribiert. Der Text wird einem Textdokument hinzugefügt. Das Vorgehen wird für alle Dateien wiederholt.

Changelog

v0.3

  • Ausgabe als Sätze mit Metadaten hinzugefügt
  • Code Kommentiert

v0.2

  • Update der Anzeigetexte

v0.1

  • Initiale Version