-
Notifications
You must be signed in to change notification settings - Fork 0
Replace unicode math symbols (and some Latin ligatures) through their LaTeX equivalent.
License
humenda/utexer
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
uTeXer ====== Über uTeXer ----------- uTeXer ist ein Hilfsskript um mathematische Unicodezeichen und lateinische Ligaturen in LaTeX zu konvertieren, damit sie für Blinde lesbar werden; es wurde in Python geschrieben. Das Skript ist nützlich für: - Übersetzen von Formeln von Webseiten oder aus PDFs in LaTeX-Zeichen - verschönern der Textversionen von PDFs, wie sie z.B. durch pdftotext (aus den Popplerutils) generiert werden; häufig sind dies lateinische Ligaturen, die den Text schwerer lesbar machen. Das erlaubt blinden Nutzern erstmals Papers oder andere wissenschaftliche Dinge herunterzuladen und ohne sehende Nachkorrektur zu lesen. Download/Installation --------------------- Sie erhalten eine Kopie mit Git: git clone https://github.com/humenda/utexer.git oder hier [eine zip-Datei.](https://codeload.github.com/humenda/utexer/zip/master) Zur Ausführung von uTeXer benötigen Sie eine funktionierende Python3-Installation. Sie können ./install ausführen, was das Programm unter /usr/local/* installiert, oder PREFIX auf /usr setzen (oder /opt bzw. /) um den Pfad zu ändern. Sie können es auch direkt aus den Quellen ausführen. Benutzung von uTeXer -------------------- uTeXer ist ein einfaches Programm, die Hilfeseite sollte das Meiste erklären: Usage: utexer [options] INPUTFILE If no output file is specified with the -o option, the input file will be overwritten. If no input file is specified, stdin/stdout will be used (but you can redirect stdout with -o too). Options: -h, --help show this help message and exit -e ENC, --encoding=ENC Set encoding for stdin (default UTF-8) -l, --ligature replace ligatures through normal letters (at least in Latin languages where they are only for better readibility) -o FILE, --output=FILE set output file (if unset, overwrite input file) -p, --pdftotext Replace some signs generated just by PDFtotext -s, --strip-pagebreak Strip the newpage character -u FILE, --userdict=FILE set path to user-defined replacements/additions for unicode mappings (format described in README) Woher kommen die LaTeX-Befehle/wie passe ich diese an? ------------------------------------------------------ Die ursprüngliche Unicode-Tabelle wurde von http://www.w3.org/Math/characters/unicode.xml heruntergeladen. Mit der -u Option können Sie eine zusätzliche Unicode-Tabelle angeben, um Unicode-Codepunkte zu überschreiben (oder sogar hinzuzufügen). Das Format ist einfach: <decimal_number><tab><replacement> Beispiel: 123 \{ Das erlaubt Ihnen LaTeX-Kommandos anzupassen. Ich mag beispielsweise \\varnothing nicht und habe es durch das für mich intuitivere \\emptyset ersetzt. Bekannte Limitierungen ---------------------- Wie bereits angemerkt wurde, kann uTeXer keine ganzen Formeln übersetzen. Formeln die größer als eine Zeile sind, wie beispielsweise Brüche, Indizes und Potenzen werden (häufig) erkannt, weil sie nicht in Unicode notiert werden, sondern durch Höhenveränderung erkenntlich gemacht werden. Das ist nur für PDF-Ausgaben problematisch, bei HTML werden oft Tags für Indizes und Potenzen genutzt. Überstreichungen und Unterstreichungen gehen ebenfalls verloren. Es gibt Zeichen in der Unicode-Tabelle, welche nicht übersetzt werden sollten oder welche zu nicht häufig gebrauchten LaTeX-Kommandos übersetzt werden: - \\varnothing anstatt zu \\emptyset - { } anstatt von \\lbrace und \\rbrace, weil sonst auch Quelltext ersetzt wird
About
Replace unicode math symbols (and some Latin ligatures) through their LaTeX equivalent.
Resources
License
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published