Projet de traduction automatique et assistée

Description

Ce projet correspond à une analyse et une évaluation à grande échelle du moteur de traduction neuronale OpenNMT.

Groupe

Laura Darenne, Inalco
Camille Clavier, Inalco

Training et fichiers notebook

Toutes les run ont été faites sur google colab car nos ordinateurs n'étaient pas assez performants. Chacun des notebooks se trouvent directement dans les dossiers liés à chacune des runs : ./data/corpus_europarl/run* et .data/corpus_emea_europarl/run*. Normalement, chacune des runs à son log du training : train.log. Le git OpenNMT (https://github.com/OpenNMT/OpenNMT-py) était cloné avant de commencer à faire tourner les fichiers jupyter.

Evaluation

Les fichiers ont parfois été detokénisé pour refaire le test du score bleu. Nous avons utiliser le detokenizer de mosesdecoder (https://github.com/moses-smt/mosesdecoder/).

L'évaluation a été faite avec le fichier python compute_bleu.py reprise d'un repository de Yasmin Moslem (https://github.com/ymoslem/MT-Evaluation). Il nous a servi à calculer le score BLEU. Nous avons aussi testé le script multiperl.perl de mosesdecoder. Les résultats étaient très similaires.

projet initialement fait sur gitlab

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
data		data
Darenne-Clavier.pdf		Darenne-Clavier.pdf
README.md		README.md
compute-bleu.py		compute-bleu.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projet de traduction automatique et assistée

Description

Groupe

Training et fichiers notebook

Evaluation

About

Releases

Packages

Languages

Araule/M1S2_traductionautomatique

Folders and files

Latest commit

History

Repository files navigation

Projet de traduction automatique et assistée

Description

Groupe

Training et fichiers notebook

Evaluation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages