Les machines qui traduisent nos textes
Lorsque deux personnes ne parlent pas la même langue, il faut convertir le contenu exprimé dans la langue source vers la langue cible : c’est ce que l’on appelle la traduction. Le Luxembourg figure parmi les pionniers de la traduction automatique, notamment parce que de nombreuses institutions européennes y ont leur siège.
Dans son rapport d’activités 1975–1977, la Direction générale XIII de la Commission européenne (chargée de l’information et de l’innovation) annonçait le lancement d’un projet pilote de traduction automatique avec le logiciel SYSTRAN. Un premier contrat pour l’utilisation de SYSTRAN par les institutions européennes a été signé fin 1975 avec Peter Toma, un informaticien hongrois émigré aux États-Unis en 1952, qui avait commencé à développer des systèmes de traduction automatique dès 1961.
L’histoire de SYSTRAN se lit comme un roman policier ; je la raconte en détail (dix pages) dans le premier volume de ma tétralogie Qubit Lëtzebuerg, consacrée à l’introduction des technologies de l’information et de la communication au Luxembourg.
En avril 2006, Google a utilisé SYSTRAN pour démarrer son service de traduction en ligne Google Translate. Dès octobre 2007, le système a été remplacé par une technologie propriétaire de Google, qui est restée pendant plus de dix ans le seul outil capable de traduire le luxembourgeois.
Du côté des institutions européennes, SYSTRAN a été remplacé en décembre 2010 par MT@EC, puis en mars 2020 par eTranslation. Ironie de l’histoire : aucun de ces projets développés (en partie) au Luxembourg ne maîtrise la langue luxembourgeoise.
En 2022, j’ai développé un espace de démonstration pour la traduction anglais ↔ luxembourgeois avec trois modèles d’IA open source : NLLB (Meta AI), MarianNMT (projet académique) et T5/mt5 (Google Research). Chaque utilisateur peut constater que, malgré leurs qualités, ces modèles sont encore loin du niveau requis pour obtenir un certificat C1 en luxembourgeois.

Aujourd’hui, ChatGPT et des outils commerciaux comme DeepL sont largement utilisés par des journalistes et autres professionnels pour traduire des textes dans différentes langues. Les versions récentes de ChatGPT peuvent effectivement traduire des textes luxembourgeois dans les deux sens, mais le résultat reste loin de celui d’un traducteur natif. Pourtant, les technologies et les données existent déjà pour développer un modèle IA capable de traduire le luxembourgeois de manière parfaite.
Deux exemples encourageants : Sitraka Matthieu Forler, data scientist travaillant depuis juin 2025 chez POST Luxembourg, a montré la voie en développant une version personnalisée de ChatGPT dédiée à la traduction anglais/français/allemand ↔ luxembourgeois. Ce projet, baptisé LuxemGPT, n’en est encore qu’à sa version 0.1, mais il constitue un premier pas prometteur.

Un deuxième projet, déjà arrivé à la version 0.6.2, a été présenté le 24 septembre 2025 par Michel Weimerskirch, créateur du correcteur orthographique luxembourgeois (spellchecker), dont le développement a débuté en 2006. Le site web spellchecker.lu, très apprécié des résidents, a été repris en 2023 par le ZLS (Zenter fir d’Lëtzebuerger Sprooch), qui gère également le LOD (Lëtzebuerger Online Dictionnaire).
Michel Weimerskirch a étudié le génie logiciel à l’Université technique de Kaiserslautern de 2004 à 2009. Après ses études, il a travaillé comme développeur web indépendant avant de fonder, en 2013, avec deux associés, sa propre agence web Lightbulb. Il y a quelques années, il a choisi de rejoindre une entreprise en tant que développeur web full-stack et a cédé ses parts dans Lightbulb à ses cofondateurs.
