Les machines qui animent des têtes parlantes
Les tout premiers systèmes de synthèse vocale prenaient souvent la forme de têtes parlantes.
Au Moyen Âge, il s’agissait le plus souvent de supercheries : ainsi, la fameuse tête parlante attribuée à Albert le Grand, qui aurait été brisée par Thomas d’Aquin, relevait davantage du mythe que de la science. D’autres prétendus prodiges reposaient simplement sur la ventriloquie.

Un véritable exploit technique vit cependant le jour le 2 juillet 1783, lorsqu’un automate à deux têtes parlantes fut présenté à l’Académie royale des sciences de Paris. Son inventeur était Jacques de Vaucanson Mical, dit l’abbé Mical (1730–1809). L’appareil se composait de deux bustes mécaniques reliés à un système de soufflets et de tuyaux imitant les poumons, le larynx et la bouche.
Chaque tête produisait des sons distincts qui, combinés, pouvaient articuler des phrases complètes en français. On estime qu’elles étaient capables de prononcer une quinzaine de mots intelligibles, parmi lesquels :
- « Le Roi a donné la paix à l’Europe »
- « La paix fait la gloire des rois »
Cette machine illustre parfaitement l’esprit à la fois scientifique et spectaculaire du Siècle des Lumières.

Un autre exemple marquant est la machine parlante Euphonia, conçue à partir de 1835 par l’inventeur allemand Joseph Faber (1800–1850). Formé en physique, mathématiques et musique à l’Institut polytechnique impérial et royal de Vienne, Joseph Faber présenta sa création à Vienne, puis au roi de Bavière en 1841.
L’Euphonia fut ensuite exposée à Berlin et à Dresde, avant de traverser l’Atlantique pour des démonstrations à New York et à Philadelphie. Mais ce n’est qu’à partir de 1846, lors d’expositions à Londres et à Paris, que la machine devint une véritable attraction.
Pendant plusieurs décennies, elle intégra même le cirque itinérant de P.T. Barnum, captivant des foules à travers le monde.

Après la mort de Joseph Faber, la machine passa entre les mains de sa nièce et de son mari, qui poursuivirent les démonstrations publiques. Mais après 1885, on perd définitivement la trace de cette invention fascinante.
Têtes parlantes virtuelles
Cent cinquante ans après la présentation de l’Euphonia, les têtes parlantes sont devenues virtuelles.
À la fin des années 1990, les applications permettant de créer des têtes animées pour le web se multipliaient. Haptek, Mendel3D, Famous3D, LifeX, Crazy Talk, avTalk, FaceWorks ne sont que quelques exemples de produits qui, à l’époque, offraient la possibilité de générer des têtes 3D à partir de deux simples photos de son visage — une de face et une de profil.

La figure ci-dessus illustre l’interface de FaceWorks, un outil lancé en 1997 par Digital Equipment Corporation.
Les objectifs de ces têtes parlantes en trois dimensions étaient variés :
- création d’avatars personnalisés pour les jeux vidéo,
- réduction de la bande passante en visiophonie (une tête animée consomme moins de données qu’une vidéo complète),
- étude des interactions sociales dans des environnements numériques.
Parmi ces programmes, le plus avancé était 3DmeNow, développé par la société anglaise BioVirtual. Cet outil permettait de créer des têtes parlantes photo-réalistes et d’animer le visage en synchronisation avec sa propre voix.
Ma propre tête parlante, créée à l’époque avec 3DmeNow, est présentée dans la petite vidéo ci-après :
Les têtes parlantes multilingues
La combinaison de la traduction automatique, du clonage de la voix et de la synchronisation labiale permet aujourd’hui de générer des têtes parlantes capables de s’exprimer dans des centaines de langues différentes.
En septembre 2023, j’ai réalisé une petite vidéo en anglais pour présenter le premier volume de ma tétralogie Qubit Lëtzebuerg, qui raconte l’histoire de l’introduction des nouvelles technologies de l’information et de la communication au Luxembourg. Grâce à la version bêta de l’application «Translate a Video» de Heygen, j’ai pu générer douze versions traduites : en allemand, coréen, espagnol, français, hindi, italien, japonais, mandarin, néerlandais, polonais, portugais et turc.
À découvrir ci-après :
Vidéo multilingue
Français
Présentation « Qubit Lëtzebuerg » — version française.
Allemand
Präsentation — deutsche Version.
Anglais
Presentation — English version.
Espagnol
Presentación — versión en español.
Italien
Presentazione — versione italiana.
Néerlandais
Presentatie — Nederlandse versie.
Polonais
Prezentacja — wersja polska.
Portugais
Apresentação — versão portuguesa.
Turc
Sunum — Türkçe sürüm.
Japonais
プレゼンテーション — 日本語版。
Coréen
프레젠테이션 — 한국어 버전.
Mandarin
演示 — 普通话版本。
Hindi
प्रस्तुति — हिंदी संस्करण।
Les têtes parlantes luxembourgeoises
Il y a deux ans, les outils IA de Heygen ne maîtrisaient pas encore le luxembourgeois. Depuis, les têtes parlantes — devenues entre-temps de véritables avatars — ont appris à s’exprimer aussi dans notre langue nationale.
J’ai ainsi généré, début juillet 2025, la vidéo ci-dessous avec l’avatar public Annie de Heygen, qui récite la fable d’Ésope « De Nordwand an d’Sonn ».