Plongée en Australie : VIDU

Lors de la publication de mon livre Les Jeunes Explorateurs, j’avais promis de réaliser dans la suite un film court, sans caméra, de quelques aventures des protagonistes. Fin 2024, les technologies IA de génération de vidéos étaient suffisamment avancées pour me lancer dans ce projet. J’ai choisi comme outil IA des générateurs image2video qui créent des séances vidéo de courte durée, à partir d’images de référence et de descriptions (text2video) en langage naturelle (prompts) concernant l’animation de chaque scène.

Les images de référence, spécifiées au début de chaque scène, ont été générées sur la plateforme luxembourgeoise LetzAI. Après le montage manuel du film dans un éditeur vidéo classique, j’ai chargé le film dans ChatGPT et demandé de rédiger un récit pour raconter l’aventure avec une voix off. J’ai généré les sons avec l’outil IA Meta Audiobox et pour la voix off, j’ai sélectionné une voix synthétique française masculine dans la librairie publique de l’entreprise ElevenLabs.

Le premier outil de génération vidéo que j’ai testé était VIDU Studio. L’outil d’IA VIDU a été développé par la startup chinoise Shengshu Technology, en collaboration avec l’Université Tsinghua à Pékin. VIDU a été officiellement lancé en juillet 2024. Sur le plan technique, le cœur du système repose sur une architecture appelée U‑ViT (Universal Vision Transformer), développée par le scientifique en chef Jun Zhu et son équipe.

https://youtu.be/jkGYfadSB_U?si=9Vka4PQ3WQbDrt_q

Louis Ducos du Hauron (LDH) à Luxembourg

En 2021, je me suis servi de plusieurs outils d’intelligence artificielle (IA) de première génération pour créer une vidéo fiction au sujet d’une visite de Louis Ducos du Hauron (LDH) à Luxembourg en 1862.

Pour animer une ancienne photo noir et blanc de LDH et pour créer une vidéo de sa visite à Luxembourg, j’ai utilisé les outils IA suivants :

  • animation faciale
  • synthèse vocale
  • coloration de photos noir et blanc
  • création de musique

On peut considérer la vidéo comme un exemple de deepfake, sauf que dans mes publications, j’avais expressément souligné qu’il s’agit d’une fiction.

C’est peu connu que LDH est le vrai inventeur de la photographie en couleur. Il y a quelques années c’étaient les frères Lumière qui ont été référencés partout sur Internet comme les inventeurs. Le succès des larges modèles IA de langages (LLM) a contribué à une correction d’informations erronées dans les archives publics. En mi-2025, j’ai demandé à ChatGPT qui est l’inventeur de la photographie en couleurs. Contrairement à sa fausse réponse il y a deux ans, l’IA a confirmé maintenant qu’il s’agit de Louis Ducos de Hauron.

Copie écran de mon dialogue avec ChatGPT-4o

Harold Cohen : AARON

Harold Cohen

Créateur d’AARON, le premier programme informatique de dessin

Harold Cohen fut un pionnier à la croisée de l’intelligence artificielle et des arts visuels, créant en 1972 AARON, un programme informatique révolutionnaire conçu pour générer de manière autonome des peintures et des dessins. Son approche novatrice mêlant créativité computationnelle et art traditionnel lui valut une renommée internationale, avec des œuvres présentées dans de nombreuses expositions au sein de musées prestigieux à travers le monde. En reconnaissance de ses contributions, Cohen reçut de multiples distinctions au cours de sa carrière.

Né au Royaume-Uni en 1928, Cohen s’installa aux États-Unis, où il partagea son expertise et sa passion pour l’art et la technologie à l’Université de Californie de 1968 jusqu’à sa retraite en 1998. Même après avoir pris sa retraite, il continua de s’impliquer activement dans le développement d’AARON, enrichissant sans cesse ses capacités et sa complexité. Le programme, initialement développé en C, fut par la suite réécrit en LISP afin de tirer parti des fonctionnalités puissantes de ce langage pour le développement de l’intelligence artificielle.

Harold Cohen en 1995

Dans les semaines précédant son décès en 2016, Cohen se lança dans un nouveau projet ambitieux avec AARON, intitulé « Fingerpainting for the 21st Century » (Peinture au doigt pour le XXIe siècle). Si, dans les premières années, il utilisait des traceurs x-y pour donner vie aux créations d’AARON, il mit au point dans les années 1990 une série de machines de peinture numérique. Cette évolution continue du médium le conduisit à utiliser des imprimantes à jet d’encre, puis des écrans tactiles dans son dernier projet, cherchant toujours à fusionner technologie et essence tactile de la peinture.

Les Jeunes Explorateurs

J’ai commencé le nouvel an 2024 avec la création d’un livre illustré avec l’assistance de l’intelligence artificielle, dédié à mes petits-enfants.

L’inspiration de créer un livre d’aventures pour les jeunes, moyennant des outils d’intelligence artificielle, m’est venue fin février 2023, lorsque Thierry Labro, rédacteur en chef de Paperjam, a publié son roman futuriste Ils ont tué mon avatar !, conçu en une heure par ChatGPT et illustré par Dall-E. À cette époque, l’intelligence artificielle, bien qu’avancée, ne permettait pas encore de créer des images en haute résolution ou de rédiger de longs textes de manière cohérente.

LetzAI

L’été 2023 a marqué un tournant avec la présentation de LetzAI, un générateur d’images luxembourgeois révolutionnaire, basé sur l’intelligence artificielle. Ce progrès majeur permettait pour la première fois d’entraîner un modèle de manière fiable et aisée avec ses propres personnages, pour produire ensuite des illustrations fidèles et harmonieuses.

Début septembre 2023, j’ai découvert LetzAI pendant mon petit déjeuner, lors de la lecture de l’article Hier wird der Großherzog zu Iron Man dans le Luxemburger Wort. Les jours suivants, presque toute la presse présentait le projet. Dans la suite, les média continuaient de parler de LetzAI. J’ai profité de l’offre Early Access de LetzAI et j’étais un des premiers usagers de la plateforme IA générative luxembourgeoise en dehors de l’équipe de développement.

Mi-novembre 2023, la technique était donc prête pour concrétiser mon rêve et pour procéder à la conception d’un livre d’aventures pour mes petits-enfants, avec l’aide de ChatGPT-4 et de LetzAI.

Concept initial de mon livre

Au début, j’avais esquissé un concept sophistiqué. Les 5 enfants, 2 filles et 3 garçons, parmi eux des jumeaux, étaient accompagnés par leurs animaux de compagnie : le lapin Floppy, le poisson rouge Blublu, le cochon d’Inde Caramel, le caméléon Léon et le coq Cocorico. L’illustration qui suit montre les protagonistes imaginées.

Le voyage aurait du se dérouler comme une grande aventure, parsemée d’imprévus et de complications.

Faiblesses des premiers modèles d’IA générative

Mais fin 2023, j’ai rapidement constaté que des scénarios complexes embrouillaient ChatGPT et ne permettaient pas de créer des récits cohérents dans une même session. J’avais par exemple imaginé qu’un des acteurs se cassait une jambe lors d’un saut en parachute en Indonésie et devait être rapatrié par Luxembourg Air Rescue. J’avais prévu d’autres complications et incidents, mais c’était trop fastidieux de demander en permanence à ChatGPT des modifications des récits générés, respectivement de procéder à des corrections manuelles.

Au niveau des illustrations, c’était pire. Je n’ai pas réussi à générer des images correctes avec tous les personnages et les animaux de compagnie : par exemple les enfants avaient des têtes de caméléon ou des jambes de coq. J’ai noté en outre des incohérences avec les habits et les lunettes des enfants, des confusions au niveau de la couleur des cheveux et des yeux, des variations des tailles des enfants, et ainsi de suite.

À côté de LetzAI, j’ai essayé d’autres applications de génération d’images comme DALL*E3, Stable Diffusion ou Midjourney, mais aucun modèle permettait de générer des groupes de plusieurs personnages avec la cohérence voulue.

Pour tenir compte des limitations de l’intelligence artificielle fin 2023, je me suis résigné à simplifier mon script initial.

Quiz poème Arthur Rimbaud

Noir d’un vol triomphal, le vieux corbeau les suit,
Criant des versets purs dans le ciel morne et doux ;
Sur le char de la Mort, dans le vent qui le suit,
Il s’abat, se pose, et regarde autour de nous.

Ils sont là, les corbeaux, amis des funérailles ;
Leur vol dur est battu de fureur et de cris ;
Sur les morts, sur les champs, au fond des broussailles,
Ils planent obstinés, sinistres, amaigris.

L’hiver, quand les labours frissonnent sous la bise,
Quand sur les hameaux noirs retombe le grand ciel,
Parfois on les entend, dans l’ombre indécise,
Passer, en tourbillons, au loin, sous le ciel tel.

Quiz Poème Charles Baudelaire

Du temps que la Nature en sa verve puissante
Concevait chaque jour des enfants monstrueux,
J’eusse aimé vivre auprès d’une jeune géante,
Comme aux pieds d’une reine un chat voluptueux.
J’eusse aimé voir son corps fleurir avec son âme
Et grandir librement dans ses terribles jeux ;
Deviner si son cœur couve une sombre flamme
Aux humides brouillards qui nagent dans ses yeux ;
Parcourir à loisir ses magnifiques formes ;
Ramper sur le versant de ses genoux énormes,
Et parfois en été, quand les soleils malsains
Lasse, la font s’étendre à travers la campagne,
Dormir nonchalamment à l’ombre de ses seins,
Comme un hameau paisible au pied d’une montagne.

Quiz Poème Victor Hugo

L’homme naît doux, bon, honnête ;
il aime, il aide, il pardonne ;
Le pauvre est un frère au pauvre ;
il pleure, il souffre, il s’étonne
De la misère, et du sort ;
L’homme, c’est l’agneau qui broute ;
le loup, c’est l’homme encore ;
En lui se mêlent d’abord
L’instinct qui guide et l’erreur.
O pauvre homme, humble, honnête homme,
Dis : — Seigneur, j’étais ton enfant,
J’étais ton fils, j’étais ton hôte ;
Qu’ai-je fait pour être ton banni ?
— Dieu dit : — Tu fus homme.

KI-Léierbud. Quoi?

KI-Léierbud. Quoi?

KI-Léierbud est un portail web interactif destiné au grand public, dont l’objectif est de rendre l’intelligence artificielle (IA) accessible et compréhensible. Ce site proposera des contenus éducatifs, des démonstrations interactives, des mini-cours, des quiz et des simulateurs pour expliquer les bases, les applications, et les enjeux éthiques de l’IA.