Plongée en Australie : KLING

Suite à la génération de la première vidéo au sujet des aventures des jeunes explorateurs avec l’outil IA VIDU Studio, j’ai utilisé les mêmes images et les mêmes prompts pour tester un deuxième générateur vidéo, Kling.AI. Développé par la société chinoise Kuaishou Technology, l’outil KLING a été officiellement lancée le 6 juin 2024. Les fonctionnalités principales sont la génération de vidéos à partir de texte ou d’images (text‑to‑video et image‑to‑video) jusqu’à 2 minutes en 1080 p à 30 fps, ainsi que l’extension de vidéos existantes.

La comparaison de la vidéo KLING ci-après avec la vidéo VIDU de l’article précédent permet de comparer les forces et faiblesses des deux outils.

Aujourd’hui, il existe une pléthore de générateurs vidéo qui dépassent largement les performances des premiers outils IA. Le lecteur intéressé va les découvrir dans un article renseignant sur les différents modèles IA.

Plongée en Australie : VIDU

Lors de la publication de mon livre Les Jeunes Explorateurs, j’avais promis de réaliser dans la suite un film court, sans caméra, de quelques aventures des protagonistes. Fin 2024, les technologies IA de génération de vidéos étaient suffisamment avancées pour me lancer dans ce projet. J’ai choisi comme outil IA des générateurs image2video qui créent des séances vidéo de courte durée, à partir d’images de référence et de descriptions (text2video) en langage naturelle (prompts) concernant l’animation de chaque scène.

Les images de référence, spécifiées au début de chaque scène, ont été générées sur la plateforme luxembourgeoise LetzAI. Après le montage manuel du film dans un éditeur vidéo classique, j’ai chargé le film dans ChatGPT et demandé de rédiger un récit pour raconter l’aventure avec une voix off. J’ai généré les sons avec l’outil IA Meta Audiobox et pour la voix off, j’ai sélectionné une voix synthétique française masculine dans la librairie publique de l’entreprise ElevenLabs.

Le premier outil de génération vidéo que j’ai testé était VIDU Studio. L’outil d’IA VIDU a été développé par la startup chinoise Shengshu Technology, en collaboration avec l’Université Tsinghua à Pékin. VIDU a été officiellement lancé en juillet 2024. Sur le plan technique, le cœur du système repose sur une architecture appelée U‑ViT (Universal Vision Transformer), développée par le scientifique en chef Jun Zhu et son équipe.

https://youtu.be/jkGYfadSB_U?si=9Vka4PQ3WQbDrt_q

Louis Ducos du Hauron (LDH) à Luxembourg

En 2021, je me suis servi de plusieurs outils d’intelligence artificielle (IA) de première génération pour créer une vidéo fiction au sujet d’une visite de Louis Ducos du Hauron (LDH) à Luxembourg en 1862.

Pour animer une ancienne photo noir et blanc de LDH et pour créer une vidéo de sa visite à Luxembourg, j’ai utilisé les outils IA suivants :

  • animation faciale
  • synthèse vocale
  • coloration de photos noir et blanc
  • création de musique

On peut considérer la vidéo comme un exemple de deepfake, sauf que dans mes publications, j’avais expressément souligné qu’il s’agit d’une fiction.

C’est peu connu que LDH est le vrai inventeur de la photographie en couleur. Il y a quelques années c’étaient les frères Lumière qui ont été référencés partout sur Internet comme les inventeurs. Le succès des larges modèles IA de langages (LLM) a contribué à une correction d’informations erronées dans les archives publics. En mi-2025, j’ai demandé à ChatGPT qui est l’inventeur de la photographie en couleurs. Contrairement à sa fausse réponse il y a deux ans, l’IA a confirmé maintenant qu’il s’agit de Louis Ducos de Hauron.

Copie écran de mon dialogue avec ChatGPT-4o