Rendre l’IA tangible

Je me suis demandé comment introduire l’intelligence artificielle dans cette première leçon sur le portail KI-Léierbud. Devais-je commencer par l’histoire de l’IA, qui remonte à 1943 ? Par la présentation des pionniers de l’IA d’hier et des acteurs dominants d’aujourd’hui ? Par une explication des technologies de base ? Ou encore par une liste des avantages et des risques associés à l’IA ?

Et puis, je me suis souvenu d’une idée marquante : il y a trente ans, mon ancien collaborateur Patrick Hansen a conçu le Cube Internet, un objet tangible pour rendre concret un concept alors encore flou — le world wide web.

Cube Internet version 5

Ce cube a connu un grand succès et a largement contribué à la diffusion et à l’adoption rapide d’Internet au Luxembourg.

Alors, pourquoi ne pas suivre la même approche avec l’IA ?

Je vais donc commencer par le tangible : les applications concrètes de l’intelligence artificielle. Et puisque ChatGPT est devenu, pour beaucoup, le visage le plus accessible et le plus connu de l’IA, je vais d’abord expliquer comment cet outil peut aider les gens dans leur vie quotidienne.

ChatGPT a été lancé en novembre 2022 par la société OpenAI en tant que version préliminaire gratuite. Il a rapidement gagné en popularité grâce à sa capacité à générer du texte de manière conversationnelle et de haute qualité. En l’espace de seulement deux mois, ChatGPT est devenu l’une des applications informatiques à la croissance la plus rapide de l’histoire, dépassant les 100 millions d’utilisateurs.

OpenAI a régulièrement amélioré la version gratuite de ChatGPT, tout en introduisant des formules d’abonnement payantes offrant des versions plus avancées et mieux adaptées à des besoins spécifiques. Parallèlement, de nombreux autres acteurs sont entrés sur le marché de l’IA, et la progression des compétences et des performances de ces outils est devenue exponentielle.

En mars 2024, une première étude d’envergure sur l’usage de l’IA par le grand public a été publiée par Marc Zao-Sanders dans la Harvard Business Review. En mars 2025, l’auteur a proposé une mise à jour de cette recherche sous la forme d’un article en libre accès, sous licence Creative Commons Attribution.

Illustration de Marc Zao-Sanders 2025

Enfin, en juillet 2025, la société luxembourgeoise Quest a présenté les résultats d’un sondage spontané sur l’attitude de la population résidente face à l’intelligence artificielle.

Les conclusions issues de ces trois études m’ont permis de dresser un aperçu fidèle de l’évolution des usages et des applications de l’IA dans la vie des gens.

LetzAI : AARON

J’ai utilisé les images produites par l’application de Ray Kurzweil pour entraîner un modèle public appelé @aaron_by_harold_cohen sur la plateforme luxembourgeoise LetzAI. Les images qui suivent illustrent certains des résultats fascinants issus de cette collaboration, démontrant l’impact durable de l’œuvre de Cohen et les possibilités intrigantes de l’intelligence artificielle dans le domaine des beaux-arts.

Ray Kurzweil : AARON

Ray Kurzweil, éminent informaticien et futurologue américain, contribua à prolonger l’héritage de Cohen dans l’ère numérique en développant en 2000 un économiseur d’écran basé sur AARON, destiné aux ordinateurs sous Windows.

J’ai réussi à installer et à exécuter ce programme sur un de mes anciens ordinateurs. J’ai réalisé la vidéo ci-avant avec cette application moyennant des copies écran en temps réel. La galerie qui suit montre quelques images générées.

Pamela McCorduck : AARON

Pamela Ann McCorduck (1940 – 2021) était une auteure américaine, née au Royaume-Uni, connue pour ses ouvrages portant sur l’histoire et la portée philosophique de l’intelligence artificielle, l’avenir de l’ingénierie, ainsi que le rôle des femmes dans la technologie.

Elle commença sa carrière en collaborant avec le professeur Edward Feigenbaum, qui deviendrait par la suite l’un des pionniers des systèmes experts. Elle enseigna dans plusieurs universités et publia, en tant qu’auteure ou co-auteure, plusieurs romans et ouvrages en lien avec l’intelligence artificielle. Voici une sélection de ses œuvres :

  • Machines who think (1979)
  • The Fifth Generation: Artificial Intelligence and Japan’s Computer Challenge to the World (1983)
  • The Universal Machine: Confessions of a Technological Optimist (1986)
  • AARON’s Code : Meta-art, Artificial Intelligence, and the Work of Harold Cohen (1997)
  • This Could Be Important: My Life and Times with the Artificial Intelligentsia (2019)
Aarons Code 1997

Plongée en Australie : KLING

Suite à la génération de la première vidéo au sujet des aventures des jeunes explorateurs avec l’outil IA VIDU Studio, j’ai utilisé les mêmes images et les mêmes prompts pour tester un deuxième générateur vidéo, Kling.AI. Développé par la société chinoise Kuaishou Technology, l’outil KLING a été officiellement lancée le 6 juin 2024. Les fonctionnalités principales sont la génération de vidéos à partir de texte ou d’images (text‑to‑video et image‑to‑video) jusqu’à 2 minutes en 1080 p à 30 fps, ainsi que l’extension de vidéos existantes.

La comparaison de la vidéo KLING ci-après avec la vidéo VIDU de l’article précédent permet de comparer les forces et faiblesses des deux outils.

Aujourd’hui, il existe une pléthore de générateurs vidéo qui dépassent largement les performances des premiers outils IA. Le lecteur intéressé va les découvrir dans un article renseignant sur les différents modèles IA.

IA dans l’école fondamentale

Le présent projet constitue une idée fantaisiste, décrit par un humain et illustrée par un générateur d’images IA. Même s’il s’agit actuellement uniquement d’un projet décrit sur papier, il convient de souligner que toutes les technologies utilisées et toutes les compétences nécessaires pour mettre cette idée en pratique sont actuellement disponibles au Luxembourg.

Pour présenter l’utilité d’un robot dans l’école, Je me suis concentré sur l’intégration de l’IA dans l’enseignement fondamental. Comme son nom l’indique, c’est à ce niveau que sont posées les bases essentielles de l’apprentissage chez l’enfant. J’ai ainsi conçu un projet dans lequel l’IA est intégrée à un robot dont l’apparence s’inspire du Nabaztag, le premier objet connecté grand public, lancé il y a une vingtaine d’années. Le robot, de la taille d’un enfant de 10 ans, est représenté dans les images jointes.

Son apparence familière et non menaçante favorise l’attachement affectif des élèves. Sa taille, comparable à celle d’un enfant, permet d’instaurer une relation pédagogique équilibrée, ni autoritaire, ni infantilisante. Sa capacité à dialoguer en langage naturel (via reconnaissance et synthèse vocale), son interaction multimodale, l’impression automatique de fiches pédagogiques et la lecture optique des exercices manuscrits facilitent grandement la communication avec les élèves.

Les fonctionnalités essentielles du robot sont les suivantes :

  • Reconnaissance faciale (caméras intégrées dans les yeux)
  • Traitement du langage naturel (microphone et haut-parleur dans la bouche)
  • Lecture de puces via un capteur situé dans le nez
  • Interaction visuelle (écran intégré affichant texte et images)
  • Lecture optique et analyse de documents manuscrits (scanner intégré, fente A)
  • Impression de documents personnalisés (imprimante interne, fente B)
  • Interface de commande manuelle (oreilles pliantes servant de joystick)
  • Mobilité assistée (roulettes permettant le déplacement en classe)

Sur les sentiers du patrimoine UNESCO

Pour adapter mon scénario aux compétences de l’IA générative de l’époque, j’ai décidé de répartir les cinq enfants en deux équipes : la fille ainée formait un groupe avec les deux jumeaux et la fille cadette faisait un team avec son cousin. En outre, les enfants n’ont pas pu emmener leurs animaux de compagnie. Floppy, Blublu, Caramel, Léon et Cocorico ont du rester à la maison. De cette façon c’était possible de dépicter, d’une façon cohérente, les deux bandes avec 2 et 3 personnes dans des images générées par IA.

Au niveau de la description du voyage, j’ai remplacé l’expédition, avec des imprévues et des complications à travers le monde, par une exploration bien organisée de plusieurs destinations, définies au préalable, dans différents pays. De cette manière ChatGPT a pu mettre en valeur ses riches connaissances du monde, sans devoir trop réfléchir. Malgré ses compétences impressionnantes pour programmer des applications informatiques ou pour résoudre des problèmes logiques, le raisonnement n’était pas encore le trait le plus fort de ChatGPT en fin d’année 2023.

Plongée en Australie : VIDU

Lors de la publication de mon livre Les Jeunes Explorateurs, j’avais promis de réaliser dans la suite un film court, sans caméra, de quelques aventures des protagonistes. Fin 2024, les technologies IA de génération de vidéos étaient suffisamment avancées pour me lancer dans ce projet. J’ai choisi comme outil IA des générateurs image2video qui créent des séances vidéo de courte durée, à partir d’images de référence et de descriptions (text2video) en langage naturelle (prompts) concernant l’animation de chaque scène.

Les images de référence, spécifiées au début de chaque scène, ont été générées sur la plateforme luxembourgeoise LetzAI. Après le montage manuel du film dans un éditeur vidéo classique, j’ai chargé le film dans ChatGPT et demandé de rédiger un récit pour raconter l’aventure avec une voix off. J’ai généré les sons avec l’outil IA Meta Audiobox et pour la voix off, j’ai sélectionné une voix synthétique française masculine dans la librairie publique de l’entreprise ElevenLabs.

Le premier outil de génération vidéo que j’ai testé était VIDU Studio. L’outil d’IA VIDU a été développé par la startup chinoise Shengshu Technology, en collaboration avec l’Université Tsinghua à Pékin. VIDU a été officiellement lancé en juillet 2024. Sur le plan technique, le cœur du système repose sur une architecture appelée U‑ViT (Universal Vision Transformer), développée par le scientifique en chef Jun Zhu et son équipe.

https://youtu.be/jkGYfadSB_U?si=9Vka4PQ3WQbDrt_q

Louis Ducos du Hauron (LDH) à Luxembourg

En 2021, je me suis servi de plusieurs outils d’intelligence artificielle (IA) de première génération pour créer une vidéo fiction au sujet d’une visite de Louis Ducos du Hauron (LDH) à Luxembourg en 1862.

Pour animer une ancienne photo noir et blanc de LDH et pour créer une vidéo de sa visite à Luxembourg, j’ai utilisé les outils IA suivants :

  • animation faciale
  • synthèse vocale
  • coloration de photos noir et blanc
  • création de musique

On peut considérer la vidéo comme un exemple de deepfake, sauf que dans mes publications, j’avais expressément souligné qu’il s’agit d’une fiction.

C’est peu connu que LDH est le vrai inventeur de la photographie en couleur. Il y a quelques années c’étaient les frères Lumière qui ont été référencés partout sur Internet comme les inventeurs. Le succès des larges modèles IA de langages (LLM) a contribué à une correction d’informations erronées dans les archives publics. En mi-2025, j’ai demandé à ChatGPT qui est l’inventeur de la photographie en couleurs. Contrairement à sa fausse réponse il y a deux ans, l’IA a confirmé maintenant qu’il s’agit de Louis Ducos de Hauron.

Copie écran de mon dialogue avec ChatGPT-4o