Les Jeunes Explorateurs

J’ai commencé le nouvel an 2024 avec la création d’un livre illustré avec l’assistance de l’intelligence artificielle, dédié à mes petits-enfants.

L’inspiration de créer un livre d’aventures pour les jeunes, moyennant des outils d’intelligence artificielle, m’est venue fin février 2023, lorsque Thierry Labro, rédacteur en chef de Paperjam, a publié son roman futuriste Ils ont tué mon avatar !, conçu en une heure par ChatGPT et illustré par Dall-E. À cette époque, l’intelligence artificielle, bien qu’avancée, ne permettait pas encore de créer des images en haute résolution ou de rédiger de longs textes de manière cohérente.

LetzAI

L’été 2023 a marqué un tournant avec la présentation de LetzAI, un générateur d’images luxembourgeois révolutionnaire, basé sur l’intelligence artificielle. Ce progrès majeur permettait pour la première fois d’entraîner un modèle de manière fiable et aisée avec ses propres personnages, pour produire ensuite des illustrations fidèles et harmonieuses.

Début septembre 2023, j’ai découvert LetzAI pendant mon petit déjeuner, lors de la lecture de l’article Hier wird der Großherzog zu Iron Man dans le Luxemburger Wort. Les jours suivants, presque toute la presse présentait le projet. Dans la suite, les média continuaient de parler de LetzAI. J’ai profité de l’offre Early Access de LetzAI et j’étais un des premiers usagers de la plateforme IA générative luxembourgeoise en dehors de l’équipe de développement.

Mi-novembre 2023, la technique était donc prête pour concrétiser mon rêve et pour procéder à la conception d’un livre d’aventures pour mes petits-enfants, avec l’aide de ChatGPT-4 et de LetzAI.

Concept initial de mon livre

Au début, j’avais esquissé un concept sophistiqué. Les 5 enfants, 2 filles et 3 garçons, parmi eux des jumeaux, étaient accompagnés par leurs animaux de compagnie : le lapin Floppy, le poisson rouge Blublu, le cochon d’Inde Caramel, le caméléon Léon et le coq Cocorico. L’illustration qui suit montre les protagonistes imaginées.

Le voyage aurait du se dérouler comme une grande aventure, parsemée d’imprévus et de complications.

Faiblesses des premiers modèles d’IA générative

Mais fin 2023, j’ai rapidement constaté que des scénarios complexes embrouillaient ChatGPT et ne permettaient pas de créer des récits cohérents dans une même session. J’avais par exemple imaginé qu’un des acteurs se cassait une jambe lors d’un saut en parachute en Indonésie et devait être rapatrié par Luxembourg Air Rescue. J’avais prévu d’autres complications et incidents, mais c’était trop fastidieux de demander en permanence à ChatGPT des modifications des récits générés, respectivement de procéder à des corrections manuelles.

Au niveau des illustrations, c’était pire. Je n’ai pas réussi à générer des images correctes avec tous les personnages et les animaux de compagnie : par exemple les enfants avaient des têtes de caméléon ou des jambes de coq. J’ai noté en outre des incohérences avec les habits et les lunettes des enfants, des confusions au niveau de la couleur des cheveux et des yeux, des variations des tailles des enfants, et ainsi de suite.

À côté de LetzAI, j’ai essayé d’autres applications de génération d’images comme DALL*E3, Stable Diffusion ou Midjourney, mais aucun modèle permettait de générer des groupes de plusieurs personnages avec la cohérence voulue.

Pour tenir compte des limitations de l’intelligence artificielle fin 2023, je me suis résigné à simplifier mon script initial.