Harold Cohen : AARON

Harold Cohen

Créateur d’AARON, le premier programme informatique de dessin

Harold Cohen fut un pionnier à la croisée de l’intelligence artificielle et des arts visuels, créant en 1972 AARON, un programme informatique révolutionnaire conçu pour générer de manière autonome des peintures et des dessins. Son approche novatrice mêlant créativité computationnelle et art traditionnel lui valut une renommée internationale, avec des œuvres présentées dans de nombreuses expositions au sein de musées prestigieux à travers le monde. En reconnaissance de ses contributions, Cohen reçut de multiples distinctions au cours de sa carrière.

Né au Royaume-Uni en 1928, Cohen s’installa aux États-Unis, où il partagea son expertise et sa passion pour l’art et la technologie à l’Université de Californie de 1968 jusqu’à sa retraite en 1998. Même après avoir pris sa retraite, il continua de s’impliquer activement dans le développement d’AARON, enrichissant sans cesse ses capacités et sa complexité. Le programme, initialement développé en C, fut par la suite réécrit en LISP afin de tirer parti des fonctionnalités puissantes de ce langage pour le développement de l’intelligence artificielle.

Harold Cohen en 1995

Dans les semaines précédant son décès en 2016, Cohen se lança dans un nouveau projet ambitieux avec AARON, intitulé « Fingerpainting for the 21st Century » (Peinture au doigt pour le XXIe siècle). Si, dans les premières années, il utilisait des traceurs x-y pour donner vie aux créations d’AARON, il mit au point dans les années 1990 une série de machines de peinture numérique. Cette évolution continue du médium le conduisit à utiliser des imprimantes à jet d’encre, puis des écrans tactiles dans son dernier projet, cherchant toujours à fusionner technologie et essence tactile de la peinture.

OzoBot n’aime pas la complexité

Ozobot est un petit robot éducatif conçu pour initier les enfants (et les débutants en général) à :

  • la programmation,
  • la robotique,
  • la pensée logique,
  • et la résolution de problèmes.

Le robot est de petite taille ( environ 2,5 cm de diamètre) et grâce à son capteur optique intégré il peut suivre des lignes tracées au feutre noir ou en couleur sur du papier. Par exemple, des codes-couleurs rouge + vert sur le chemin instruisent le robot d’accélérer, d’autres codes se réfèrent à un changement de direction, un arrêt temporaire, l’émission d’une mélodie etc.

Le développement d’OzoBot a démarré en 2012. Un premier prototype a été dévoilé à la Consumer Electronics Show (CES) de Las Vegas en janvier 2014. Le lancement commercial a eu lieu en automne 2014 au prix initial d’environ 60 US $.

J’avais montré à mes petits-enfants comment tracer un parcours sur une feuille avec un feutre noir, incluant des rectangles colorés, pour programmer le petit robot OzoBot. Mes exemples de circuits sont présentés en haut de la figure à gauche ci-après. Les parcours tracés par mes petits-enfants sont affichés en bas. Le petit robot à perdu sa tête en circulant dans les escaliers, loopings et courbes dessinés. Décidément les enfants aiment la complexité.

Détection de Covid-19 par IA

En juin 2020, le LIST (Luxembourg Institute of Science and Technologie) avait démarré un projet de détection de Covid-19 par une analyse de la toux et de la voix, en collaboration avec l’université du Luxembourg et avec le LIH (Luxembourg Institute of Health). L’objectif du projet, appelé CDCVA, consistait à développer un diagnostic à distance pour les professionnels de santé, tout en minimisant les risques liés aux contacts physiques entre le personnel et les patients. Pour le développement du système de détection de signatures vocales propres à la COVID-19, les chercheurs collectaient un large ensemble de données d’enregistrements de voix et de toux. Ces données étaient traitées alors pour éliminer tout bruit parasitaire et pour les analyser par des méthodes avancées d’apprentissage automatique IA.

Le projet a été financé par le FNR (Fonds National de la Recherche) et coordonné par Muhannad Ismael, chercheur syrien au LIST. Les résultats ont été publiés fin 2021 dans le journal scientifique Computers in Biology and Medicine.

Les Jeunes Explorateurs

J’ai commencé le nouvel an 2024 avec la création d’un livre illustré avec l’assistance de l’intelligence artificielle, dédié à mes petits-enfants.

L’inspiration de créer un livre d’aventures pour les jeunes, moyennant des outils d’intelligence artificielle, m’est venue fin février 2023, lorsque Thierry Labro, rédacteur en chef de Paperjam, a publié son roman futuriste Ils ont tué mon avatar !, conçu en une heure par ChatGPT et illustré par Dall-E. À cette époque, l’intelligence artificielle, bien qu’avancée, ne permettait pas encore de créer des images en haute résolution ou de rédiger de longs textes de manière cohérente.

LetzAI

L’été 2023 a marqué un tournant avec la présentation de LetzAI, un générateur d’images luxembourgeois révolutionnaire, basé sur l’intelligence artificielle. Ce progrès majeur permettait pour la première fois d’entraîner un modèle de manière fiable et aisée avec ses propres personnages, pour produire ensuite des illustrations fidèles et harmonieuses.

Début septembre 2023, j’ai découvert LetzAI pendant mon petit déjeuner, lors de la lecture de l’article Hier wird der Großherzog zu Iron Man dans le Luxemburger Wort. Les jours suivants, presque toute la presse présentait le projet. Dans la suite, les média continuaient de parler de LetzAI. J’ai profité de l’offre Early Access de LetzAI et j’étais un des premiers usagers de la plateforme IA générative luxembourgeoise en dehors de l’équipe de développement.

Mi-novembre 2023, la technique était donc prête pour concrétiser mon rêve et pour procéder à la conception d’un livre d’aventures pour mes petits-enfants, avec l’aide de ChatGPT-4 et de LetzAI.

Concept initial de mon livre

Au début, j’avais esquissé un concept sophistiqué. Les 5 enfants, 2 filles et 3 garçons, parmi eux des jumeaux, étaient accompagnés par leurs animaux de compagnie : le lapin Floppy, le poisson rouge Blublu, le cochon d’Inde Caramel, le caméléon Léon et le coq Cocorico. L’illustration qui suit montre les protagonistes imaginées.

Le voyage aurait du se dérouler comme une grande aventure, parsemée d’imprévus et de complications.

Faiblesses des premiers modèles d’IA générative

Mais fin 2023, j’ai rapidement constaté que des scénarios complexes embrouillaient ChatGPT et ne permettaient pas de créer des récits cohérents dans une même session. J’avais par exemple imaginé qu’un des acteurs se cassait une jambe lors d’un saut en parachute en Indonésie et devait être rapatrié par Luxembourg Air Rescue. J’avais prévu d’autres complications et incidents, mais c’était trop fastidieux de demander en permanence à ChatGPT des modifications des récits générés, respectivement de procéder à des corrections manuelles.

Au niveau des illustrations, c’était pire. Je n’ai pas réussi à générer des images correctes avec tous les personnages et les animaux de compagnie : par exemple les enfants avaient des têtes de caméléon ou des jambes de coq. J’ai noté en outre des incohérences avec les habits et les lunettes des enfants, des confusions au niveau de la couleur des cheveux et des yeux, des variations des tailles des enfants, et ainsi de suite.

À côté de LetzAI, j’ai essayé d’autres applications de génération d’images comme DALL*E3, Stable Diffusion ou Midjourney, mais aucun modèle permettait de générer des groupes de plusieurs personnages avec la cohérence voulue.

Pour tenir compte des limitations de l’intelligence artificielle fin 2023, je me suis résigné à simplifier mon script initial.