Carburant de l’IA

📌 Les données sont le carburant de l’IA

L’IA apprend à partir de données : textes, images, sons, vidéos…
Mais l’IA ne comprend que les 0 et 1. Donc, tout doit être converti dans un format binaire :

Type de donnéesFormat utilisé avant d’être traité par l’IA
TexteCodé en bytes avec des systèmes comme UTF-8
ImagesPixels avec des valeurs RGB codées en binaire
AudioÉchantillons numériques (souvent en .wav ou .mp3)
VidéoSéquence d’images + audio, souvent compressée

Sans codage binaire, l’IA n’aurait rien à analyser.

🤖  Le traitement de l’information en IA

Les modèles d’IA sont des programmes mathématiques qui traitent des suites de nombres.
Quand l’IA voit une image ou lit un texte, elle ne voit ni couleurs ni lettres, mais :

  • Des nombres représentant chaque pixel (images),
  • Des vecteurs représentant chaque mot (textes),
  • Des ondes transformées en chiffres (sons).

Et tout cela, au fond, ce sont des bits !

🧠  Apprentissage automatique (Machine Learning)

Dans le machine learning, l’IA apprend en analysant de grands ensembles de données codées numériquement.

Par exemple :

  • Pour reconnaître des chats, elle traite des milliers d’images où chaque pixel est un nombre codé en RGB.
  • Pour faire de la traduction, elle lit des textes en UTF-8, les transforme en vecteurs, puis apprend à associer des phrases.

Donc : plus le codage est clair et précis, mieux l’IA apprend.

🔄  Compression et IA

L’IA est aussi utilisée pour :

  • améliorer la compression (comme dans les nouveaux formats vidéo),
  • restaurer des fichiers abîmés (par exemple, améliorer le son ou l’image),
  • traduire ou générer du contenu (voix IA, images, textes…).

Mais tout cela dépend d’un bon codage binaire à la base.

🌐 En résumé

Élément de baseRôle dans l’IA
Bit/ByteFormat fondamental des données
UTF-8Codage des textes lus par l’IA
RGBReprésentation des images analysées par l’IA
ÉchantillonnageBase du son compris ou produit par l’IA
CompressionPrépare les données pour un traitement plus rapide

Codage de données

Résumé nombres

……

Résumé textes

……

Résumé audio/vidéo

ÉlémentExplication simple
ÉchantillonnageDécoupe du son en petits morceaux (samples)
MP3, AAC, FLACFormats audio compressés (avec ou sans perte)
FPS (images/s)Nombre d’images par seconde dans une vidéo
CodecOutil qui compresse/décompresse l’audio ou la vidéo
ConteneurFichier qui regroupe vidéo, audio, sous-titres, etc.

Conclusion générale

Tout ce que vous voyez ou entendez sur un ordinateur — texte, couleur, son, vidéo — est traduit en 0 et 1 grâce à des règles et des formats comme :

  • ASCII et UTF-8 pour le texte,
  • RGB pour les images,
  • MP3AAC pour l’audio,
  • MP4MKV pour la vidéo.

Les ordinateurs utilisent donc des langages numériques invisibles pour rendre la technologie aussi facile et fluide qu’une conversation humaine.

Codage Vidéo

Une vidéo, c’est une suite d’images (appelées images par seconde ou frames per second, fps) accompagnée de son.

Par exemple :

  • Une vidéo à 30 fps = 30 images affichées chaque seconde.
  • Chaque image est comme une photo, codée en pixels (et chaque pixel a des valeurs RGB).

a) Compression vidéo

Les vidéos brutes sont énormes. Pour les rendre plus légères, on utilise des codecs (COdeur/DECodeur) qui compressent les vidéos :

  • H.264 (ou AVC) : très courant, utilisé dans YouTube, MP4, etc.
  • H.265 (ou HEVC) : plus récent, meilleure compression.
  • VP9AV1 : codecs libres, utilisés par YouTube, Netflix, etc.

b) Conteneurs vidéo

Un fichier vidéo contient :

  • la vidéo compressée,
  • l’audio compressé,
  • parfois des sous-titres,
  • et des métadonnées (titre, durée…).

Ces éléments sont mis ensemble dans un conteneur. Exemples :

  • .mp4 (le plus courant)
  • .mkv (plus flexible)
  • .avi.mov, etc.

Codage Audio

Comment sont codés les fichiers audio ?

Le son, c’est une vibration de l’air. Pour qu’un ordinateur le comprenne, il faut transformer cette vibration en nombres.

a) Échantillonnage

Le son est enregistré en le coupant en petites tranches, appelées échantillons (en anglais : samples).

Par exemple :

  • Un CD audio utilise 44 100 échantillons par seconde (on dit : 44,1 kHz).
  • Chaque échantillon est souvent codé sur 16 bits.

Donc chaque seconde de son stéréo (2 canaux) = 44 100 × 2 × 16 bits = beaucoup de données !

b) Compression audio

Les fichiers audio bruts (non compressés) sont très gros. On utilise donc des formats compressés, qui réduisent la taille sans trop perdre de qualité :

  • MP3 : format populaire, avec perte de qualité.
  • AAC : utilisé par Apple, meilleure qualité à taille égale.
  • FLAC : compression sans perte, donc son de haute qualité.

Système binaire

Le système binaire expliqué simplement

1. C’est quoi le binaire ?

Le binaire, c’est un système qui n’utilise que deux chiffres :

  • 0
  • 1

Contrairement à notre système habituel (le décimal) qui utilise dix chiffres (de 0 à 9), le binaire ne travaille qu’avec des 0 et 1. C’est le langage que les ordinateurs comprennent.


2. Bit et Byte : les briques de base

  • Un bit (abréviation de binary digit) est la plus petite unité d’information en informatique. Il vaut soit 0, soit 1.
  • Un byte (ou octet en français) est un groupe de 8 bits. Par exemple :
    01001101 est un byte.

Pourquoi 8 bits ? Parce qu’avec 8 bits, on peut représenter 256 valeurs différentes (de 0 à 255).


3. ASCII : comment représenter du texte ?

Les ordinateurs ne comprennent pas directement les lettres comme A ou B. Ils ont besoin de traductions en chiffres.
C’est là qu’intervient ASCII (prononcé « aski »).

ASCII est un code qui associe chaque caractère à un nombre.
Par exemple :

  • A = 65
  • B = 66
  • espace = 32

En binaire, A devient donc : 01000001 (la version binaire de 65).


4. RGB : comment représenter des couleurs ?

Pour les images ou les écrans, on utilise souvent le système RGB (Rouge, Vert, Bleu).
Chaque couleur est composée de trois chiffres, chacun allant de 0 à 255 :

  • R (rouge)
  • G (vert)
  • B (bleu)

Par exemple :

  • Rouge pur = (255, 0, 0)
  • Blanc = (255, 255, 255)
  • Noir = (0, 0, 0)

Chaque valeur est aussi un byte, donc la couleur complète est codée sur 3 bytes.


5. UTF-8 : pour toutes les langues du monde

ASCII est pratique, mais il ne permet pas d’écrire des lettres accentuées ou des caractères d’autres alphabets (comme le chinois ou l’arabe).
C’est pourquoi on utilise UTF-8.

UTF-8 est un système de codage universel. Il peut représenter tous les caractères du monde (lettres, symboles, emojis…).

Il est basé sur ASCII, mais peut utiliser 1 à 4 bytes pour représenter un caractère.

Par exemple :

  • A = 1 byte (comme en ASCII)
  • é = 2 bytes
  • 😊 = 4 bytes

Résumé rapide

TermeDéfinition simple
Bit0 ou 1, plus petite unité de données
ByteGroupe de 8 bits
ASCIICode pour les lettres de base (A-Z, etc.)
RGBCode couleur avec Rouge, Vert, Bleu
UTF-8Code pour toutes les langues et symboles