Mémo : 20 termes IA essentiels

1

LLM (Large Language Model)

Grand modèle de langage : un réseau de neurones entraîné sur des milliards de textes pour comprendre et générer du langage naturel.

GPT-4 (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta).

2

Token

Unité minimale de texte traitée par un LLM. Un token correspond approximativement à un mot court ou à 3-4 caractères en français. Les modèles facturent à l'usage en tokens.

Le mot « bonjour » = 1 token ; « intelligence artificielle » = 3-4 tokens.

3

Paramètres

Les "réglages internes" d'un modèle, ajustés pendant l'entraînement. Plus un modèle a de paramètres, plus il est potentiellement puissant — et coûteux.

GPT-4 = estimé à ~1 800 milliards de paramètres. Llama 3 8B = 8 milliards.

4

Transformer

Architecture neuronale publiée par Google en 2017 (article « Attention Is All You Need »), à la base de presque tous les LLMs modernes. Clé : le mécanisme d'attention qui permet au modèle de peser l'importance de chaque mot par rapport aux autres.

5

Fenêtre de contexte (Context window)

Quantité maximale de texte (en tokens) qu'un modèle peut traiter en une seule fois — incluant la question et la réponse. Au-delà de cette fenêtre, le modèle « oublie » le début de la conversation.

Claude 3.5 Sonnet : 200 000 tokens ≈ 150 000 mots ≈ un roman entier.

6

Prompt

L'instruction ou la question que tu donnes à une IA pour obtenir une réponse. La qualité du prompt influence directement la qualité de la réponse.

« Rédige un email professionnel pour refuser une réunion, en 3 lignes. »

7

Hallucination

Quand un LLM invente une information fausse mais la présente avec confiance, comme si c'était un fait. Les LLMs génèrent du texte statistiquement probable, pas forcément vrai.

Un modèle qui cite une jurisprudence inventée ou une étude scientifique inexistante.

8

Temperature

Paramètre qui contrôle la variabilité des réponses. À 0 : réponses très prévisibles et répétables. À 1 ou plus : réponses plus créatives, mais parfois moins cohérentes.

Analyse juridique → temperature 0. Écriture créative → temperature 0.8+.

9

Zero-shot / Few-shot

Zero-shot : capacité d'un modèle à réaliser une tâche sans exemple donné dans le prompt. Few-shot : on fournit 2-3 exemples pour guider le modèle vers le format attendu.

Few-shot : « Voici 2 exemples de titres. Crée-en 10 sur le même modèle. »

10

Inférence

La phase d'utilisation d'un modèle déjà entraîné pour générer des réponses. Distinct de l'entraînement (apprentissage). C'est ce qui se passe chaque fois que tu poses une question à ChatGPT.

11

Embedding

Représentation numérique d'un texte, d'une image ou d'un son sous forme d'un vecteur de nombres. Les textes sémantiquement proches ont des vecteurs proches dans l'espace mathématique.

« Chien » et « chiot » auront des embeddings proches. « Chien » et « calcul différentiel » en auront de très différents.

12

RAG (Retrieval-Augmented Generation)

Technique qui connecte un LLM à une base de connaissances externe. Avant de répondre, le modèle récupère les documents pertinents et s'appuie dessus — ce qui réduit les hallucinations.

Un chatbot d'entreprise qui répond à partir des PDF internes de la société.

13

Fine-tuning

Réentraînement d'un modèle existant sur un jeu de données spécialisé pour l'adapter à un domaine ou un ton particulier. Plus coûteux que le prompting, mais plus précis pour des cas d'usage spécifiques.

Entraîner GPT sur des milliers de résumés médicaux pour créer un assistant médical.

14

Overfitting (Surapprentissage)

Quand un modèle apprend trop parfaitement ses données d'entraînement et perd en capacité de généralisation sur de nouvelles données inconnues.

Un modèle qui récite par cœur mais ne sait pas raisonner sur un cas nouveau.

15

API (Application Programming Interface)

Interface permettant à des logiciels de communiquer entre eux. Pour l'IA : un pont qui permet à ton application d'envoyer des questions à un modèle et de recevoir les réponses.

Utiliser l'API OpenAI pour intégrer GPT dans ton propre site ou application.

16

Multimodal

Modèle capable de traiter et de générer plusieurs types de données : texte, images, audio, vidéo. Opposé aux modèles purement textuels.

GPT-4o, Claude 3.5 Sonnet, Gemini 1.5 Pro : tous peuvent analyser des images en plus du texte.

17

Open source

Modèle dont les poids (et parfois le code d'entraînement) sont publiquement disponibles. On peut les télécharger et les faire tourner sur son propre matériel.

Llama 3 (Meta), Mistral, Gemma (Google) : gratuits et téléchargeables.

18

Diffusion

Technique d'IA générative (images, vidéos, audio) qui crée du contenu en retirant progressivement du bruit aléatoire d'un signal. Chaque étape de « débruitage » raffine l'image.

Stable Diffusion, DALL-E 2 et 3, Midjourney : tous basés sur la diffusion.

19

Agent IA

Programme autonome qui utilise un LLM pour planifier et exécuter des tâches en plusieurs étapes, en utilisant des outils (recherche web, exécution de code, lecture de fichiers) pour atteindre un objectif.

Un agent qui reçoit « trouve les 5 meilleures hôtels à Paris pour ce week-end », cherche sur le web, compare les prix et rédige un résumé.

20

Guardrails (Garde-fous)

Mécanismes de sécurité intégrés dans un modèle pour empêcher la génération de contenus dangereux, illégaux ou contraires aux valeurs définies par l'entreprise. Combinaison de filtres, de fine-tuning et d'instructions système.

Un chatbot qui refuse de donner des instructions pour fabriquer des armes ou générer du contenu illégal.

Mémo — 20 termes IA essentiels expliqués simplement