Aux premiers jours de l'IA, la recherche de pointe était enfermée derrière des laboratoires corporatifs. Aujourd'hui, les outils d'IA les plus transformateurs sont open-source — librement disponibles pour tous.
┌──────────────────────────────────────────────────────┐
│ COUCHE APPLICATION │
│ LangChain · LlamaIndex · Haystack · Streamlit │
├──────────────────────────────────────────────────────┤
│ COUCHE MODÈLE │
│ Llama · Mistral · Stable Diffusion · Whisper │
├──────────────────────────────────────────────────────┤
│ COUCHE PLATEFORME │
│ Hugging Face · Ollama · vLLM · TGI │
├──────────────────────────────────────────────────────┤
│ COUCHE FRAMEWORK │
│ PyTorch · TensorFlow · JAX · scikit-learn │
├──────────────────────────────────────────────────────┤
│ COUCHE DONNÉES │
│ Common Crawl · The Pile · LAION · RedPajama │
└──────────────────────────────────────────────────────┘
import torch
import torch.nn as nn
class ClassificateurSimple(nn.Module):
def __init__(self, taille_entree, nb_classes):
super().__init__()
self.couches = nn.Sequential(
nn.Linear(taille_entree, 128),
nn.ReLU(),
nn.Dropout(0.3),
nn.Linear(128, 64),
nn.ReLU(),
nn.Linear(64, nb_classes),
)
def forward(self, x):
return self.couches(x)
from transformers import pipeline
# Analyse de sentiment en 3 lignes
classificateur = pipeline("sentiment-analysis")
resultat = classificateur("L'IA open-source transforme le monde !")
print(resultat)
Ressources clés : Model Hub (500 000+ modèles), Datasets (100 000+ jeux de données), Spaces (hébergement gratuit)
Ces frameworks aident à construire des applications par-dessus les modèles de langage : systèmes Q&R, recherche sémantique, chatbots documentaires.
Hugging Face était à l'origine une entreprise de chatbot pour adolescents ! Ils ont pivoté pour devenir la plateforme centrale pour l'IA open-source. Aujourd'hui, ils sont valorisés à plus de 4,5 milliards de dollars.
# Avec Ollama
ollama run llama3
ollama run mistral
Open-weight vs open-source : Beaucoup de modèles « ouverts » publient les poids entraînés mais pas les données d'entraînement. C'est techniquement « open-weight » plutôt que véritablement open-source.
Niveau 1 — Utilisateur : Utilisez les outils, signalez les bugs, partagez les projets utiles
Niveau 2 — Documentation : Corrigez les fautes, améliorez les exemples, traduisez
Niveau 3 — Code : Corrigez de petits bugs, ajoutez des tests, améliorez les messages d'erreur
Niveau 4 — Fonctionnalités : Implémentez de nouvelles fonctionnalités, contribuez des poids de modèles
Les contributions open-source les plus impactantes ne sont souvent pas du code. Une documentation claire, des réponses utiles sur les forums et des tutoriels traduits abaissent la barrière pour des milliers de nouveaux utilisateurs.
Licence Usage Commercial Modifier Distribuer
───────────── ──────────────── ──────── ──────────
MIT ✅ Oui ✅ Oui ✅ Oui
Apache 2.0 ✅ Oui ✅ Oui ✅ Oui (+ brevets)
GPL ✅ Oui* ✅ Oui ✅ Oui* (copyleft)
Licence Llama ✅ Oui** ✅ Oui ✅ Oui**
* Les œuvres dérivées GPL doivent aussi être GPL
** Restriction au-dessus de 700M d'utilisateurs actifs mensuels
Vérifiez toujours la licence avant de construire un produit sur un modèle open-source. Certains modèles qui semblent « ouverts » ont des restrictions d'usage commercial.
Exemple : Bot de Support Client Alimenté par l'IA
──────────────────────────────────────────────────
Frontend : Next.js + Tailwind CSS (open-source)
API : FastAPI (open-source)
Orchestration : LangChain (open-source)
LLM : Llama 3 via Ollama (open-source)
Connaissance : pgvector sur PostgreSQL (open-source)
Surveillance : Langfuse (open-source)
Déploiement : Docker + Kubernetes (open-source)
Coût total de licence : 0 €
Pour l'ouvert : Transparence, démocratisation, innovation plus rapide, souveraineté
Pour le fermé : Contrôle de sécurité, qualité concentrée, responsabilité claire
Le terrain d'entente émergent est un spectre d'ouverture, pas un choix binaire.
L'Open Source Initiative (OSI) affirme que l'IA véritablement open-source doit inclure les données d'entraînement, le code d'entraînement et les poids du modèle. Même Llama de Meta serait classé comme « open-weight » par cette définition stricte.
Dans la dernière leçon, nous regarderons vers le futur de l'IA — de l'AGI aux agents autonomes, en passant par la régulation et les parcours de carrière. 🌲