Dans la leçon précédente, nous avons appris que l'IA est un logiciel qui apprend de l'expérience. Mais comment cela fonctionne-t-il concrètement ? Comment une machine passe-t-elle de zéro connaissance à la reconnaissance de votre visage ou à la recommandation de votre prochaine chanson préférée ?
Explorons le secret derrière les logiciels intelligents.
Tout système de machine learning suit le même cycle de base :
C'est comme apprendre à cuisiner. Vous suivez des recettes (données), vous repérez ce qui marche (schémas), vous essayez vos propres variantes (prédictions), vous goûtez le résultat (retour), et vous ajustez l'assaisonnement la prochaine fois (amélioration).
L'IA de Google pour détecter les emails indésirables traite plus de 10 millions de messages suspects chaque minute. Chaque fois qu'un utilisateur marque un message comme « spam » ou « non spam », le système apprend et met à jour ses schémas - devenant plus intelligent à chaque clic.
Le type de machine learning le plus courant s'appelle l'apprentissage supervisé. Il fonctionne exactement comme étudier avec un professeur qui vous donne les réponses.
Voici comment ça marche :
Sign in to join the discussion
Imaginez que vous montriez à la machine 100 000 emails. Chacun est étiqueté soit « spam » soit « non spam » par des humains.
La machine repère des schémas :
Après avoir étudié suffisamment d'exemples, elle peut examiner un tout nouvel email qu'elle n'a jamais vu et prédire s'il s'agit de spam - sans que personne n'ait écrit de règles spécifiques.
L'apprentissage supervisé dépend de données étiquetées - quelqu'un doit fournir les bonnes réponses pour que la machine puisse apprendre. Qui, selon vous, étiquette toutes ces données ? Dans de nombreux cas, ce sont des milliers de travailleurs humains qui annotent soigneusement des images, du texte et de l'audio. L'« intelligence » de l'IA commence souvent par un énorme effort humain.
Que signifie « apprentissage supervisé » en machine learning ?
Et si vous n'aviez pas les réponses ? Si vous aviez simplement un gros tas de données et que vous vouliez que la machine trouve des schémas intéressants toute seule ?
C'est l'apprentissage non supervisé. Pas de professeur, pas d'étiquettes, pas de bonnes réponses. La machine explore les données et regroupe les éléments similaires.
Imaginez qu'un supermarché dispose des données d'achat de millions de clients, mais sans étiquettes. L'IA analyse les données et découvre des groupes naturels :
Personne n'a dit à la machine que ces groupes existaient. Elle les a trouvés toute seule en repérant des schémas dans les données d'achats. Le supermarché peut maintenant envoyer à chaque groupe des offres pertinentes.
En quoi l'apprentissage non supervisé diffère-t-il de l'apprentissage supervisé ?
Le troisième type est l'apprentissage par renforcement, et il fonctionne beaucoup comme le dressage d'un chien.
Quand un chien s'assoit sur commande, vous lui donnez une friandise (récompense). Quand il mâche votre chaussure, vous dites « non » (pénalité). Avec le temps, le chien apprend quels comportements mènent à des friandises et lesquels mènent à des ennuis.
L'apprentissage par renforcement fonctionne de la même manière :
AlphaGo de Google a appris à jouer au jeu de Go en jouant des millions de parties contre lui-même. Chaque victoire était une récompense ; chaque défaite une pénalité. Il a essayé des stratégies audacieuses, appris de ses échecs, et est finalement devenu meilleur que tout joueur humain de l'histoire.
La même approche est utilisée pour entraîner des robots à marcher, apprendre aux voitures autonomes à naviguer, et optimiser la consommation d'énergie dans les centres de données.
AlphaGo a joué plus de 30 millions de parties contre lui-même pendant son entraînement. Un humain jouant une partie par jour aurait besoin d'environ 82 000 ans pour jouer autant de parties. L'IA a condensé toute cette expérience en quelques semaines seulement.
| Type | Étiquettes ? | Analogie | Exemple | |------|-------------|----------|---------| | Supervisé | Oui | Étudier avec un corrigé | Filtres anti-spam, diagnostic médical | | Non supervisé | Non | Ranger un tiroir en désordre | Regroupement de clients, détection d'anomalies | | Par renforcement | Non (utilise des récompenses) | Dresser un chien avec des friandises | IA de jeu, robotique, voitures autonomes |
Pensez à comment vous avez appris à faire du vélo. Était-ce supervisé (quelqu'un vous a dit exactement quoi faire), non supervisé (vous avez trouvé l'équilibre tout seul), ou par renforcement (vous êtes tombé, vous vous êtes ajusté et vous avez réessayé) ? La plupart des apprentissages humains sont en fait un mélange des trois. Les styles d'apprentissage de l'IA sont inspirés de notre propre façon d'apprendre.
Quel type de machine learning ressemble le plus au dressage d'un animal avec des friandises et des ordres ?
Pas besoin d'être mathématicien ou programmeur pour comprendre le machine learning. Au fond, il s'agit d'apprendre de l'expérience - quelque chose que chaque être humain fait naturellement depuis le jour de sa naissance. L'IA fait simplement la même chose avec des données au lieu d'expériences de vie.
Maintenant que vous comprenez comment les machines apprennent, la prochaine leçon révèle l'IA qui se cache déjà dans votre poche. Votre smartphone regorge de fonctionnalités intelligentes - partons à leur découverte.