In de vorige les leerden we dat AI software is die leert van ervaring. Maar hoe werkt dat eigenlijk? Hoe gaat een machine van niets weten naar het herkennen van je gezicht of het aanbevelen van je volgende favoriete nummer?
Laten we het geheim achter slimme software ontdekken.
Elk machine learning-systeem volgt dezelfde basiscyclus:
Zie het als leren koken. Je volgt recepten (data), merkt op wat werkt (patronen), probeert je eigen variaties (voorspellingen), proeft het resultaat (feedback) en past de kruiden aan voor de volgende keer (verbetering).
Google's AI voor het detecteren van spam-e-mail verwerkt elke minuut meer dan 10 miljoen verdachte berichten. Elke keer dat een gebruiker iets markeert als "spam" of "geen spam" leert het systeem en werkt het zijn patronen bij - het wordt slimmer bij elke klik.
Het meest voorkomende type machine learning heet supervised learning. Het werkt precies zoals studeren met een leraar die je de antwoorden geeft.
Zo werkt het:
Stel je voor dat je de machine 100.000 e-mails laat zien. Elk ervan is door mensen gelabeld als of .
Sign in to join the discussion
De machine ontdekt patronen:
Na genoeg voorbeelden bestudeerd te hebben, kan het naar een gloednieuwe e-mail kijken die het nog nooit heeft gezien en voorspellen of het spam is - zonder dat iemand specifieke regels heeft geschreven.
Supervised learning is afhankelijk van gelabelde data - iemand moet de juiste antwoorden geven zodat de machine ervan kan leren. Wie labelt al die data volgens jou? In veel gevallen zijn het duizenden menselijke medewerkers die zorgvuldig afbeeldingen, tekst en audio taggen. De "intelligentie" van AI begint vaak met heel veel menselijk werk.
Wat betekent 'supervised learning' in machine learning?
Wat als je de antwoorden niet hebt? Wat als je gewoon een grote berg data hebt en je wilt dat de machine zelf interessante patronen vindt?
Dat is unsupervised learning. Er is geen leraar, geen labels, geen juiste antwoorden. De machine verkent de data en groepeert vergelijkbare dingen bij elkaar.
Stel je voor dat een supermarkt aankoopdata heeft van miljoenen klanten, maar geen labels. De AI analyseert de data en ontdekt natuurlijke groepen:
Niemand heeft de machine verteld dat deze groepen bestonden. Het heeft ze zelf gevonden door patronen in de aankoopdata te herkennen. De supermarkt kan nu elke groep relevante aanbiedingen sturen.
Hoe verschilt unsupervised learning van supervised learning?
Het derde type is reinforcement learning, en het werkt veel als het trainen van een hond.
Wanneer een hond op commando zit, geef je hem een snoepje (beloning). Wanneer hij op je schoen kauwt, zeg je "nee" (straf). Na verloop van tijd leert de hond welk gedrag tot snoepjes leidt en welk tot problemen.
Reinforcement learning werkt op dezelfde manier:
Google's AlphaGo leerde het oude bordspel Go door miljoenen partijen tegen zichzelf te spelen. Elke overwinning was een beloning; elk verlies een straf. Het probeerde wilde strategieën, leerde van mislukkingen en werd uiteindelijk beter dan elke menselijke speler in de geschiedenis.
Dezelfde aanpak wordt gebruikt om robots te leren lopen, zelfrijdende auto's te leren navigeren en het energieverbruik in datacenters te optimaliseren.
AlphaGo speelde meer dan 30 miljoen partijen tegen zichzelf tijdens de training. Een mens die één partij per dag speelt, zou ongeveer 82.000 jaar nodig hebben om zoveel partijen te spelen. De AI comprimeerde al die ervaring in slechts een paar weken.
| Type | Labels? | Vergelijking | Voorbeeld | |------|---------|-------------|-----------| | Supervised | Ja | Studeren met een antwoordenblad | Spamfilters, medische diagnose | | Unsupervised | Nee | Een rommelige la sorteren | Klantgroepen, afwijkingsdetectie | | Reinforcement | Nee (gebruikt beloningen) | Een hond trainen met snoepjes | Game-AI, robotica, zelfrijdende auto's |
Denk eens na over hoe je leerde fietsen. Was het supervised (iemand vertelde je precies wat je moest doen), unsupervised (je ontdekte zelf je balans), of reinforcement (je viel, paste aan en probeerde opnieuw)? Het meeste menselijke leren is eigenlijk een mix van alle drie. AI-leerstijlen zijn geïnspireerd op hoe wij zelf leren.
Welk type machine learning lijkt het meest op het trainen van een huisdier met snoepjes en commando's?
Je hoeft geen wiskundige of programmeur te zijn om machine learning te begrijpen. In de kern gaat het om leren van ervaring - iets wat elk mens van nature doet vanaf de dag dat ze geboren worden. AI doet het alleen met data in plaats van levenservaringen.
Nu je begrijpt hoe machines leren, onthult de volgende les de AI die al in je zak zit. Je smartphone zit vol met intelligente functies - laten we ze ontdekken.