AI EducademyAIEducademy
Programma'sLabBlogOver ons
Inloggen
AI EducademyAIEducademy

Gratis AI-onderwijs voor iedereen, in elke taal.

Leren

  • Programma's
  • Lessen
  • Lab
  • Dashboard
  • Over ons

Community

  • GitHub
  • Bijdragen
  • Gedragscode

Ondersteuning

  • Koop een Koffie โ˜•

Gratis AI-onderwijs voor iedereen

MIT Licentie โ€” Open Source

Programsโ€บ๐ŸŒฒ AI Forestโ€บLessonsโ€บOpen-Source AI โ€” De Tools, Modellen en Gemeenschappen die de Toekomst Vormen
๐ŸŒ
AI Forest โ€ข Gevorderdโฑ๏ธ 40 min leestijd

Open-Source AI โ€” De Tools, Modellen en Gemeenschappen die de Toekomst Vormen

Waarom Open-Source Belangrijk is voor AI ๐ŸŒ

In de vroege dagen van AI was baanbrekend onderzoek opgesloten achter bedrijfslabs. Vandaag zijn de meest transformatieve AI-tools open-source.

  • Transparantie: Je kunt precies inspecteren hoe een model werkt
  • Reproduceerbaarheid: Iedereen kan onderzoeksclaims verifiรซren
  • Innovatiesnelheid: Duizenden bijdragers verbeteren tools sneller
  • Toegankelijkheid: Een student in Lagos heeft dezelfde tools als een onderzoeker in Stanford
Een wereldbol omringd door onderling verbonden open-source AI-projectlogo's
Open-source AI verbindt onderzoekers, ontwikkelaars en leerlingen wereldwijd.

Het Open-Source AI-Landschap ๐Ÿ—บ๏ธ

โ”Œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”
โ”‚                  APPLICATIELAAG                        โ”‚
โ”‚  LangChain ยท LlamaIndex ยท Haystack ยท Streamlit        โ”‚
โ”œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ค
โ”‚                    MODELLAAG                           โ”‚
โ”‚  Llama ยท Mistral ยท Stable Diffusion ยท Whisper          โ”‚
โ”œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ค
โ”‚                 PLATFORMLAAG                           โ”‚
โ”‚  Hugging Face ยท Ollama ยท vLLM ยท TGI                    โ”‚
โ”œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ค
โ”‚                 FRAMEWORKLAAG                          โ”‚
โ”‚  PyTorch ยท TensorFlow ยท JAX ยท scikit-learn             โ”‚
โ”œโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ค
โ”‚                    DATALAAG                            โ”‚
โ”‚  Common Crawl ยท The Pile ยท LAION ยท RedPajama           โ”‚
โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜

Belangrijke Open-Source Frameworks ๐Ÿ”ง

PyTorch โ€” De favoriet van onderzoekers

import torch.nn as nn

class EenvoudigeClassificator(nn.Module):
    def __init__(self, invoer_grootte, aantal_klassen):
        super().__init__()
        self.lagen = nn.Sequential(
            nn.Linear(invoer_grootte, 128),
            nn.ReLU(),
            nn.Linear(128, aantal_klassen),
        )

    def forward(self, x):
        return self.lagen(x)

Hugging Face โ€” De GitHub van AI

from transformers import pipeline

classificator = pipeline("sentiment-analysis")
resultaat = classificator("Open-source AI transformeert de wereld!")
print(resultaat)

LangChain en LlamaIndex

Frameworks om applicaties te bouwen bovenop taalmodellen: Q&A-systemen, semantisch zoeken, documentchatbots.

๐Ÿคฏ

Hugging Face was oorspronkelijk een chatbotbedrijf voor tieners! Ze pivoteerden naar het centrale platform voor open-source AI. Vandaag zijn ze meer dan $4,5 miljard waard.


Open-Source Modellen ๐Ÿฆ™

Llama (Meta)

  • Llama 2: Open licentie, commercieel gebruik toegestaan
  • Llama 3: Grote kwaliteitssprong, 8B en 70B varianten

Mistral

  • Mistral 7B: Overtrof Llama 2 13B ondanks de halve grootte
  • Mixtral 8x7B: Mixture-of-experts architectuur

Stable Diffusion

  • Lokaal uitvoerbaar op een consumenten-GPU
  • Duizenden community fine-tunes en extensies
# Met Ollama โ€” de makkelijkste manier om modellen lokaal te draaien
ollama run llama3
ollama run mistral
๐Ÿ’ก

Open-weight vs open-source: Veel "open" modellen publiceren de getrainde gewichten maar niet de trainingsdata. Dit is technisch "open-weight" in plaats van echt open-source.


Bijdragen aan Open-Source AI ๐Ÿค

Niveau 1 โ€” Gebruiker: Gebruik tools, meld bugs, deel nuttige projecten

Niveau 2 โ€” Documentatie: Verbeter voorbeelden, vertaal documentatie

Niveau 3 โ€” Code: Fix kleine bugs, voeg tests toe

Niveau 4 โ€” Features: Implementeer nieuwe functies, draag modelgewichten bij

๐Ÿค”
Think about it:

De meest impactvolle open-source bijdragen zijn vaak helemaal geen code. Duidelijke documentatie en vertaalde tutorials verlagen de drempel voor duizenden nieuwe gebruikers.


AI-Licenties ๐Ÿ“œ

Licentie         Commercieel    Wijzigen    Distribueren
โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€    โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€     โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€    โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
MIT              โœ… Ja          โœ… Ja       โœ… Ja
Apache 2.0       โœ… Ja          โœ… Ja       โœ… Ja (+ patenten)
GPL              โœ… Ja*         โœ… Ja       โœ… Ja* (copyleft)
Llama Licentie   โœ… Ja**        โœ… Ja       โœ… Ja**

* GPL vereist dat afgeleide werken ook GPL zijn
** Beperking boven 700M maandelijkse actieve gebruikers

Bouwen met Open-Source ๐Ÿ—๏ธ

Voorbeeld: AI-Aangedreven Klantenservicebot

Frontend:       Next.js + Tailwind CSS (open-source)
API:            FastAPI (open-source)
Orkestratie:    LangChain (open-source)
LLM:            Llama 3 via Ollama (open-source)
Kennis:         pgvector op PostgreSQL (open-source)
Monitoring:     Langfuse (open-source)
Implementatie:  Docker + Kubernetes (open-source)

Totale licentiekosten: โ‚ฌ0

Het Open vs Gesloten Debat โš–๏ธ

Voor open: Transparantie, democratisering, snellere innovatie, soevereiniteit

Voor gesloten: Veiligheidscontrole, geconcentreerde kwaliteit, duidelijke verantwoordelijkheid

De industrie beweegt naar een spectrum in plaats van een binaire keuze.


Snelle Samenvatting ๐ŸŽฏ

  1. Open-source AI heeft de toegang gedemocratiseerd tot geavanceerde tools en modellen
  2. PyTorch, Hugging Face, LangChain en LlamaIndex vormen de ruggengraat
  3. Open modellen bieden krachtige alternatieven voor propriรซtaire API's
  4. Bijdragen begint met tools gebruiken en documentatie verbeteren
  5. Licenties zijn belangrijk โ€” controleer altijd aangepaste AI-licenties
  6. Volledige AI-stacks kunnen geheel uit open-source worden opgebouwd
  7. Het open vs gesloten debat evolueert naar een spectrum

Wat Komt Er Nu? ๐Ÿ”ฎ

In de laatste les kijken we naar de toekomst van AI. ๐ŸŒฒ

Lesson 2 of 30 of 3 completed
โ†AI-producten Bouwen โ€” Van Prototype tot ProductieDe Toekomst van AI โ€” Wat Komt Er en Waar Pas Jij?โ†’