# Wat is lokale AI en waarom zou je het gebruiken?

Lokale AI is kunstmatige intelligentie die volledig op je eigen computer of server draait, zonder dat je gegevens naar de cloud stuurt. Waar diensten zoals ChatGPT of Gemini je vragen naar de servers van Google of OpenAI sturen, blijft bij lokale AI alles binnen je eigen apparaat. Dat klinkt technisch, maar het is inmiddels verrassend toegankelijk geworden.

[[TOC]]

## Wat is lokale AI precies?

Een taalmodel is een bestand met miljarden getallen, ook wel parameters genoemd, dat geleerd heeft hoe taal werkt. Bij cloud-AI staat dat bestand op een server van een groot bedrijf. Bij lokale AI download je het model een keer en draait het daarna op je eigen processor of grafische kaart.

Je hebt drie dingen nodig: een model (bijvoorbeeld Llama, Gemma, Qwen of Mistral), software die het model draait (zoals Ollama of LM Studio), en voldoende geheugen. Een klein model van een paar miljard parameters past al op een gewone laptop, terwijl grotere modellen een stevige videokaart of een Apple Silicon Mac vragen.

:::info title="Parameters in het kort"
Hoe meer parameters een model heeft, hoe slimmer het meestal is, maar hoe meer geheugen het kost. Een model van 4 tot 8 miljard parameters (vaak geschreven als 4B of 7B) heeft grofweg 6 tot 8 GB geheugen nodig. Een model van 27 tot 30 miljard parameters vraagt al snel 20 GB of meer, en de grootste modellen van 70 miljard parameters draaien pas comfortabel vanaf zo'n 48 GB.
:::

## Waarom zou je lokale AI gebruiken?

De belangrijkste reden is controle over je data. Alles wat je intypt blijft op je eigen apparaat. Voor advocaten, artsen, accountants of bedrijven met gevoelige klantgegevens is dat een groot verschil. Je hoeft niet te vertrouwen op de privacyvoorwaarden van een externe partij, want er gaat simpelweg niets weg.

Daarnaast betaal je geen kosten per vraag. Zodra je het model hebt gedownload, is elk gesprek gratis. Voor wie de hele dag met AI werkt, kan dat flink schelen. En je blijft werken zonder internet, wat handig is in de trein, op locatie of bij een storing.

:::tip title="Begin klein"
Download eerst een model van 3 tot 8 miljard parameters en kijk of de kwaliteit voor jouw werk voldoende is. Veel mensen verwachten direct het niveau van de grootste cloud-modellen, maar voor samenvatten, vertalen en eenvoudige vragen volstaan kleine modellen prima.
:::

## Hoe werkt het in de praktijk?

In de praktijk installeer je een tool, download je een model en typ je je vraag. De rest gebeurt automatisch. Hieronder zie je het hele proces, van installatie tot je eerste antwoord.

:::howto title="Van installatie tot eerste antwoord"
1. **Tool installeren**: zet `Ollama` of `LM Studio` op je computer.
2. **Model downloaden**: haal een model binnen, bijvoorbeeld Llama 4, Gemma 4 of Qwen3.
3. **Vraag stellen**: typ je vraag in de chat of via de terminal.
4. **Antwoord lokaal**: het model rekent op je eigen hardware en geeft direct antwoord.
:::

Een typische start met Ollama ziet er zo uit:

```bash
ollama run gemma4
```

Na dit commando download Ollama het model en kun je direct vragen stellen. Wil je liever een ander model, dan vervang je de naam, bijvoorbeeld `ollama run llama4:scout` of `ollama run qwen3`. Alles draait lokaal, er gaat geen byte naar internet.

## Welke modellen zijn er?

Het aanbod aan open modellen groeit snel. Een paar veelgebruikte families in 2026:

| Model | Maker | Sterk in |
| --- | --- | --- |
| Gemma 4 | Google | Algemeen gebruik, tekst en beeld, tool calling |
| Llama 4 | Meta | Brede chat- en redeneertaken |
| Qwen3 | Alibaba | Meertaligheid en programmeren |
| Mistral | Mistral AI | Efficiënt draaien op bescheiden hardware |
| DeepSeek-R1 | DeepSeek | Redeneren en wiskunde |

Welke voor jou het beste werkt, hangt af van je hardware en je taak. Probeer er gerust een paar uit, want wisselen kost alleen een download.

## Wanneer is cloud-AI toch beter?

Lokale AI is niet altijd de beste keuze. De allergrootste en slimste modellen, zoals de nieuwste versies van Gemini of GPT, draaien alleen in de cloud omdat ze te zwaar zijn voor gewone hardware. Heb je topkwaliteit nodig voor complexe redeneertaken, dan win je vaak met cloud-AI.

Ook als je geen krachtige computer hebt, kan lokale AI traag aanvoelen. Een model dat in de cloud in twee seconden antwoordt, kan op een oude laptop een minuut duren.

:::warn title="Lokaal vervangt niet alles"
Lokale AI vervangt niet automatisch je cloud-tools. Bekijk per taak wat je nodig hebt. Voor gevoelige data en eenvoudige taken is lokaal ideaal, voor zware redeneertaken blijft de cloud vaak beter.
:::

## Lokale AI binnen Google Workspace

Werk je veel in Google Workspace, dan kun je lokale AI inzetten als aanvulling. Denk aan het lokaal samenvatten van documenten voordat je ze deelt, of het verwerken van gevoelige notities die niet naar [[gemini-workspace|Gemini in Workspace]] mogen. Zo combineer je het beste van twee werelden.

:::faq
### Heb ik een dure computer nodig voor lokale AI?
Nee, een moderne laptop met 16 GB geheugen draait al prima kleine modellen. Voor grotere modellen helpt een videokaart of een Apple Silicon Mac.

### Is lokale AI gratis?
De software en de meeste modellen zijn gratis te downloaden. Je betaalt alleen de stroom en de eenmalige aanschaf van hardware.

### Is lokale AI net zo slim als ChatGPT?
Kleine lokale modellen halen niet het niveau van de grootste cloud-modellen, maar voor veel dagelijkse taken zijn ze ruim voldoende.

### Kan ik lokale AI offline gebruiken?
Ja, zodra je het model hebt gedownload werkt alles zonder internet.

### Welk model kan ik het beste als eerste proberen?
Een klein, breed inzetbaar model zoals Gemma 4 of Llama 4 in de kleinste variant is een goede start. Werk je veel in andere talen of code, dan is Qwen3 een sterke keuze.

### Hoeveel geheugen heb ik nodig?
Reken globaal op ongeveer 6 tot 8 GB voor een model van 4 tot 8 miljard parameters, en op 20 GB of meer voor de zwaardere modellen.
:::

Lokale AI is volwassen geworden en ligt binnen handbereik van iedereen die zijn data privé wil houden. Lees verder over [[ollama-installeren-macos|Ollama installeren op macOS]] of [[lokale-ai-vs-cloud-ai|de vergelijking tussen lokaal en cloud]] om de volgende stap te zetten.