# Privacychecklist voor lokale AI-implementatie

[[TOC]]

Lokale AI-modellen zijn populair omdat ze gegevens niet naar externe servers sturen. Maar "lokaal" is geen garantie voor privacy, want de implementatiekeuzes bepalen het daadwerkelijke risico. Deze checklist helpt je de juiste vragen te stellen voor je een model in productie zet.

## Wat is een lokaal LLM

Een lokaal Large Language Model (LLM) draait op je eigen hardware of in je privé-cloud, niet op de servers van een externe AI-provider. Voorbeelden zijn Ollama met Llama, LM Studio, Jan, of een zelf-gehoste deployment van Mistral of Gemma.

Voordelen:
- Geen dataverzending naar externe partijen.
- Geen afhankelijkheid van externe API-beschikbaarheid.
- Mogelijkheid om gevoelige bedrijfsinformatie in te voeren zonder dat die je netwerk verlaat.

Risico's die mensen vaak onderschatten:
- Het model zelf kan trainingsdata bevatten met privacygevoelige informatie.
- Prompts en antwoorden kunnen lokaal worden opgeslagen in een database of logbestand.
- Toegangsbeheer is volledig de verantwoordelijkheid van degene die het model implementeert.

:::info title="Lokaal is niet automatisch AVG-proof"
Dat data je server niet verlaat, betekent niet dat je aan de AVG voldoet. Toegangscontrole, bewaartermijnen en een verwerkersregister blijven nodig zodra je persoonsgegevens verwerkt.
:::

## Checklist deel 1: Modelselectie

Controleer voor elk model dat je overweegt de licentie en de herkomst.

**Licentie:**
- Is het model vrij te gebruiken voor commerciële doeleinden?
- Zijn er beperkingen op gebruik in producten of diensten, of een drempel voor grote organisaties?
- Lees de licentie altijd na bij de officiële bron, want voorwaarden veranderen per versie.

Een overzicht van populaire modellen en hun licentie (peildatum juni 2026):

| Model | Licentie | Commercieel gebruik |
| --- | --- | --- |
| Llama 4 (Meta) | Meta Llama 4 Community License | Toegestaan onder voorwaarden, met een drempel van 700 miljoen maandelijkse gebruikers waarboven een aparte licentie nodig is, plus een attributieverplichting ("Built with Llama") |
| Mistral 3 en Mistral Small 4 | Apache 2.0 | Vrij toegestaan |
| Gemma 4 (Google) | Apache 2.0 | Vrij toegestaan (oudere Gemma-versies vielen onder een eigen Google-licentie, controleer dus per versie) |

**Modelherkomst:**
- Is het model afkomstig van een bekende aanbieder, zoals Meta, Mistral, Google of Microsoft?
- Is het gedownload van een officiële bron, zoals Hugging Face of de officiële repository van de maker?
- Is het modelbestand gecontroleerd op manipulatie via de gepubliceerde checksum?

:::warn title="Vertrouw geen herverpakte modellen blind"
Modellen die via onbekende mirrors of forks worden aangeboden, kunnen aangepaste gewichten of kwaadaardige Modelfiles bevatten. Download alleen van de officiële pagina en verifieer de hash.
:::

## Checklist deel 2: Infrastructuur

**Dataretentie:**
- Slaat de AI-interface, zoals Ollama of Open WebUI, prompts en antwoorden op?
- Waar worden ze bewaard, in een lokale database of in logbestanden?
- Wie heeft toegang tot die opslag?
- Wat is het verwijderbeleid en de bewaartermijn?

**Netwerkisolatie:**
- Draait het model volledig offline, of maakt het verbinding met externe diensten voor updates, telemetrie of analytics?
- Controleer uitgaand netwerkverkeer met een firewallregel, met `lsof -i`, of met een tool als Little Snitch op macOS.

**Toegangscontrole:**
- Is de AI-interface beveiligd met authenticatie?
- Is toegang beperkt tot de juiste personen of afdelingen?
- Worden toegangslogs bijgehouden zodat je achteraf kunt zien wie wat heeft gedaan?

:::howto title="Netwerktoegang van Ollama controleren"
1. Start Ollama.
2. Open een terminal.
3. Draai `lsof -i -P -n | grep ollama`.
4. Bekijk welke verbindingen actief zijn.
5. Zie je verbindingen naar onverwachte externe IP-adressen, onderzoek dat dan eerst voor je het model in productie zet.
:::

## Checklist deel 3: Governance

**Gebruiksbeleid:**
- Weten medewerkers welke soorten informatie ze wel en niet mogen invoeren?
- Is er een beleid voor gevoelige gegevens, zoals persoonsgegevens, financiële informatie of juridische stukken?
- Is dat beleid gedocumenteerd en actief gecommuniceerd?

**AVG-compliance:**
- Als het model antwoorden genereert op basis van persoonsgegevens, val je waarschijnlijk onder de AVG.
- Controleer of je een verwerkersovereenkomst nodig hebt, bijvoorbeeld bij een externe hostingpartij.
- Overweeg een Data Protection Impact Assessment (DPIA) voor hoogrisico-toepassingen.

**Incidentrespons:**
- Wat doe je als het model onjuiste of schadelijke output geeft?
- Is er een rapportageproces voor incidenten en een verantwoordelijke?

## Periodieke hercontrole

Privacy-compliance is geen eenmalige controle. Plan elk kwartaal een herziening:
- Zijn er nieuwe modelversies beschikbaar met betere veiligheidseigenschappen?
- Zijn er bekende kwetsbaarheden gerapporteerd voor de gebruikte software, zoals Ollama of Open WebUI?
- Zijn de beleidsregels nog actueel?

:::tip title="Leg de checklist vast per implementatie"
Bewaar per geïmplementeerd model een ingevuld checklistdocument met datum, gecontroleerde versie en verantwoordelijke. Bij de volgende kwartaalcontrole zie je direct wat er sinds de vorige keer is veranderd.
:::

:::faq
### Is een lokaal LLM automatisch AVG-conform?
Nee. Lokaal draaien beperkt de dataverzending, maar je blijft zelf verantwoordelijk voor toegangscontrole, bewaartermijnen, een verwerkingsregister en eventueel een DPIA zodra je persoonsgegevens verwerkt.

### Hoe controleer ik of een modelbestand niet gemanipuleerd is?
Download het model van de officiële pagina en vergelijk de gepubliceerde SHA256-checksum met de uitkomst van `sha256sum <modelbestand>` op Linux of macOS. Een overeenkomende hash betekent dat het bestand origineel is.

### Mag ik Llama, Mistral en Gemma commercieel gebruiken?
Mistral 3 en Gemma 4 staan onder Apache 2.0 en zijn vrij commercieel te gebruiken. Llama 4 mag commercieel onder de Meta Community License, met een drempel voor zeer grote organisaties en een attributieverplichting. Lees altijd de actuele licentie bij de officiële bron.

### Slaat Ollama mijn prompts op?
Ollama bewaart geen prompts in de cloud, maar frontends zoals Open WebUI houden standaard wel conversatiegeschiedenis lokaal bij. Controleer de instellingen en het bewaarbeleid van je interface.

### Hoe weet ik of mijn lokale model echt offline draait?
Monitor het uitgaande verkeer met `lsof -i -P -n`, een firewallregel of Little Snitch op macOS. Zie je geen onverwachte externe verbindingen tijdens gebruik, dan draait het inferentieproces lokaal.
:::