Waarom lokale AI voor coderen?
Cloudgebaseerde coding-assistenten zoals GitHub Copilot sturen je code naar externe servers. Voor propriëtaire code, gevoelige bedrijfslogica of strikte compliance-vereisten is dat onwenselijk. Lokale AI-modellen draaien volledig op je eigen hardware, zodat er geen code je computer verlaat.
Twee populaire opties:
- Continue: een open-source VS Code-extensie die met elk lokaal of cloud-LLM werkt.
- Cursor: een volledige AI-editor gebaseerd op VS Code met diepgaande model-integratie.
Hardware bepaalt je modelkeuze
Lokale modellen vragen voldoende geheugen. Voor codeertaken is een model van 7B tot 32B parameters geschikt. Een GPU met 8 tot 24 GB VRAM geeft de beste prestaties. Alleen op CPU werkt het ook, maar trager en bij voorkeur met kleinere modellen.
Ollama: lokale modellen draaien
Ollama is de eenvoudigste manier om lokale LLM-modellen te draaien. Het biedt een OpenAI-compatibele API die door Continue, Cursor en andere tools gebruikt kan worden.
Installatie
curl -fsSL https://ollama.com/install.sh | sh
Of download de macOS- of Windows-installer via ollama.com.
Codemodellen installeren
ollama pull qwen2.5-coder:7b
ollama pull qwen2.5-coder:1.5b
ollama pull deepseek-coder-v2:16b
Aanbevolen modellen voor codeertaken (medio 2026):
| Model | Grootte | Sterkte |
|---|---|---|
qwen2.5-coder:1.5b |
~1 GB | Snelle autocomplete, ook op CPU |
qwen2.5-coder:7b |
~4 GB | Algemeen coderen, goede allrounder |
deepseek-coder-v2:16b |
~9 GB | Sterke code-completions en refactoring |
qwen2.5-coder:32b |
~20 GB | Beste kwaliteit, vereist een stevige GPU |
qwen3-coder:30b |
~19 GB | Nieuwere generatie, 256K-contextvenster |
Klein voor autocomplete, groot voor redeneren
Gebruik een klein model (1.5B tot 7B) voor snelle autocomplete en een groter model (16B tot 32B) voor chat, uitleg en refactoring over meerdere bestanden. De sprong naar 32B telt vooral bij taken die context over meerdere bestanden vragen.
Continue: open-source VS Code-extensie
Continue is een gratis, open-source VS Code-extensie voor AI-coding-assistentie. Je bepaalt zelf welke modellen worden gebruikt.
Installatie
Continue installeren
- Open VS Code en ga naar Extensies (
Ctrl+Shift+X). - Zoek op Continue en installeer de extensie.
- Open het Continue-paneel in de zijbalk.
- Klik op het instellingen-icoon en bewerk het configuratiebestand
config.yamlin de map~/.continue/.
config.json is vervangen door config.yaml
Sinds Continue 1.0 is het oude config.json deprecated. De huidige configuratie gebruikt config.yaml met een roles-veld per model. Volg je een oudere handleiding met config.json, gebruik dan de YAML-migratiegids in de Continue-documentatie.
Configuratie voor Ollama
name: Lokale config
version: 0.0.1
schema: v1
models:
- name: Qwen2.5 Coder (chat)
provider: ollama
model: qwen2.5-coder:7b
apiBase: http://localhost:11434
roles:
- chat
- edit
- name: Qwen2.5 Coder (autocomplete)
provider: ollama
model: qwen2.5-coder:1.5b
apiBase: http://localhost:11434
roles:
- autocomplete
context:
- provider: diff
- provider: open
- provider: terminal
- provider: codebase
De modelnaam in de configuratie moet exact overeenkomen met wat ollama list toont, en het model moet lokaal geïnstalleerd zijn.
Continue gebruiken
- Chat:
Ctrl+Lopent de AI-chat om vragen over je code te stellen. - Autocomplete: Continue vult code aan terwijl je typt.
- Edit: selecteer code en druk
Ctrl+Ivoor inline bewerkingen. - Codebase-context: typ
@codebaseom de AI toegang te geven tot je hele project.
Cursor: de AI-first editor
Cursor is een fork van VS Code met ingebouwde AI-functies. Het biedt een diepere integratie dan een losse extensie, maar de ondersteuning voor lokale modellen kent enkele beperkingen.
Lokale modellen in Cursor
Cursor praat met lokale modellen via de OpenAI-compatibele API van Ollama. Je overschrijft daarvoor de OpenAI-base-URL in de instellingen.
Ollama koppelen aan Cursor
- Open Cursor en ga naar Settings, daarna Models.
- Open de OpenAI API-sectie en zet Override Base URL aan.
- Vul als base-URL
http://localhost:11434/v1in en als API-sleutel een willekeurige waarde, bijvoorbeeldollama. - Voeg de modelnaam toe (bijvoorbeeld
qwen2.5-coder:7b) en klik op Verify.
Beperkingen van lokale modellen in Cursor
De OpenAI-override werkt voornamelijk voor Chat en Cmd+K. Cursor Tab (de snelle inline-autocomplete) vraagt een latency onder de honderd milliseconden en werkt onbetrouwbaar met lokale modellen. Daarnaast verwacht Cursor in veel gevallen een publiek HTTPS-endpoint, waardoor een tunnel zoals Cloudflare Tunnel of ngrok nodig kan zijn. Lukt de verificatie niet, zet dan OLLAMA_ORIGINS="*" zodat Ollama verzoeken van Cursor accepteert.
Cursor Composer
Cursor Composer (Ctrl+I) is de krachtigste functie: een AI-agent die in meerdere stappen meerdere bestanden tegelijk kan aanpassen op basis van één instructie. Geschikt voor:
- Het refactoren van een module.
- Het toevoegen van een nieuwe feature met bijbehorende tests.
- Het consistent doorvoeren van een naamgevingsconventie over de hele codebase.
Houd er rekening mee dat de zwaardere agent-functies in de praktijk het best presteren met grotere modellen of de cloudmodellen van Cursor zelf.
Wat als mijn computer niet krachtig genoeg is voor lokale modellen?
Kies een klein model zoals qwen2.5-coder:1.5b, dat ook op CPU draait. Het is minder capabel maar wel privacyveilig. Een alternatief is een zelfgehoste Ollama-instantie op een krachtigere server binnen je eigen netwerk.
Kan ik Continue ook met cloudmodellen gebruiken?
Ja. Continue ondersteunt onder andere Anthropic Claude, OpenAI en Google Gemini. Je configureert meerdere modellen naast elkaar en kiest per situatie welke je inzet.
Is Cursor echt lokaal als ik Ollama als backend gebruik?
De modelinferentie draait lokaal, maar Cursor zelf kan telemetrie versturen. Controleer de privacyinstellingen in Cursor als dat voor jou een bezwaar is.
Welk model is het beste voor Python of JavaScript?
Qwen2.5 Coder presteert in beide talen goed. Voor sterk gespecialiseerde taken, bijvoorbeeld in Rust of Go, kan een ander model soms beter uitpakken. Test op je eigen codebase voor je een keuze maakt.
Hoe update ik een model in Ollama?
Met ollama pull <modelnaam> haal je altijd de laatste versie van dat model op.
Waarom werkt mijn Continue-config niet meer?
Waarschijnlijk gebruik je nog config.json, dat sinds Continue 1.0 vervangen is door config.yaml. Zet je instellingen om naar het YAML-formaat met het roles-veld per model.