Ollama installeren op Windows is sinds de native Windows-versie eenvoudig geworden. Je hebt geen Linux-omgeving of ingewikkelde configuratie meer nodig. Na het uitvoeren van een installatiebestand draai je binnen enkele minuten een lokaal taalmodel op je eigen pc.
Systeemeisen controleren
Ollama werkt op Windows 10 (versie 22H2 of nieuwer) en Windows 11. Voor een prettige ervaring heb je minimaal 16 GB werkgeheugen nodig. Heb je een NVIDIA-videokaart met minstens 6 GB videogeheugen en een recente driver (versie 452.39 of nieuwer), dan versnelt Ollama je modellen automatisch via CUDA. Zonder geschikte videokaart werkt het ook, maar dan doet je processor het rekenwerk en gaat het langzamer.
Videokaart maakt het verschil
Met een NVIDIA RTX-kaart draaien modellen van rond de 7 tot 8 miljard parameters vlot en merkbaar sneller dan met alleen de processor. AMD Radeon-kaarten worden ondersteund via ROCm, en sinds de nieuwere versies werkt Ollama ook met veel andere kaarten via Vulkan. De NVIDIA-ondersteuning is nog altijd het breedst en het best getest.
Ollama downloaden en installeren
Installatie op Windows
- Ga naar ollama.com en klik op Download for Windows.
- Voer het gedownloade bestand
OllamaSetup.exeuit. Je hebt hiervoor geen beheerdersrechten nodig. - Klik door de installatie heen; er zijn geen keuzes nodig.
- Na installatie verschijnt een Ollama-icoon in je systeemvak rechtsonder.
- Open PowerShell en typ
ollama --versionom te controleren of alles werkt.
Ollama draait nu als achtergronddienst en luistert op localhost poort 11434. Je hoeft de app niet handmatig te starten; Windows doet dat automatisch bij het opstarten.
Je eerste model draaien
Open PowerShell of Windows Terminal en start een model:
ollama run llama3.2
De eerste keer download Ollama het model. De standaardvariant van Llama 3.2 is ongeveer 2 GB groot, dus dat kan even duren. Daarna verschijnt een prompt waar je je vraag typt. Het antwoord wordt volledig op je eigen pc berekend.
Wil je iets nog lichters voor een laptop zonder krachtige videokaart, probeer dan een klein model zoals phi4-mini. Heb je juist genoeg geheugen en wil je hogere kwaliteit, dan zijn gemma3 of qwen3 goede keuzes. Een actueel overzicht van beschikbare modellen vind je op ollama.com/library.
Gebruik Windows Terminal
Werk met Windows Terminal in plaats van de oude Command Prompt. Die toont lange antwoorden netter en je kopieert er makkelijker tekst uit. Op Windows 11 is Windows Terminal standaard aanwezig.
NVIDIA-versnelling controleren
Wil je weten of je videokaart wordt gebruikt? Start een model en open in een tweede venster Taakbeheer. Op het tabblad Prestaties zie je bij de GPU het gebruik oplopen tijdens het genereren. Zie je alleen processorgebruik, dan herkent Ollama je kaart mogelijk niet en moet je je NVIDIA-driver bijwerken.
Werk eerst je driver bij
Verouderde NVIDIA-drivers zijn de meest voorkomende reden dat Ollama je videokaart niet gebruikt. Werk altijd eerst je driver bij via het NVIDIA App- of GeForce-programma of via de NVIDIA-website voordat je conclusies trekt over de snelheid.
Modellen beheren op Windows
Het beheren van modellen werkt identiek aan andere platforms. De handigste commando's staan hieronder.
| Commando | Wat het doet |
|---|---|
ollama list |
Toont al je gedownloade modellen met hun grootte. |
ollama pull mistral |
Downloadt een model zonder het te starten. |
ollama rm llama3.2 |
Verwijdert een model en maakt schijfruimte vrij. |
ollama run llama3.2 |
Start een model (en downloadt het eerst als dat nog niet is gebeurd). |
Modellen worden standaard opgeslagen in je gebruikersmap onder .ollama. Heb je een kleine systeemschijf, dan verplaats je deze locatie via de omgevingsvariabele OLLAMA_MODELS in de Windows-systeeminstellingen.
Veelvoorkomende problemen
Soms start Ollama niet of geeft het een foutmelding over de poort. Meestal komt dat doordat er al een ander programma op poort 11434 draait, of doordat je firewall de verbinding blokkeert. Sta Ollama toe in Windows Defender Firewall als je het vanaf andere apparaten wilt benaderen.
Werkt Ollama zonder videokaart?
Ja, Ollama valt automatisch terug op je processor. Kleine modellen zoals llama3.2 of phi4-mini blijven werkbaar, grote modellen worden traag.
Welk model kan ik het beste als eerste proberen?
Voor een eerste kennismaking is llama3.2 een goede, lichte keuze. Heb je meer geheugen of een goede videokaart, dan leveren gemma3 of qwen3 betere antwoorden.
Ondersteunt Ollama AMD-videokaarten?
Ja, via ROCm op ondersteunde Radeon-kaarten, en in nieuwere versies ook via Vulkan voor een bredere reeks kaarten. De ondersteuning is minder breed getest dan voor NVIDIA, controleer dus eerst of jouw kaart wordt herkend.
Waar worden mijn modellen opgeslagen?
In je gebruikersmap onder de map .ollama. Je verplaatst dit met de omgevingsvariabele OLLAMA_MODELS.
Kan ik Ollama vanaf een ander apparaat in mijn netwerk gebruiken?
Ja, door OLLAMA_HOST op 0.0.0.0 te zetten en je firewall te openen voor poort 11434. Doe dit alleen in een vertrouwd netwerk, want je stelt het model dan beschikbaar aan andere apparaten.
Heb ik beheerdersrechten nodig om Ollama te installeren?
Nee. De installer OllamaSetup.exe plaatst Ollama in je eigen gebruikersaccount, dus je kunt het ook zonder beheerdersrechten installeren.
Je draait nu lokale AI op Windows. Bekijk vervolgens welke hardware het beste past of vergelijk de beschikbare modellen.