Ollama installeren op macOS: stap voor stap

Q: Welk model kan ik het beste als eerste proberen?

Begin met een klein model dat bij je geheugen past, zoals `llama3.2` op 8 GB of een 7B- tot 8B-model op 16 GB. Zo zie je snel of alles werkt voordat je grotere modellen downloadt.

Installeer Ollama op je Mac, draai je eerste lokale AI-model en stel binnen vijf minuten je eerste vraag, op zowel Apple Silicon als Intel.

schedule6 min lezen event1 Jun 2026 updateBijgewerkt 5 uur

open_in_new data_object

Ollama installeren op macOS is de snelste manier om lokale AI op je Mac te draaien. Je hebt geen technische voorkennis nodig: na het downloaden van de app stel je binnen enkele minuten je eerste vraag aan een taalmodel dat volledig op je eigen Mac draait, zonder dat je data je computer verlaat.

Wat je nodig hebt

Voordat je begint, controleer je of je Mac geschikt is. Ollama vereist macOS 14 (Sonoma) of nieuwer. Apple Silicon (M1 tot en met de nieuwste M-chips) is ideaal omdat het gedeelde geheugen perfect werkt voor AI en macOS automatisch de Metal-GPU inzet voor versnelling. Een Intel-Mac werkt ook, maar draait alleen op de processor en is daardoor merkbaar trager. Reken op minimaal 16 GB geheugen voor een prettige ervaring met modellen rond de 7B tot 8B parameters.

info

Geheugen bepaalt je modelkeuze

Met 8 GB draai je kleine modellen tot ongeveer 3B, zoals llama3.2. Met 16 GB komen modellen van 7B en 8B binnen bereik. Heb je 24 GB tot 32 GB of meer, dan kun je richting 14B en hoger, bijvoorbeeld grotere varianten van Qwen of Gemma.

Ollama installeren op je Mac

Er zijn twee manieren om Ollama te installeren. De makkelijkste is via de officiele app, die meteen een eenvoudige chat-interface meelevert. De tweede is via Homebrew, handig als je vooral vanuit de terminal werkt.

Manier 1: de officiele app

Ga naar ollama.com en klik op Download. Open het gedownloade bestand en sleep Ollama naar je Programma's-map. Start de app een keer. Er verschijnt een klein icoontje in je menubalk en de achtergronddienst draait nu automatisch. De app opent ook een chatvenster waarin je direct een model kunt kiezen en een vraag kunt typen, zonder de Terminal aan te raken.

Manier 2: via Homebrew

Heb je Homebrew geinstalleerd, dan installeer je Ollama met dit commando in de Terminal:

brew install ollama

Start daarna de achtergronddienst zodat die ook na een herstart blijft draaien:

brew services start ollama

De dienst luistert nu op poort 11434 en is klaar voor gebruik. Wil je de dienst eenmalig op de voorgrond draaien om logs te zien, gebruik dan ollama serve.

lightbulb

App of Homebrew?

Wil je vooral klikken en chatten, kies dan de app: die bevat een grafische chat-interface. Werk je liever met scripts en de commandoregel, dan past Homebrew beter. Je kunt beide combineren, want ze gebruiken dezelfde achtergronddienst en API.

Je eerste model draaien

Zo draai je je eerste model

Open de Terminal via Spotlight (cmd+spatie, typ Terminal).
Typ ollama run llama3.2 en druk op enter.
Wacht tot het model is gedownload. Dit gebeurt maar een keer en kost afhankelijk van het model enkele gigabytes.
Typ je vraag zodra je de prompt ziet, bijvoorbeeld: Leg uit wat een zwart gat is.
Lees het antwoord, dat volledig lokaal op je Mac is berekend.

Liever klikken? Open dan de Ollama-app, kies een model in het dropdownmenu bovenin en typ je vraag in het chatvenster. De app ondersteunt opmaak, codeblokken en streaming-antwoorden, en je kunt zelfs een tekstbestand naar het venster slepen om erover te laten redeneren.

Modellen beheren

Zodra Ollama draait, kun je meerdere modellen naast elkaar hebben. De belangrijkste commando's in de Terminal:

ollama list toont welke modellen je hebt gedownload.
ollama pull gemma2 haalt een nieuw model binnen zonder het meteen te starten.
ollama rm llama3.2 verwijdert een model dat je niet meer gebruikt en maakt zo schijfruimte vrij.

lightbulb

Ruim ongebruikte modellen op

Modellen nemen al snel enkele gigabytes in beslag. Verwijder modellen die je niet gebruikt met ollama rm. Je kunt ze later altijd opnieuw downloaden.

Ollama op de achtergrond

Na installatie start Ollama automatisch mee met je Mac. Het icoon in de menubalk laat zien dat de dienst actief is. Wil je Ollama tijdelijk stoppen, klik dan op het menubalk-icoon en kies Quit. Installeerde je via Homebrew, dan stop je de dienst met brew services stop ollama. Dat scheelt geheugen als je het even niet nodig hebt.

warning

Geheugengebruik op de achtergrond

Ollama houdt geheugen vast zolang een model geladen is. Op een Mac met weinig geheugen kun je merken dat andere apps trager worden. Stop Ollama als je het niet actief gebruikt.

Werken vanuit andere programma's

Ollama biedt een API op localhost poort 11434. Dat betekent dat je vanuit je eigen scripts of apps het model kunt aanroepen. Een simpele test vanuit de Terminal:

curl http://localhost:11434/api/generate -d '{"model":"llama3.2","prompt":"Hallo"}'

Dit opent de deur naar automatisering. Lees verder over de Ollama API koppelen aan je eigen applicatie als je dit verder wilt uitbouwen.

Werkt Ollama op een Intel-Mac?

Ja, maar het is duidelijk trager dan op Apple Silicon, omdat een Intel-Mac alleen de processor gebruikt en geen Metal-GPU-versnelling heeft. Kies kleinere modellen voor een werkbare snelheid.

Welke macOS-versie heb ik nodig?

Ollama vereist macOS 14 (Sonoma) of nieuwer. Op oudere versies wordt de app niet ondersteund.

Hoeveel schijfruimte heb ik nodig?

Elk model neemt enkele gigabytes in beslag. Een model rond de 7B tot 8B is ongeveer 4 tot 5 GB. Reken op 20 GB vrije ruimte als je een paar modellen wilt proberen.

Moet ik de Terminal gebruiken?

Nee. De Ollama-app heeft een ingebouwd chatvenster waarmee je zonder commando's een model kiest en vragen stelt. De Terminal is handig voor scripts en voor het beheren van modellen, maar niet verplicht.

Hoe update ik Ollama?

Met de app krijg je automatisch een melding bij een nieuwe versie. Installeerde je via Homebrew, dan voer je brew upgrade ollama uit.

Welk model kan ik het beste als eerste proberen?

Begin met een klein model dat bij je geheugen past, zoals llama3.2 op 8 GB of een 7B- tot 8B-model op 16 GB. Zo zie je snel of alles werkt voordat je grotere modellen downloadt.

Je draait nu lokale AI op je Mac. Wil je weten welk model het beste bij je past, lees dan de modelvergelijking. Geef je de voorkeur aan een uitgebreidere grafische interface, kijk dan naar LM Studio of Open WebUI bovenop Ollama.

Wat je nodig hebt

Ollama installeren op je Mac

Manier 1: de officiele app

Manier 2: via Homebrew

Je eerste model draaien

Modellen beheren

Ollama op de achtergrond

Werken vanuit andere programma's

Lokale AI op Apple Silicon: M1 tot M5 optimaal benutten

Ollama installeren op Windows

Hardware kiezen voor lokale AI: GPU, RAM en opslag

Welk Ollama-model kies je? Llama, Gemma, Mistral, Phi en Qwen vergeleken

Open WebUI instellen voor een lokale AI-chatinterface