Geavanceerde Integratie
Lokale modellen integreren via API's, Docker, custom Modelfiles, RAG-pipelines en fine-tuning.
Artikelen
5 artikelen, gerangschikt op populariteit.
De Ollama API koppelen aan je eigen applicatie
Roep lokale Ollama-modellen aan vanuit je eigen code via de REST API. Leer verzoeken sturen met Python en JavaScript, streaming verwerken en de OpenAI-compatibele endpoint inzetten.
Een Ollama Modelfile aanmaken voor een aangepast model
Met een Ollama Modelfile maak je een eigen versie van een model met een vaste persoonlijkheid, instructies en instellingen, zodat je niet elke keer dezelfde uitleg hoeft te herhalen.
RAG-pipeline opzetten met lokale AI en eigen documenten
Met een lokale RAG-pipeline laat je AI antwoorden geven op basis van je eigen documenten in plaats van alleen algemene kennis, volledig privé met Ollama en een embeddingmodel.
Ollama draaien in Docker
Leer hoe je Ollama in Docker draait: de officiele image starten, modellen behouden via volumes, GPU-versnelling inschakelen en Ollama combineren met Open WebUI in een docker-compose-bestand.
Fine-tunen van lokale modellen: de basis
Fine-tunen past een bestaand AI-model aan zodat het beter presteert op jouw specifieke taak of stijl. Leer wat het is, wanneer het zinvol is, wanneer RAG of een Modelfile beter past, en hoe LoRA fine-tunen haalbaar maakt op bescheiden hardware.