Artikelen met tag «LLM»
13 artikelen gevonden.
- RAG-architectuur uitgelegd Retrieval-Augmented Generation (RAG) combineert een vectordatabase met een taalmodel: relevante documenten worden opgezocht en als context meegegeven aan het model. Basis en Concepten · 5 min lezen · 15 wkn
- RAG-kosten optimaliseren Hoe je de kosten van een RAG-systeem beheert: embedding-optimalisatie, model-keuze per taak, semantische caching en tiered retrieval. Evaluatie en Monitoring · 5 min lezen · 15 wkn
- Gemini-modellen fine-tunen (supervised fine-tuning op Vertex AI) Fine-tuning zit niet meer in de Gemini Developer API: tune Gemini 2.5-modellen met je eigen data via supervised fine-tuning op Vertex AI en de unified google-genai SDK. Geavanceerde API-technieken · 6 min lezen · 15 wkn
- LangChain met de Gemini API Gebruik LangChain met Gemini als LLM-backend voor chains, agents en RAG-systemen, met actuele modellen en de huidige langchain-google-genai integratie. Geavanceerde API-technieken · 6 min lezen · 15 wkn
- Context window optimaliseren in RAG Hoe je de beschikbare context-ruimte optimaal benut: context-assemblage, documentvolgorde, instructie-inpakking en context-compressie. Retrieval Verbeteren · 6 min lezen · 15 wkn
- Gemini API-modellen en versies Vergelijk de Gemini-modellen (3.x, 2.5 en embeddings) op context, snelheid, kosten en sterktes, zodat je per use case de juiste keuze maakt. Productie en Optimalisatie · 6 min lezen · 15 wkn
- Chatsessie opzetten met de Gemini API Bouw een meervoudige chatsessie met de Gemini API waarbij de conversatiegeschiedenis bewaard blijft, met de nieuwe Google GenAI SDK in Python en JavaScript. Aan de Slag · 7 min lezen · 15 wkn
- System instructions in de Gemini API Stuur het gedrag van Gemini met system instructions: stel persona, toon, taalstijl, domeinkennis en veiligheidsregels in die de gebruiker niet kan overschrijven. Geavanceerde API-technieken · 7 min lezen · 15 wkn
- Hoe werkt AI? Large Language Models simpel uitgelegd Begrijp zonder technische vakkennis hoe Large Language Models zoals Gemini werken: tokens, training, voorspellen en waarom AI soms feiten verzint. Basis en Concepten · 4 min lezen · 17 wkn
- Ollama installeren op Windows Installeer Ollama op Windows met de native installer, download je eerste model en zet desgewenst een NVIDIA-videokaart in voor extra snelheid, zodat je binnen enkele minuten een lokaal taalmodel draait zonder dat data je pc verlaat. Installatie en Eerste Stappen · 5 min lezen · 17 wkn
- Het juiste lokale model kiezen: hardware, quantisatie en LM Studio Begrijp hoe modelgrootte en quantisatie het geheugengebruik bepalen, en draai lokale modellen zonder terminal met de gratis grafische app LM Studio. Modellen en Hardware · 6 min lezen · 17 wkn
- Lokale AI draaien met Ollama: een taalmodel op je eigen computer Installeer Ollama en draai open taalmodellen volledig lokaal op je eigen machine, inclusief de belangrijkste commando's en de ingebouwde API. Installatie en Eerste Stappen · 5 min lezen · 17 wkn
- Privacychecklist voor lokale AI-implementatie Wat je moet controleren voor je een lokaal AI-model implementeert: databeleid, modelselectie, infrastructuur en governance, met een praktische checklist. Bedrijf en Governance · 5 min lezen · 17 wkn