Artikelen met tag «Embeddings»
19 artikelen gevonden.
- Reranking in een RAG-systeem Hoe je met een cross-encoder reranker de kwaliteit van retrieved chunks verbetert door de initiele vector-zoekresultaten te herordenen. Retrieval Verbeteren · 4 min lezen · 15 wkn
- RAG-architectuur uitgelegd Retrieval-Augmented Generation (RAG) combineert een vectordatabase met een taalmodel: relevante documenten worden opgezocht en als context meegegeven aan het model. Basis en Concepten · 5 min lezen · 15 wkn
- Query expansion voor betere RAG Verrijk gebruikersvragen voor scherpere RAG-retrieval met HyDE, step-back prompting, query decomposition en synoniem-expansie. Retrieval Verbeteren · 5 min lezen · 15 wkn
- Retrieval optimaliseren in RAG Vier technieken om document-retrieval in RAG te verbeteren: multi-query, Maximal Marginal Relevance, parent-child retrieval en contextual compression. Retrieval Verbeteren · 5 min lezen · 15 wkn
- Chunking-strategieën voor RAG Hoe je documenten optimaal opdeelt in chunks voor RAG: vaste grootte, recursief, op documentstructuur en semantisch chunken vergeleken, met praktische TypeScript-voorbeelden. Documenten en Chunking · 6 min lezen · 15 wkn
- RAG-kosten optimaliseren Hoe je de kosten van een RAG-systeem beheert: embedding-optimalisatie, model-keuze per taak, semantische caching en tiered retrieval. Evaluatie en Monitoring · 5 min lezen · 15 wkn
- Embedding-model kiezen voor RAG Hoe je het juiste embedding-model kiest voor je RAG-systeem op basis van taal, kwaliteit, kosten en latentie, met aandacht voor Nederlands. Embedding en Vector-Database · 6 min lezen · 15 wkn
- Gemini API-modellen en versies Vergelijk de Gemini-modellen (3.x, 2.5 en embeddings) op context, snelheid, kosten en sterktes, zodat je per use case de juiste keuze maakt. Productie en Optimalisatie · 6 min lezen · 15 wkn
- Caching-strategie voor de Gemini API Combineer context caching, response caching en embedding caching met de nieuwe Google Gen AI SDK voor maximale snelheid en minimale kosten in je Gemini-applicaties. Productie en Optimalisatie · 8 min lezen · 15 wkn
- Hybrid search: keyword plus semantisch Hoe je BM25-trefwoordzoekopdrachten combineert met vectorzoekopdrachten voor betere RAG-resultaten via Reciprocal Rank Fusion. Retrieval Verbeteren · 6 min lezen · 15 wkn
- Vector-database kiezen voor RAG Vergelijking van de meestgebruikte vectordatabases voor RAG (Chroma, pgvector, Qdrant, Weaviate en Pinecone) op schaal, kosten, latentie en metadata-filtering, met een praktische keuzewijzer. Embedding en Vector-Database · 6 min lezen · 15 wkn
- LlamaIndex met de Gemini API Bouw RAG-pipelines en kennisbank-chatbots met LlamaIndex en Gemini als LLM en embedding-model via de google-genai-integratie. Productie en Optimalisatie · 7 min lezen · 15 wkn
- Embeddings genereren met de Gemini API Genereer vectorrepresentaties van tekst met het model gemini-embedding-001 voor semantisch zoeken, clustering en aanbevelingen, via de nieuwe google-genai SDK. Geavanceerde API-technieken · 7 min lezen · 15 wkn
- Tekstembeddings genereren met Vertex AI Embeddings zetten tekst om in getallen waarmee je betekenis kunt vergelijken. Leer hoe je ze maakt in Vertex AI en gebruikt voor semantisch zoeken. Data & Embeddings · 6 min lezen · 16 wkn
- RAG Engine in Vertex AI: kennisbank bouwen Met RAG Engine in Vertex AI bouw je een AI die antwoorden geeft op basis van jouw eigen documenten uit Drive of Cloud Storage, met de bron erbij. Prompts & Grounding · 7 min lezen · 16 wkn
- Vector Search instellen in Vertex AI Vector Search vindt razendsnel de meest gelijkende vectoren in grote collecties. Leer hoe je een index bouwt, deployt en bevraagt. Data & Embeddings · 6 min lezen · 16 wkn
- RAG-pipeline opzetten met lokale AI en eigen documenten Met een lokale RAG-pipeline laat je AI antwoorden geven op basis van je eigen documenten in plaats van alleen algemene kennis, volledig privé met Ollama en een embeddingmodel. Geavanceerde Integratie · 5 min lezen · 17 wkn
- Wat is RAG? Retrieval-Augmented Generation in begrijpelijke taal RAG laat een AI eerst relevante documenten ophalen en pas daarna antwoorden op basis van die bronnen, zodat je actuele en onderbouwde antwoorden krijgt in plaats van verzonnen tekst. Basis en Concepten · 6 min lezen · 17 wkn
- Vraag en antwoord over je eigen documenten: van NotebookLM tot een eigen RAG-pijplijn Wil je een AI laten antwoorden op basis van jouw eigen documenten? Begin met een kant-en-klare tool zoals NotebookLM, en bouw pas een eigen RAG-pijplijn als je meer controle of integratie nodig hebt. Basis en Concepten · 6 min lezen · 17 wkn