Artikelen met tag «LLM-as-judge»
3 artikelen gevonden.
- RAG evalueren met RAGAS Meet de kwaliteit van een RAG-systeem met RAGAS: context precision, context recall, faithfulness en answer relevance, plus een werkende evaluatiepipeline. Evaluatie en Monitoring · 6 min lezen · 15 wkn
- Prompts evalueren: methoden en aanpak Leer hoe je de kwaliteit van prompts systematisch meet met automatische en handmatige evaluatiemethoden, van eenvoudige rubrics tot LLM-as-judge. Evaluatie, Testen en Beheer · 6 min lezen · 15 wkn
- AI-agents evalueren en testen Hoe je de kwaliteit van AI-agents meet: trajectevaluatie, nauwkeurigheid van tool-selectie en beoordeling van het eindresultaat met geautomatiseerde en menselijke evaluatie. AI-agents Bouwen · 6 min lezen · 15 wkn