LLM-as-judge

Artikelen met tag «LLM-as-judge»

3 artikelen gevonden.

AI-agents evalueren en testen Hoe je de kwaliteit van AI-agents meet: trajectevaluatie, nauwkeurigheid van tool-selectie en beoordeling van het eindresultaat met geautomatiseerde en menselijke evaluatie. AI-agents Bouwen · 6 min lezen · 6 uur
Prompts evalueren: methoden en aanpak Leer hoe je de kwaliteit van prompts systematisch meet met automatische en handmatige evaluatiemethoden, van eenvoudige rubrics tot LLM-as-judge. Evaluatie, Testen en Beheer · 6 min lezen · 5 uur
RAG evalueren met RAGAS Meet de kwaliteit van een RAG-systeem met RAGAS: context precision, context recall, faithfulness en answer relevance, plus een werkende evaluatiepipeline. Evaluatie en Monitoring · 6 min lezen · 5 uur