# Few-shot prompting met voorbeelden

[[TOC]]

## Wat is few-shot prompting?

Few-shot prompting is een techniek waarbij je meerdere voorbeeld-paren meestuurt in je prompt. Elk voorbeeld bestaat uit een invoer en de bijbehorende gewenste uitvoer. Het model analyseert die voorbeelden, herkent het patroon en past dat patroon toe op een nieuwe invoer.

De naam "few-shot" verwijst naar het kleine aantal voorbeelden, doorgaans twee tot acht. Meer dan acht voorbeelden wordt zelden gebruikt en valt buiten de praktische definitie.

Few-shot prompting is een van de meest effectieve technieken voor het sturen van AI-output. Het overbrugt de kloof tussen wat je in woorden kunt uitleggen en wat je daadwerkelijk wilt zien. Veel gebruikers merken dat drie goede voorbeelden beter werken dan een uitgebreide instructie van twee alinea's.

Het achterliggende mechanisme heet in-context learning: het model leert de taak uit de voorbeelden in het contextvenster, zonder dat de modelgewichten worden bijgewerkt.

## Waarom werkt few-shot beter dan zero-shot?

Taalmodellen zijn goed in patroonherkenning. Ze zijn getraind op enorme hoeveelheden tekst en hebben geleerd patronen te herkennen en te reproduceren.

Wanneer je voorbeelden geeft, activeer je precies die capaciteit. Het model hoeft niet te raden wat je bedoelt met "vriendelijk maar professioneel" of "technisch maar begrijpelijk". Het ziet het direct.

:::info title="Voorbeelden in plaats van training"
Onderzoek naar GPT-3 (2020) liet zien dat few-shot prompting bij sommige taken bijna even goed presteert als fine-tuning op gelabelde data. Dat is opvallend: geen extra training nodig, alleen voorbeelden in de prompt. Dit effect is sterker naarmate het model groter is.
:::

Bovendien zorgen voorbeelden voor consistentie. Als je dezelfde taak honderden keren uitvoert, zorgen de voorbeelden dat de output elke keer dezelfde structuur, toon en opmaak heeft.

## Anatomie van een few-shot prompt

Een typische few-shot prompt ziet er zo uit:

```
Taak: Classificeer de toon van het klantbericht als positief, neutraal of negatief.

Bericht: Het product werkt perfect en de levering was supersnel!
Toon: positief

Bericht: Ik heb mijn bestelling ontvangen.
Toon: neutraal

Bericht: Dit is al de tweede keer dat er iets mis gaat met mijn order.
Toon: negatief

Bericht: De verpakking was beschadigd maar het product zelf is prima.
Toon:
```

Het model leest drie voorbeelden, begrijpt het classificatiepatroon en vult de vierde in.

## Hoeveel voorbeelden heb je nodig?

Het optimale aantal voorbeelden hangt af van de complexiteit van de taak:

| Taakcomplexiteit | Aanbevolen voorbeelden |
|-----------------|----------------------|
| Eenvoudig (classificatie, vertaling) | 2 tot 3 |
| Gemiddeld (formattering, extractie) | 3 tot 5 |
| Complex (redeneren, creatief schrijven) | 5 tot 8 |
| Zeer complex of gespecialiseerd | Overweeg fine-tuning |

Meer voorbeelden is niet altijd beter. Boven een bepaald punt neemt de meerwaarde af en stijgen de tokenkosten. Recent onderzoek (2025 tot 2026) laat zelfs zien dat te veel domeinspecifieke voorbeelden de prestaties bij sommige modellen kunnen verslechteren, een effect dat "over-prompting" wordt genoemd. Test daarom altijd met het minimale aantal dat goede resultaten geeft.

## Hoe kies je de juiste voorbeelden?

De keuze van voorbeelden is cruciaal. Slechte voorbeelden leiden het model in de verkeerde richting.

:::howto title="Goede voorbeelden kiezen"
1. **Dek de variatie**: zorg dat je voorbeelden de variatie in de werkelijke data vertegenwoordigen. Als je klantberichten classificeert, neem dan berichten uit verschillende categorieën.
2. **Balans is beter**: gebruik bij classificatietaken ongeveer evenveel voorbeelden per klasse. Scheefheid in voorbeelden leidt tot scheefheid in output.
3. **Representatief, niet extreem**: neem typische gevallen, niet de makkelijkste of de moeilijkste. Het model moet het basispatroon leren, niet de uitzonderingen.
4. **Volgorde doet ertoe**: het meest recente voorbeeld heeft vaak de meeste invloed (recency bias). Zet het meest representatieve voorbeeld als laatste.
5. **Test en roteer**: verwissel de volgorde van voorbeelden en kijk of de output verandert. Als dat zo is, heb je een fragiele prompt.
:::

## Praktijkvoorbeelden

### Productbeschrijvingen

```
Product: Stalen waterkoker, 1.7L, inox
Beschrijving: Kook water razendsnel met deze stijlvolle roestvrijstalen waterkoker. Geschikt voor 1.7 liter, met automatische uitschakelbeveiliging.

Product: Bluetooth-hoofdtelefoon, over-ear, noise-cancelling
Beschrijving: Dompel je onder in je muziek met actieve ruisonderdrukking en 30 uur accuduur. Comfortabel voor de hele dag.

Product: Opvouwbare fietshelm, maat M
Beschrijving:
```

### Data-extractie

```
Tekst: "Jan de Vries belde op 14 maart om 09:30 uur."
JSON: {"naam": "Jan de Vries", "datum": "2026-03-14", "tijd": "09:30"}

Tekst: "Maria Jansen stuurde een mail op woensdag 5 februari."
JSON: {"naam": "Maria Jansen", "datum": "2026-02-05", "tijd": null}

Tekst: "Piet Pietersen heeft een afspraak op 22 april om 14:00 uur."
JSON:
```

## Valkuilen in de praktijk

**Valkuil 1: voorbeelden bevatten te veel details.** Als je voorbeeld te specifiek is, kopieert het model details die voor jou irrelevant zijn. Hou voorbeelden representatief, niet uniek.

**Valkuil 2: inconsistente opmaak tussen voorbeelden.** Als het ene voorbeeld dubbele aanhalingstekens gebruikt en het andere enkele, raakt het model in de war. Wees consistent.

**Valkuil 3: te lange voorbeelden.** Lange voorbeelden kosten tokens en leiden het model af. Hou elk voorbeeld zo kort als nodig om het patroon te demonstreren.

:::warning title="Controleer je voorbeelden"
Controleer altijd of je voorbeelden correct zijn. Een fout in een voorbeeld wordt door het model overgenomen en vermenigvuldigd over alle output. Garbage in, garbage out.
:::

## Few-shot versus fine-tuning

Few-shot prompting en fine-tuning bereiken soms vergelijkbare resultaten, maar zijn fundamenteel anders.

Few-shot betekent voorbeelden in de prompt, geen extra training, flexibel en direct te wijzigen. Fine-tuning betekent het model opnieuw trainen op gelabelde data, een permanente aanpassing met een hogere initiële investering, beter geschikt voor grootschalige productie.

Voor de meeste use cases is few-shot de snellere en goedkopere optie. Fine-tuning loont wanneer je duizenden identieke taken uitvoert en maximale consistentie nodig hebt.

:::tip title="Begin klein"
Start met twee of drie voorbeelden en voeg er alleen één toe als de kwaliteit echt tekortschiet. Zo houd je de prompt kort, de kosten laag en voorkom je over-prompting.
:::

:::faq
### Hoeveel tokens kosten mijn voorbeelden?
Reken gemiddeld 100 tot 300 tokens per voorbeeld, afhankelijk van de lengte. Bij acht voorbeelden ben je al snel 1.000 tot 2.000 tokens kwijt alleen aan de context. Houd dit in de gaten bij kostoptimalisatie.

### Werkt few-shot bij alle modellen?
Grote modellen zoals GPT-4, Claude en Gemini reageren uitstekend op few-shot. Kleinere modellen profiteren minder, omdat ze de patroonherkenning minder goed beheersen.

### Mag ik eigen gelabelde data als voorbeelden gebruiken?
Ja, en dat is zelfs aanbevolen. Echte data uit je eigen systeem is representatiever dan bedachte voorbeelden. Let wel op privacy en verwijder gevoelige gegevens uit je voorbeelden.

### Wanneer schakel ik over van few-shot naar fine-tuning?
Overweeg fine-tuning als je veel duizenden vergelijkbare verzoeken per dag verwerkt, als de kwaliteit van few-shot structureel onvoldoende is, of als je de promptkosten significant wilt verlagen.

### Kan ik te veel voorbeelden geven?
Ja. Boven een bepaald punt levert een extra voorbeeld geen winst meer op en kan het zelfs verwarrend werken (over-prompting). Begin klein en breid alleen uit als de resultaten erom vragen.
:::

Few-shot prompting is een van de krachtigste basistechnieken in prompt-engineering. Met drie tot vijf goed gekozen voorbeelden stuur je een AI-model nauwkeuriger dan de meeste complexe instructies.