# Een model fine-tunen op Vertex AI

[[TOC]]

Soms komt een standaardmodel net niet ver genoeg. Het begrijpt je vakgebied niet helemaal, gebruikt de verkeerde toon of kent jouw vaste formaat niet. Fine-tuning is dan een optie. Je neemt een bestaand model en traint het verder op jouw eigen voorbeelden, zodat het zich naar jouw taak voegt.

Belangrijk om te weten: fine-tuning is niet altijd het juiste antwoord. Vaak bereik je met een goede prompt of met grounding hetzelfde resultaat tegen veel lagere kosten en moeite. Fine-tuning loont pas als je een duidelijke, herhaalde taak hebt waar prompten tekortschiet.

## Wanneer kies je fine-tuning

Fine-tuning is zinvol als je consistent gedrag wilt dat je met prompten niet stabiel krijgt. Denk aan een vaste toon, een specifiek antwoordformaat of kennis van jargon dat het basismodel niet goed beheerst. Met genoeg goede voorbeelden leert het model dat patroon.

Het is minder geschikt om feiten toe te voegen. Wil je dat het model jouw actuele documenten kent, dan is grounding of een kennisbank met RAG vaak beter. Fine-tuning verandert hoe het model antwoordt, niet zozeer wat het op dat moment weet.

Gebruik deze vuistregel om de juiste aanpak te kiezen:

| Aanpak | Kies dit als | Kenmerk |
| --- | --- | --- |
| Prompt design | Een scherpe instructie met voorbeelden levert al het gewenste gedrag | Goedkoop en snel |
| Grounding of RAG | Het model jouw feiten of documenten niet kent | Actuele kennis zonder hertrainen |
| Fine-tuning | Je een vast gedrag, toon of formaat wilt dat met prompten niet stabiel blijft, en je genoeg kwalitatieve voorbeelden hebt | Stabiel patroon, hogere kosten en moeite |

## Welke modellen kun je afstemmen

In Vertex AI doe je dit met supervised fine-tuning op een Gemini-basismodel. In de loop van 2026 zijn dat de Gemini 2.5-varianten Flash, Flash-Lite en Pro. Flash en Flash-Lite zijn meestal de logische keuze: ze zijn goedkoper om te draaien en voor de meeste afstemtaken ruim voldoende.

Let op dat het modelaanbod regelmatig verschuift. Controleer in de Google Cloud-documentatie welke modellen op dit moment afstembaar zijn en of een model een einddatum heeft, zodat je niet traint op een variant die kort daarna uitgefaseerd wordt. Afstemming voor de nieuwste Gemini-generatie kan beperkt of in preview zijn op het moment dat je dit leest.

:::warn title="Check de levensduur van je basismodel"
Train je op een model dat binnenkort wordt uitgefaseerd, dan moet je je werk opnieuw doen. Kies een basismodel met een ruime resterende levensduur en houd de aankondigingen in de Vertex AI-documentatie in de gaten.
:::

## Goede trainingsdata is alles

De kwaliteit van je fine-tuning staat of valt met je data. Je levert voorbeelden aan van invoer en het gewenste antwoord. Het model leert uit die paren. Slechte of inconsistente voorbeelden leren het model slecht gedrag, dus zorgvuldigheid loont enorm.

In Vertex AI lever je je dataset aan in JSONL-formaat, waarbij elke regel een afzonderlijk voorbeeld is met de invoer van de gebruiker en het gewenste antwoord. Je plaatst dat bestand in een Cloud Storage-bucket en wijst het tijdens de afstem-job aan.

Voor de hoeveelheid geldt: begin met ongeveer honderd zorgvuldige voorbeelden en schaal op naar enkele honderden of duizenden als de taak dat vraagt. Belangrijker dan aantal is consistentie. Honderd eenduidige voorbeelden verslaan duizend rommelige.

:::tip title="Laat je dataset controleren"
Laat je voorbeelden door een tweede persoon nakijken voordat je traint. Een dataset met tegenstrijdige antwoorden leert het model verwarrend gedrag dat je later moeilijk terugdraait.
:::

## De fine-tuning-job uitvoeren

Zodra je dataset klaar is, start je een afstem-job in Vertex AI, via de console, de Google Gen AI SDK of de REST-API. Je kiest het basismodel, wijst je trainingsdata in Cloud Storage aan en stelt enkele parameters in, zoals het aantal epochs. De job draait op Google-infrastructuur en levert een aangepast model op.

Na afloop test je het resultaat grondig. Vergelijk het aangepaste model met het origineel op testgevallen die je niet voor training hebt gebruikt. Zo zie je of de fine-tuning echt verbetert en niet alleen je trainingsdata napapegaait.

:::howto title="Zo draai je een afstem-job"
1. Stel een dataset samen met voorbeelden van invoer en gewenst antwoord.
2. Zet de voorbeelden om naar **JSONL** en upload het bestand naar een Cloud Storage-bucket.
3. Controleer de data op consistentie en fouten.
4. Start een afstem-job en kies het basismodel, bijvoorbeeld `gemini-2.5-flash`.
5. Stel trainingsparameters in, zoals het aantal epochs, en start de training.
6. Test het aangepaste model op aparte testgevallen.
7. Zet het model in productie als het aantoonbaar beter presteert.
:::

## Valkuilen vermijden

De grootste valkuil is overfitting: het model leert je voorbeelden uit het hoofd in plaats van het patroon erachter. Het lijkt dan perfect op je trainingsdata maar faalt op nieuwe gevallen. Een aparte testset helpt je dit op tijd te zien.

Een tweede valkuil is fine-tunen voor een probleem dat eigenlijk een datavraag is. Als je model verouderde feiten geeft na fine-tuning, los je dat niet op met meer training maar met een actuele kennisbron via grounding.

:::warn title="Haal gevoelige data uit je voorbeelden"
Trainingsdata kan gevoelige informatie bevatten die het model later kan reproduceren. Verwijder persoonsgegevens en vertrouwelijke informatie uit je voorbeelden, tenzij je governance dat uitdrukkelijk toestaat.
:::

## Kosten en beheer

Fine-tuning kost geld voor de training zelf en daarna voor het gebruik van het aangepaste model. Reken beide mee. Bij Gemini-modellen reken je voor de afstemtaak doorgaans af op basis van de verwerkte tokens, en daarna betaal je per gebruik van het afgestemde model. Schat vooraf in hoeveel je traint en hoe vaak je het model later aanroept.

Houd je aangepaste modellen overzichtelijk in het modelregister. Noteer welke dataset en welke instellingen tot welk model leidden, zodat je later kunt reproduceren of terugvallen op een eerdere versie.

:::faq
### Voegt fine-tuning kennis toe aan een model?
Beperkt. Het verandert vooral gedrag, toon en formaat. Voor actuele feiten gebruik je beter grounding of een kennisbank met RAG.

### Hoeveel voorbeelden heb ik nodig?
Begin met ongeveer honderd zorgvuldige voorbeelden en schaal op naar enkele honderden of duizenden als de taak dat vraagt. Consistentie weegt zwaarder dan pure hoeveelheid.

### In welk formaat lever ik mijn data aan?
In JSONL, waarbij elke regel een voorbeeld is met de invoer en het gewenste antwoord. Dat bestand zet je in een Cloud Storage-bucket en wijs je tijdens de afstem-job aan.

### Welke Gemini-modellen kan ik afstemmen?
In 2026 zijn dat de Gemini 2.5-varianten Flash, Flash-Lite en Pro. Het aanbod verandert geregeld, dus controleer de actuele documentatie en let op einddatums van modellen.

### Wat is overfitting?
Het model leert je voorbeelden uit het hoofd in plaats van het onderliggende patroon, waardoor het faalt op nieuwe gevallen. Een aparte testset onthult dit.

### Is fine-tuning altijd beter dan prompten?
Nee. Vaak is een goede prompt goedkoper en sneller. Stem pas af als prompten aantoonbaar tekortschiet voor een herhaalde taak.
:::

Fine-tuning is een krachtig maar gericht hulpmiddel. Gebruik het bewust voor stabiel gedrag dat prompten niet levert, met zorgvuldige data en een eerlijke test op nieuwe gevallen.