Model Garden in Vertex AI: welk model kies je?

Model Garden is de modelcatalogus van Vertex AI met meer dan 200 modellen. Leer hoe je per taak het juiste model kiest op kwaliteit, kosten en licentie.

schedule6 min lezen event1 Jun 2026 updateBijgewerkt 16 wkn

open_in_new data_object

Model Garden is het startpunt als je niet zelf een model wilt trainen. Het is een doorzoekbare catalogus binnen Vertex AI met inmiddels meer dan 200 modellen, gegroepeerd op wat ze kunnen. Je vergelijkt opties en zet met een paar klikken het model dat past achter een endpoint.

Het mooie is dat je niet hoeft te kiezen tussen alleen Google-modellen of alleen open modellen. Beide staan er, naast modellen van partners. Daardoor kun je per taak het beste gereedschap pakken in plaats van alles in een model te persen.

info

Nieuwe naam, zelfde catalogus

Sinds april 2026 valt Vertex AI onder het Gemini Enterprise Agent Platform. De functies, waaronder Model Garden, blijven bestaan onder dezelfde namen. In de documentatie en console-paden kom je de aanduiding Vertex AI nog volop tegen, dus laat je niet in de war brengen door de nieuwe merknaam.

Welke soorten modellen vind je

De catalogus is grofweg in te delen in drie groepen. Eerst de Google-modellen, met Gemini voor tekst, beeld, video en redeneren, plus gespecialiseerde modellen voor embeddings, vertaling of spraak. Dan de open modellen zoals Gemma en Llama die je vrij kunt draaien en aanpassen. En tot slot partner-modellen van andere aanbieders, zoals de Claude-modellen.

Per model zie je waar het goed in is, wat de licentievoorwaarden zijn en hoe je het inzet. Sommige modellen draai je via een gedeelde API, andere deploy je op je eigen infrastructuur.

lightbulb

Filter eerst op taak, niet op naam

Veel mensen zoeken meteen een bekend model, terwijl een kleiner gespecialiseerd model vaak goedkoper en sneller is voor een specifieke taak zoals classificatie of embeddings. Filter dus eerst op taak en pas daarna op naam.

Hoe kies je het juiste model

Begin altijd bij de taak. Wil je tekst genereren, dan kijk je naar generatieve taalmodellen. Wil je documenten doorzoeken, dan heb je een embeddingmodel nodig. Wil je beelden herkennen, dan zoek je in de visiemodellen.

Daarna weeg je drie dingen tegen elkaar af: kwaliteit, kosten en snelheid. Een groter model levert vaak betere antwoorden maar kost meer en is trager. Voor veel taken is een middelgroot model de beste balans.

Gebruik deze vuistregels om snel een richting te kiezen:

Groot Gemini-model (bijvoorbeeld Gemini 3.1 Pro): kies dit als kwaliteit en redeneervermogen voorop staan en het volume beperkt is.
Compact model (bijvoorbeeld een Flash-variant zoals Gemini 3 Flash): kies dit als je veel verzoeken per seconde hebt en de taak relatief eenvoudig is.
Open model (bijvoorbeeld Gemma): kies dit als je volledige controle over de infrastructuur en de gewichten wilt.
Gespecialiseerd model: kies dit voor afgebakende taken zoals embeddings, vertaling of spraak naar tekst.

warning

Modelnamen verouderen snel

Gemini-versies wisselen elkaar in hoog tempo af. Een model dat vandaag in preview staat, kan over een paar maanden de standaard zijn of juist uitgefaseerd worden. Controleer in de modelkaart altijd de actuele versie en de levenscyclus voordat je iets in productie vastlegt.

Een model deployen vanuit Model Garden

Heb je je keuze gemaakt, dan zet je het model live. Voor Google-modellen die via een API draaien hoef je vaak niets te deployen: je roept ze direct aan. Voor open modellen maak je een endpoint aan waarop het model draait op door jou gekozen hardware.

Zo deploy je een model vanuit Model Garden

Open Model Garden in de Vertex AI-console.
Filter op je taak, bijvoorbeeld tekstgeneratie of beeldherkenning.
Open de modelkaart en lees de licentie en de prijsinformatie.
Klik op Deploy om een eigen endpoint aan te maken, of open het model in de Studio om het eerst te testen.
Kies in het deploy-venster een regio en een machinetype per node.
Wacht tot het endpoint klaar is. Een deployment duurt doorgaans tien tot twintig minuten, afhankelijk van de modelgrootte en de gekozen hardware.

Voor zwaardere of gevoelige scenario's kun je sommige proprietary modellen tegenwoordig ook zelf binnen je eigen VPC draaien, met een commerciële licentie via Google Cloud Marketplace. Zo houd je de data binnen je eigen omgeving.

Let op licenties en kosten

Niet elk model mag je voor elk doel gebruiken. Open modellen hebben licenties die soms commercieel gebruik beperken of naamsvermelding eisen. Lees daarom altijd de modelkaart voordat je iets in productie zet.

Ook de kosten verschillen sterk. Modellen die je via een gedeelde API gebruikt reken je per token af. Modellen die je zelf deployt betaal je per draaiuur van de hardware, ook als er even geen verzoeken binnenkomen.

warning

Een endpoint kost geld zolang het draait

Een eigen endpoint blijft kosten maken zolang het actief is, ook zonder verkeer. Zet test-endpoints uit als je klaar bent, anders loopt de rekening op voor hardware die niets doet.

Van keuze naar productie

Zodra je een model hebt gekozen en getest, integreer je het in je toepassing. Voor generatieve taken gebruik je vaak de Gemini-API. Voor eigen endpoints roep je het endpoint aan met de juiste rechten. In beide gevallen regel je logging en monitoring zodat je weet hoe het model presteert.

Kost het gebruik van Model Garden zelf geld?

Nee, bladeren door de catalogus is gratis. Je betaalt pas zodra je een model aanroept of deployt.

Kan ik open modellen aanpassen?

Ja, veel open modellen zoals Gemma kun je fine-tunen op je eigen data en daarna op een eigen endpoint draaien.

Hoe weet ik welk model het goedkoopst is?

Elke modelkaart toont de prijsstructuur. Vergelijk de kosten per token of per draaiuur en reken door met je verwachte volume.

Welk model is het beste?

Er is geen beste model. Het hangt af van je taak, je budget en je eisen aan snelheid en kwaliteit. Test enkele kandidaten met je eigen data.

Wat is het verschil tussen een Pro- en een Flash-model?

Een Pro-model zoals Gemini 3.1 Pro mikt op de hoogste kwaliteit en het sterkste redeneervermogen. Een Flash-model is goedkoper en sneller en is bedoeld voor hoog volume en eenvoudiger taken.

Is Model Garden veranderd door de nieuwe platformnaam?

Nee. Vertex AI valt sinds april 2026 onder het Gemini Enterprise Agent Platform, maar Model Garden en de bijbehorende werkwijze blijven hetzelfde.

Model Garden bespaart je veel tijd doordat je niet zelf hoeft te trainen. Kies bewust, lees de licentie en test met je eigen data voordat je live gaat.

Welke soorten modellen vind je

Hoe kies je het juiste model

Een model deployen vanuit Model Garden

Let op licenties en kosten

Van keuze naar productie

Een model fine-tunen op Vertex AI

Vertex AI en de Gemini Enterprise Agent Platform: het AI-platform van Google Cloud

Gemini via Vertex AI gebruiken

Vertex AI versus Google AI Studio: wanneer gebruik je wat?

Batch-voorspellingen uitvoeren op Vertex AI