Naar inhoud
lightbulb Welkom op de nieuwe kennisbank | We hebben de docs volledig vernieuwd met meer dan 160 features. Bekijk wat nieuw isarrow_forward

Gemini via Vertex AI gebruiken

Leer hoe je de Gemini-modellen aanroept via Vertex AI, met de juiste rechten, regio, authenticatie en parameters voor productie.

Gemini is het multimodale vlaggenschipmodel van Google. Je kunt het op twee manieren benaderen: via Google AI Studio voor snel experimenteren, of via Vertex AI voor productie met enterprise-grip. Dit artikel gaat over de tweede route, waarbij je Gemini binnen je eigen Google Cloud-project draait.

Het verschil zit niet in het model zelf maar in de omgeving eromheen. Via Vertex AI krijg je IAM-rechten, auditlogs, regiokeuze en datagovernance. Dat maakt het de juiste keuze zodra je Gemini in een echte toepassing of bedrijfsproces inzet.

Voordat je begint

Je hebt een Google Cloud-project nodig met de Vertex AI API geactiveerd en facturering ingesteld. Verder regel je toegang via IAM. Voor een mens volstaat de rol Vertex AI User, voor een toepassing maak je een serviceaccount met diezelfde rol.

Kies ook bewust een regio. De regio bepaalt waar je verzoeken worden verwerkt en is belangrijk voor latency en voor naleving van regels rond dataverblijf. Voor Europese organisaties is een Europese regio vaak de logische keuze, bijvoorbeeld een regionaal endpoint in europe-west4 (Nederland) of het EU multi-region endpoint dat verzoeken binnen de EU houdt.

lightbulb

Apart serviceaccount per toepassing

Maak een apart serviceaccount per toepassing in plaats van een gedeelde sleutel voor alles. Zo kun je per toepassing rechten intrekken en zie je in de auditlogs precies welke toepassing welk verzoek deed.

Gemini aanroepen

Je roept Gemini aan via de Google Gen AI SDK (google-genai) of via een REST-verzoek. In beide gevallen geef je het model, de regio, je project en de inhoud van het verzoek mee. De inhoud kan tekst zijn, maar ook beelden, documenten of een combinatie daarvan.

Bij elk verzoek stel je parameters in die het gedrag sturen. De temperatuur bepaalt hoe creatief of voorspelbaar het antwoord is. De maximale lengte begrenst het antwoord. En met systeeminstructies geef je het model een rol of toon mee.

warning

Oude Vertex AI SDK wordt verwijderd

De oude generatieve modules van de vertexai-SDK (zoals vertexai.generative_models) zijn vervangen door de Google Gen AI SDK (google-genai). Start nieuwe projecten direct met google-genai en zet bestaande code over. De nieuwe SDK gebruikt een client-object in plaats van een globale vertexai.init().

Gemini aanroepen via Vertex AI

  1. Installeer de Google Gen AI SDK voor je taal, bijvoorbeeld pip install google-genai, of bereid een REST-aanroep voor.
  2. Authenticeer met een serviceaccount dat de rol Vertex AI User heeft.
  3. Stel project, regio en modelnaam in op de client.
  4. Stuur je prompt mee met parameters als temperature en de maximale lengte.
  5. Verwerk het antwoord en log het verzoek voor controle.

Multimodaal werken

Gemini kan meer dan tekst. Je stuurt een afbeelding mee en vraagt wat erop staat, je laat een document samenvatten of je combineert tekst en beeld in een vraag. Dat opent de deur naar toepassingen die met alleen tekst niet kunnen.

Denk aan een toepassing die schadeformulieren met foto's beoordeelt, of een assistent die grafieken uit een rapport uitlegt. Doordat het model verschillende invoertypes begrijpt, hoef je geen losse modellen aan elkaar te knopen.

info

Multimodaal kost extra tokens

Multimodale verzoeken kosten meer dan pure tekstverzoeken, omdat beelden en documenten als extra tokens meetellen. Reken dit mee in je kostenraming als je veel beelden verwerkt.

Parameters die ertoe doen

De temperatuur is de belangrijkste knop. Zet hem laag voor feitelijke, consistente antwoorden en hoger voor creatieve variatie. Voor zakelijke toepassingen kies je meestal een lage temperatuur.

Daarnaast helpen systeeminstructies enorm. Door het model vooraf te vertellen wie het is en hoe het moet antwoorden, krijg je veel consistenter resultaat dan wanneer je dat in elke prompt herhaalt. Combineer dit met grounding als je antwoorden aan echte bronnen wilt koppelen.

warning

Bescherm gevoelige data

Stuur geen gevoelige persoonsgegevens naar het model zonder dat je governance op orde is. Controleer welke data je verwerkt, of dat mag en hoe lang logs bewaard blijven. Beveiliging is hier geen bijzaak.

Van test naar productie

Begin met experimenteren in Google AI Studio, waar je prompts en parameters snel uitprobeert. Zodra een prompt werkt, giet je hem in code met vaste parameters en systeeminstructies. Voeg foutafhandeling toe voor gevallen waarin het model traag is of een verzoek wordt geweigerd.

In productie hoort monitoring erbij. Houd bij hoeveel verzoeken je doet, hoe lang ze duren en hoeveel ze kosten. Zo houd je grip op kwaliteit en budget.

Wat is het verschil tussen Gemini via AI Studio en via Vertex AI?

Het model is hetzelfde, maar Vertex AI geeft je enterprise-rechten, regiokeuze, auditlogs en datagovernance. AI Studio is sneller voor experimenten.

Welke SDK gebruik ik?

Gebruik de Google Gen AI SDK (google-genai). De oude generatieve modules van de vertexai-SDK zijn vervangen, dus start nieuwe code direct met google-genai.

Kan ik mijn regio kiezen?

Ja. Je kiest een regio per verzoek of per configuratie. Voor Europese data kun je een regionaal endpoint zoals europe-west4 gebruiken of het EU multi-region endpoint, wat belangrijk is voor latency en regels rond dataverblijf.

Hoe authenticeer ik vanuit een toepassing?

Met een serviceaccount dat de rol Vertex AI User heeft. Vermijd langlevende sleutels waar mogelijk en gebruik beheerde identiteiten of Application Default Credentials.

Worden mijn prompts gebruikt om het model te trainen?

Binnen Vertex AI worden je prompts standaard niet gebruikt voor training van de basismodellen. Controleer altijd de actuele voorwaarden voor jouw situatie.

Gemini via Vertex AI is de volwassen route voor productie. Je krijgt hetzelfde sterke model, maar met de controle, beveiliging en logging die een serieuze omgeving vraagt.