Twee platforms voor Gemini
Google biedt Gemini aan via twee platforms met verschillende doelgroepen en mogelijkheden:
Google AI Studio en de Gemini Developer API: een webgebaseerde playground plus een API die je met een eenvoudige API-sleutel aanroept. Gericht op individuele ontwikkelaars, experimenten en startups. Er is een gratis tier met dagelijkse limieten.
Vertex AI: het enterprise AI-platform van Google Cloud. Gericht op bedrijven met compliance-vereisten, grote schaal, IAM-integratie en garanties op het gebied van privacy en beschikbaarheid. In 2026 wordt het generatieve AI-deel van Vertex AI door Google ook wel het Gemini Enterprise Agent Platform genoemd, maar de werkwijze en positionering blijven gelijk.
Belangrijk in 2026: de SDK is gewijzigd
De oude losse SDK's zijn niet meer ondersteund. google.generativeai (de Developer-API-SDK) is end of life sinds 30 november 2025, en de generatieve modules van de Vertex AI SDK (vertexai.generative_models) zijn per 24 juni 2026 verwijderd. De enige ondersteunde route is de unified google-genai SDK, die met één Client zowel de Developer API als Vertex AI aanstuurt. Alle codevoorbeelden hieronder gebruiken die nieuwe SDK.
Vergelijking op functionaliteit
| Functie | AI Studio / Developer API | Vertex AI |
|---|---|---|
| Authenticatie | API-sleutel | Google Cloud IAM / service accounts |
| Gratis tier | Ja (dagelijkse limieten) | Nee (pay-as-you-go) |
| Dataresidency | Globaal (VS-gedomineerd) | Regiokeuze (incl. EU) |
| SLA | Geen formele SLA | Formele SLA op beschikbaarheid |
| Gebruik van data voor training | Mogelijk, afhankelijk van instellingen | Nee |
| VPC Service Controls | Nee | Ja |
| CMEK (eigen sleutels) | Nee | Ja |
| Context caching | Ja | Ja |
| Fine-tuning | Beperkt | Uitgebreid |
| Batch-voorspelling | Beperkt | Ja |
| Grounding met Google Search | Ja | Ja |
| Model Garden (ook Llama, Mistral) | Nee | Ja |
| Support | Community en forums | Enterprise support |
Wanneer kies je AI Studio en de Developer API
Kies de Developer API als:
- Je experimenteert of een prototype bouwt.
- Je team klein is (1 tot 5 ontwikkelaars).
- Je geen harde compliance-eisen hebt en verwerking buiten de EU is toegestaan.
- Je wilt starten zonder Google Cloud billing-setup.
- Je budget beperkt is en de gratis tier voldoende is.
from google import genai
from google.genai import types
import os
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Hallo wereld",
)
print(response.text)
Wanneer kies je Vertex AI
Kies Vertex AI als:
- Je werkt met persoonsgegevens of vertrouwelijke bedrijfsinformatie.
- Je AVG-compliance nodig hebt met data in een EU-regio.
- Je SLA-garanties en enterprise support nodig hebt.
- Je grote volumes verwerkt en voorspelbare capaciteit wilt.
- Je integratie met andere Google Cloud-services nodig hebt.
- Je fine-tuning op grote schaal wilt.
from google import genai
client = genai.Client(
vertexai=True,
project="mijn-project",
location="europe-west4",
)
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Hallo wereld",
)
print(response.text)
Schrijf code die makkelijk overstapt
Start gerust op AI Studio, maar bouw je code zo dat de overstap naar Vertex AI alleen de client-initialisatie raakt. Met de unified google-genai SDK is dat al grotendeels het geval: de aanroepen op client.models zijn identiek, alleen het aanmaken van de Client verschilt.
Migratie van Developer API naar Vertex AI
Met de unified SDK is de migratie minimaal. Je houdt dezelfde modelaanroepen en wisselt alleen hoe je de client initialiseert.
Developer API (API-sleutel):
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Hallo",
)
print(response.text)
Vertex AI (project en regio):
from google import genai
client = genai.Client(
vertexai=True,
project="mijn-project",
location="europe-west4",
)
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Hallo",
)
print(response.text)
In plaats van de argumenten in code kun je de client ook volledig via omgevingsvariabelen sturen: zet GOOGLE_GENAI_USE_VERTEXAI, GOOGLE_CLOUD_PROJECT en GOOGLE_CLOUD_LOCATION, en roep dan genai.Client() zonder argumenten aan. Zo blijft je code identiek tussen omgevingen.
Eén abstractielaag voor beide platforms
Wil je de keuze expliciet in configuratie zetten, dan volstaat een kleine helper die de juiste Client opbouwt:
import os
from enum import Enum
from typing import Optional
from google import genai
class GeminiPlatform(Enum):
DEVELOPER = "developer"
VERTEX = "vertex"
def create_gemini_client(platform: Optional[GeminiPlatform] = None) -> genai.Client:
if platform is None:
platform = (
GeminiPlatform.VERTEX
if os.environ.get("GOOGLE_CLOUD_PROJECT")
else GeminiPlatform.DEVELOPER
)
if platform == GeminiPlatform.DEVELOPER:
return genai.Client(api_key=os.environ["GEMINI_API_KEY"])
return genai.Client(
vertexai=True,
project=os.environ["GOOGLE_CLOUD_PROJECT"],
location=os.environ.get("GOOGLE_CLOUD_LOCATION", "europe-west4"),
)
Een system instruction geef je per aanroep mee via de config, los van het platform:
from google.genai import types
client = create_gemini_client()
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Vat dit samen in één zin.",
config=types.GenerateContentConfig(
system_instruction="Je antwoordt altijd in het Nederlands.",
temperature=0.2,
),
)
print(response.text)
Modellen en kosten vergelijken
De prijzen voor de Developer API en Vertex AI zijn voor dezelfde modellen in de praktijk gelijk. Vertex AI voegt enterprise-features toe zonder een wezenlijk hoger tarief per token. Onderstaande tarieven gelden voor de standaard pay-as-you-go laag in juni 2026 en kunnen veranderen, controleer dus altijd de officiële prijspagina.
| Model | Input (per 1M tokens) | Output (per 1M tokens) |
|---|---|---|
| gemini-3.5-flash | $1,50 | $9,00 |
| gemini-3.1-flash-lite | $0,25 | $1,50 |
| gemini-2.5-flash | $0,30 | $2,50 |
| gemini-2.5-pro | $1,25 | $10,00 |
Voor grounding met Google Search rekent Google bij de Gemini 3-modellen een vrij quotum van 5.000 prompts per maand (gedeeld over de Gemini 3-familie), daarna ongeveer $14 per 1.000 zoekopdrachten. Bij de 2.5-modellen geldt een gratis dagquotum, daarna ongeveer $35 per 1.000 grounded prompts.
Let op met dataresidency en de gratis tier
De gratis tier van de Developer API kan invoer gebruiken om diensten te verbeteren, afhankelijk van je accountinstellingen, en biedt geen keuze van datalocatie. Verwerk daarom geen persoonsgegevens of vertrouwelijke bedrijfsdata via de gratis tier. Voor AVG-gevoelige toepassingen kies je Vertex AI in een EU-regio zoals europe-west4.
Welke moet je nu kiezen
In de praktijk werkt deze vuistregel goed:
- Prototype, hobbyproject of interne tool zonder persoonsgegevens: Developer API met de gratis tier.
- Productie-app met klantdata, EU-eisen of een SLA: Vertex AI in een EU-regio.
- Twijfel je nog: begin op de Developer API en houd je code platform-onafhankelijk, zodat je later zonder grote herschrijving naar Vertex AI overstapt.
Welke SDK moet ik in 2026 gebruiken voor Gemini?
Gebruik de unified google-genai SDK, te installeren met pip install google-genai en te importeren met from google import genai. De oude pakketten google-generativeai (Developer API) en de generatieve modules van vertexai zijn niet meer ondersteund en in 2026 verwijderd. Dezelfde unified SDK stuurt zowel de Developer API als Vertex AI aan.
Kan ik mijn Developer-API-code draaien in Cloud Functions of Cloud Run?
Ja. In Google Cloud is Vertex AI meestal de logische keuze omdat je dan via het service account authenticeert zonder API-sleutel te beheren. Je zet vertexai=True op de client, of je gebruikt de omgevingsvariabelen. De Developer API kan ook, met je API-sleutel als veilig opgeslagen omgevingsvariabele.
Heeft Vertex AI toegang tot dezelfde modellen als AI Studio?
Grotendeels wel, maar soms met een kleine vertraging. Nieuwe preview-modellen verschijnen vaak eerst in AI Studio en de Developer API, en komen daarna naar Vertex AI. Stabiele, algemeen beschikbare modellen zoals gemini-3.5-flash zijn op beide platforms te gebruiken.
Welk Gemini-model gebruik ik als standaard?
gemini-3.5-flash is in juni 2026 het stabiele standaardmodel voor de meeste toepassingen door de goede balans tussen snelheid, kosten en kwaliteit. Heb je extreem lage kosten nodig, kijk dan naar gemini-3.1-flash-lite. Voor de zwaarste redeneer- en codeertaken kijk je naar de Pro-lijn, die deels nog als preview wordt uitgerold.
Kan ik AI Studio en de Developer API gebruiken voor een AVG-conforme applicatie?
Alleen als je met Google de juiste verwerkersovereenkomst hebt en de configuratie aantoonbaar aan je AVG-vereisten voldoet. Voor B2B-toepassingen met EU-persoonsgegevens is Vertex AI in een EU-regio doorgaans de veiligere en beter aantoonbare keuze, met regiokeuze, CMEK en VPC Service Controls.
Verandert mijn code als ik later van Developer API naar Vertex AI overstap?
Met de unified SDK nauwelijks. De aanroepen op client.models.generate_content blijven identiek. Alleen het aanmaken van de Client verschilt, en zelfs dat kun je via omgevingsvariabelen sturen zodat dezelfde code in beide omgevingen werkt.