Naar inhoud
lightbulb Welkom op de nieuwe kennisbank | We hebben de docs volledig vernieuwd met meer dan 160 features. Bekijk wat nieuw isarrow_forward

Gemini via Vertex AI vs Google AI Studio

Kies tussen Google AI Studio (Gemini Developer API) en Vertex AI voor je Gemini-toepassing op basis van schaal, compliance en datalocatie, met de unified google-genai SDK.

Twee platforms voor Gemini

Google biedt Gemini aan via twee platforms met verschillende doelgroepen en mogelijkheden:

Google AI Studio en de Gemini Developer API: een webgebaseerde playground plus een API die je met een eenvoudige API-sleutel aanroept. Gericht op individuele ontwikkelaars, experimenten en startups. Er is een gratis tier met dagelijkse limieten.

Vertex AI: het enterprise AI-platform van Google Cloud. Gericht op bedrijven met compliance-vereisten, grote schaal, IAM-integratie en garanties op het gebied van privacy en beschikbaarheid. In 2026 wordt het generatieve AI-deel van Vertex AI door Google ook wel het Gemini Enterprise Agent Platform genoemd, maar de werkwijze en positionering blijven gelijk.

info

Belangrijk in 2026: de SDK is gewijzigd

De oude losse SDK's zijn niet meer ondersteund. google.generativeai (de Developer-API-SDK) is end of life sinds 30 november 2025, en de generatieve modules van de Vertex AI SDK (vertexai.generative_models) zijn per 24 juni 2026 verwijderd. De enige ondersteunde route is de unified google-genai SDK, die met één Client zowel de Developer API als Vertex AI aanstuurt. Alle codevoorbeelden hieronder gebruiken die nieuwe SDK.

Vergelijking op functionaliteit

Functie AI Studio / Developer API Vertex AI
Authenticatie API-sleutel Google Cloud IAM / service accounts
Gratis tier Ja (dagelijkse limieten) Nee (pay-as-you-go)
Dataresidency Globaal (VS-gedomineerd) Regiokeuze (incl. EU)
SLA Geen formele SLA Formele SLA op beschikbaarheid
Gebruik van data voor training Mogelijk, afhankelijk van instellingen Nee
VPC Service Controls Nee Ja
CMEK (eigen sleutels) Nee Ja
Context caching Ja Ja
Fine-tuning Beperkt Uitgebreid
Batch-voorspelling Beperkt Ja
Grounding met Google Search Ja Ja
Model Garden (ook Llama, Mistral) Nee Ja
Support Community en forums Enterprise support

Wanneer kies je AI Studio en de Developer API

Kies de Developer API als:

  • Je experimenteert of een prototype bouwt.
  • Je team klein is (1 tot 5 ontwikkelaars).
  • Je geen harde compliance-eisen hebt en verwerking buiten de EU is toegestaan.
  • Je wilt starten zonder Google Cloud billing-setup.
  • Je budget beperkt is en de gratis tier voldoende is.
from google import genai
from google.genai import types
import os

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Hallo wereld",
)
print(response.text)

Wanneer kies je Vertex AI

Kies Vertex AI als:

  • Je werkt met persoonsgegevens of vertrouwelijke bedrijfsinformatie.
  • Je AVG-compliance nodig hebt met data in een EU-regio.
  • Je SLA-garanties en enterprise support nodig hebt.
  • Je grote volumes verwerkt en voorspelbare capaciteit wilt.
  • Je integratie met andere Google Cloud-services nodig hebt.
  • Je fine-tuning op grote schaal wilt.
from google import genai

client = genai.Client(
    vertexai=True,
    project="mijn-project",
    location="europe-west4",
)

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Hallo wereld",
)
print(response.text)
lightbulb

Schrijf code die makkelijk overstapt

Start gerust op AI Studio, maar bouw je code zo dat de overstap naar Vertex AI alleen de client-initialisatie raakt. Met de unified google-genai SDK is dat al grotendeels het geval: de aanroepen op client.models zijn identiek, alleen het aanmaken van de Client verschilt.

Migratie van Developer API naar Vertex AI

Met de unified SDK is de migratie minimaal. Je houdt dezelfde modelaanroepen en wisselt alleen hoe je de client initialiseert.

Developer API (API-sleutel):

from google import genai

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Hallo",
)
print(response.text)

Vertex AI (project en regio):

from google import genai

client = genai.Client(
    vertexai=True,
    project="mijn-project",
    location="europe-west4",
)

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Hallo",
)
print(response.text)

In plaats van de argumenten in code kun je de client ook volledig via omgevingsvariabelen sturen: zet GOOGLE_GENAI_USE_VERTEXAI, GOOGLE_CLOUD_PROJECT en GOOGLE_CLOUD_LOCATION, en roep dan genai.Client() zonder argumenten aan. Zo blijft je code identiek tussen omgevingen.

Eén abstractielaag voor beide platforms

Wil je de keuze expliciet in configuratie zetten, dan volstaat een kleine helper die de juiste Client opbouwt:

import os
from enum import Enum
from typing import Optional
from google import genai


class GeminiPlatform(Enum):
    DEVELOPER = "developer"
    VERTEX = "vertex"


def create_gemini_client(platform: Optional[GeminiPlatform] = None) -> genai.Client:
    if platform is None:
        platform = (
            GeminiPlatform.VERTEX
            if os.environ.get("GOOGLE_CLOUD_PROJECT")
            else GeminiPlatform.DEVELOPER
        )

    if platform == GeminiPlatform.DEVELOPER:
        return genai.Client(api_key=os.environ["GEMINI_API_KEY"])

    return genai.Client(
        vertexai=True,
        project=os.environ["GOOGLE_CLOUD_PROJECT"],
        location=os.environ.get("GOOGLE_CLOUD_LOCATION", "europe-west4"),
    )

Een system instruction geef je per aanroep mee via de config, los van het platform:

from google.genai import types

client = create_gemini_client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Vat dit samen in één zin.",
    config=types.GenerateContentConfig(
        system_instruction="Je antwoordt altijd in het Nederlands.",
        temperature=0.2,
    ),
)
print(response.text)

Modellen en kosten vergelijken

De prijzen voor de Developer API en Vertex AI zijn voor dezelfde modellen in de praktijk gelijk. Vertex AI voegt enterprise-features toe zonder een wezenlijk hoger tarief per token. Onderstaande tarieven gelden voor de standaard pay-as-you-go laag in juni 2026 en kunnen veranderen, controleer dus altijd de officiële prijspagina.

Model Input (per 1M tokens) Output (per 1M tokens)
gemini-3.5-flash $1,50 $9,00
gemini-3.1-flash-lite $0,25 $1,50
gemini-2.5-flash $0,30 $2,50
gemini-2.5-pro $1,25 $10,00

Voor grounding met Google Search rekent Google bij de Gemini 3-modellen een vrij quotum van 5.000 prompts per maand (gedeeld over de Gemini 3-familie), daarna ongeveer $14 per 1.000 zoekopdrachten. Bij de 2.5-modellen geldt een gratis dagquotum, daarna ongeveer $35 per 1.000 grounded prompts.

warning

Let op met dataresidency en de gratis tier

De gratis tier van de Developer API kan invoer gebruiken om diensten te verbeteren, afhankelijk van je accountinstellingen, en biedt geen keuze van datalocatie. Verwerk daarom geen persoonsgegevens of vertrouwelijke bedrijfsdata via de gratis tier. Voor AVG-gevoelige toepassingen kies je Vertex AI in een EU-regio zoals europe-west4.

Welke moet je nu kiezen

In de praktijk werkt deze vuistregel goed:

  • Prototype, hobbyproject of interne tool zonder persoonsgegevens: Developer API met de gratis tier.
  • Productie-app met klantdata, EU-eisen of een SLA: Vertex AI in een EU-regio.
  • Twijfel je nog: begin op de Developer API en houd je code platform-onafhankelijk, zodat je later zonder grote herschrijving naar Vertex AI overstapt.
Welke SDK moet ik in 2026 gebruiken voor Gemini?

Gebruik de unified google-genai SDK, te installeren met pip install google-genai en te importeren met from google import genai. De oude pakketten google-generativeai (Developer API) en de generatieve modules van vertexai zijn niet meer ondersteund en in 2026 verwijderd. Dezelfde unified SDK stuurt zowel de Developer API als Vertex AI aan.

Kan ik mijn Developer-API-code draaien in Cloud Functions of Cloud Run?

Ja. In Google Cloud is Vertex AI meestal de logische keuze omdat je dan via het service account authenticeert zonder API-sleutel te beheren. Je zet vertexai=True op de client, of je gebruikt de omgevingsvariabelen. De Developer API kan ook, met je API-sleutel als veilig opgeslagen omgevingsvariabele.

Heeft Vertex AI toegang tot dezelfde modellen als AI Studio?

Grotendeels wel, maar soms met een kleine vertraging. Nieuwe preview-modellen verschijnen vaak eerst in AI Studio en de Developer API, en komen daarna naar Vertex AI. Stabiele, algemeen beschikbare modellen zoals gemini-3.5-flash zijn op beide platforms te gebruiken.

Welk Gemini-model gebruik ik als standaard?

gemini-3.5-flash is in juni 2026 het stabiele standaardmodel voor de meeste toepassingen door de goede balans tussen snelheid, kosten en kwaliteit. Heb je extreem lage kosten nodig, kijk dan naar gemini-3.1-flash-lite. Voor de zwaarste redeneer- en codeertaken kijk je naar de Pro-lijn, die deels nog als preview wordt uitgerold.

Kan ik AI Studio en de Developer API gebruiken voor een AVG-conforme applicatie?

Alleen als je met Google de juiste verwerkersovereenkomst hebt en de configuratie aantoonbaar aan je AVG-vereisten voldoet. Voor B2B-toepassingen met EU-persoonsgegevens is Vertex AI in een EU-regio doorgaans de veiligere en beter aantoonbare keuze, met regiokeuze, CMEK en VPC Service Controls.

Verandert mijn code als ik later van Developer API naar Vertex AI overstap?

Met de unified SDK nauwelijks. De aanroepen op client.models.generate_content blijven identiek. Alleen het aanmaken van de Client verschilt, en zelfs dat kun je via omgevingsvariabelen sturen zodat dezelfde code in beide omgevingen werkt.