# Gemini via Vertex AI vs Google AI Studio

[[TOC]]

## Twee platforms voor Gemini

Google biedt Gemini aan via twee platforms met verschillende doelgroepen en mogelijkheden:

**Google AI Studio en de Gemini Developer API**: een webgebaseerde playground plus een API die je met een eenvoudige API-sleutel aanroept. Gericht op individuele ontwikkelaars, experimenten en startups. Er is een gratis tier met dagelijkse limieten.

**Vertex AI**: het enterprise AI-platform van Google Cloud. Gericht op bedrijven met compliance-vereisten, grote schaal, IAM-integratie en garanties op het gebied van privacy en beschikbaarheid. In 2026 wordt het generatieve AI-deel van Vertex AI door Google ook wel het Gemini Enterprise Agent Platform genoemd, maar de werkwijze en positionering blijven gelijk.

:::info title="Belangrijk in 2026: de SDK is gewijzigd"
De oude losse SDK's zijn niet meer ondersteund. `google.generativeai` (de Developer-API-SDK) is end of life sinds 30 november 2025, en de generatieve modules van de Vertex AI SDK (`vertexai.generative_models`) zijn per 24 juni 2026 verwijderd. De enige ondersteunde route is de unified `google-genai` SDK, die met één Client zowel de Developer API als Vertex AI aanstuurt. Alle codevoorbeelden hieronder gebruiken die nieuwe SDK.
:::

## Vergelijking op functionaliteit

| Functie | AI Studio / Developer API | Vertex AI |
|---|---|---|
| Authenticatie | API-sleutel | Google Cloud IAM / service accounts |
| Gratis tier | Ja (dagelijkse limieten) | Nee (pay-as-you-go) |
| Dataresidency | Globaal (VS-gedomineerd) | Regiokeuze (incl. EU) |
| SLA | Geen formele SLA | Formele SLA op beschikbaarheid |
| Gebruik van data voor training | Mogelijk, afhankelijk van instellingen | Nee |
| VPC Service Controls | Nee | Ja |
| CMEK (eigen sleutels) | Nee | Ja |
| Context caching | Ja | Ja |
| Fine-tuning | Beperkt | Uitgebreid |
| Batch-voorspelling | Beperkt | Ja |
| Grounding met Google Search | Ja | Ja |
| Model Garden (ook Llama, Mistral) | Nee | Ja |
| Support | Community en forums | Enterprise support |

## Wanneer kies je AI Studio en de Developer API

Kies de Developer API als:

- Je experimenteert of een prototype bouwt.
- Je team klein is (1 tot 5 ontwikkelaars).
- Je geen harde compliance-eisen hebt en verwerking buiten de EU is toegestaan.
- Je wilt starten zonder Google Cloud billing-setup.
- Je budget beperkt is en de gratis tier voldoende is.

```python
from google import genai
from google.genai import types
import os

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Hallo wereld",
)
print(response.text)
```

## Wanneer kies je Vertex AI

Kies Vertex AI als:

- Je werkt met persoonsgegevens of vertrouwelijke bedrijfsinformatie.
- Je AVG-compliance nodig hebt met data in een EU-regio.
- Je SLA-garanties en enterprise support nodig hebt.
- Je grote volumes verwerkt en voorspelbare capaciteit wilt.
- Je integratie met andere Google Cloud-services nodig hebt.
- Je fine-tuning op grote schaal wilt.

```python
from google import genai

client = genai.Client(
    vertexai=True,
    project="mijn-project",
    location="europe-west4",
)

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Hallo wereld",
)
print(response.text)
```

:::tip title="Schrijf code die makkelijk overstapt"
Start gerust op AI Studio, maar bouw je code zo dat de overstap naar Vertex AI alleen de client-initialisatie raakt. Met de unified `google-genai` SDK is dat al grotendeels het geval: de aanroepen op `client.models` zijn identiek, alleen het aanmaken van de `Client` verschilt.
:::

## Migratie van Developer API naar Vertex AI

Met de unified SDK is de migratie minimaal. Je houdt dezelfde modelaanroepen en wisselt alleen hoe je de client initialiseert.

**Developer API (API-sleutel):**

```python
from google import genai

client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Hallo",
)
print(response.text)
```

**Vertex AI (project en regio):**

```python
from google import genai

client = genai.Client(
    vertexai=True,
    project="mijn-project",
    location="europe-west4",
)

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Hallo",
)
print(response.text)
```

In plaats van de argumenten in code kun je de client ook volledig via omgevingsvariabelen sturen: zet `GOOGLE_GENAI_USE_VERTEXAI`, `GOOGLE_CLOUD_PROJECT` en `GOOGLE_CLOUD_LOCATION`, en roep dan `genai.Client()` zonder argumenten aan. Zo blijft je code identiek tussen omgevingen.

## Eén abstractielaag voor beide platforms

Wil je de keuze expliciet in configuratie zetten, dan volstaat een kleine helper die de juiste `Client` opbouwt:

```python
import os
from enum import Enum
from typing import Optional
from google import genai


class GeminiPlatform(Enum):
    DEVELOPER = "developer"
    VERTEX = "vertex"


def create_gemini_client(platform: Optional[GeminiPlatform] = None) -> genai.Client:
    if platform is None:
        platform = (
            GeminiPlatform.VERTEX
            if os.environ.get("GOOGLE_CLOUD_PROJECT")
            else GeminiPlatform.DEVELOPER
        )

    if platform == GeminiPlatform.DEVELOPER:
        return genai.Client(api_key=os.environ["GEMINI_API_KEY"])

    return genai.Client(
        vertexai=True,
        project=os.environ["GOOGLE_CLOUD_PROJECT"],
        location=os.environ.get("GOOGLE_CLOUD_LOCATION", "europe-west4"),
    )
```

Een system instruction geef je per aanroep mee via de config, los van het platform:

```python
from google.genai import types

client = create_gemini_client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Vat dit samen in één zin.",
    config=types.GenerateContentConfig(
        system_instruction="Je antwoordt altijd in het Nederlands.",
        temperature=0.2,
    ),
)
print(response.text)
```

## Modellen en kosten vergelijken

De prijzen voor de Developer API en Vertex AI zijn voor dezelfde modellen in de praktijk gelijk. Vertex AI voegt enterprise-features toe zonder een wezenlijk hoger tarief per token. Onderstaande tarieven gelden voor de standaard pay-as-you-go laag in juni 2026 en kunnen veranderen, controleer dus altijd de officiële prijspagina.

| Model | Input (per 1M tokens) | Output (per 1M tokens) |
|---|---|---|
| gemini-3.5-flash | $1,50 | $9,00 |
| gemini-3.1-flash-lite | $0,25 | $1,50 |
| gemini-2.5-flash | $0,30 | $2,50 |
| gemini-2.5-pro | $1,25 | $10,00 |

Voor grounding met Google Search rekent Google bij de Gemini 3-modellen een vrij quotum van 5.000 prompts per maand (gedeeld over de Gemini 3-familie), daarna ongeveer $14 per 1.000 zoekopdrachten. Bij de 2.5-modellen geldt een gratis dagquotum, daarna ongeveer $35 per 1.000 grounded prompts.

:::warn title="Let op met dataresidency en de gratis tier"
De gratis tier van de Developer API kan invoer gebruiken om diensten te verbeteren, afhankelijk van je accountinstellingen, en biedt geen keuze van datalocatie. Verwerk daarom geen persoonsgegevens of vertrouwelijke bedrijfsdata via de gratis tier. Voor AVG-gevoelige toepassingen kies je Vertex AI in een EU-regio zoals `europe-west4`.
:::

## Welke moet je nu kiezen

In de praktijk werkt deze vuistregel goed:

- Prototype, hobbyproject of interne tool zonder persoonsgegevens: Developer API met de gratis tier.
- Productie-app met klantdata, EU-eisen of een SLA: Vertex AI in een EU-regio.
- Twijfel je nog: begin op de Developer API en houd je code platform-onafhankelijk, zodat je later zonder grote herschrijving naar Vertex AI overstapt.

:::faq
### Welke SDK moet ik in 2026 gebruiken voor Gemini?
Gebruik de unified `google-genai` SDK, te installeren met `pip install google-genai` en te importeren met `from google import genai`. De oude pakketten `google-generativeai` (Developer API) en de generatieve modules van `vertexai` zijn niet meer ondersteund en in 2026 verwijderd. Dezelfde unified SDK stuurt zowel de Developer API als Vertex AI aan.

### Kan ik mijn Developer-API-code draaien in Cloud Functions of Cloud Run?
Ja. In Google Cloud is Vertex AI meestal de logische keuze omdat je dan via het service account authenticeert zonder API-sleutel te beheren. Je zet `vertexai=True` op de client, of je gebruikt de omgevingsvariabelen. De Developer API kan ook, met je API-sleutel als veilig opgeslagen omgevingsvariabele.

### Heeft Vertex AI toegang tot dezelfde modellen als AI Studio?
Grotendeels wel, maar soms met een kleine vertraging. Nieuwe preview-modellen verschijnen vaak eerst in AI Studio en de Developer API, en komen daarna naar Vertex AI. Stabiele, algemeen beschikbare modellen zoals `gemini-3.5-flash` zijn op beide platforms te gebruiken.

### Welk Gemini-model gebruik ik als standaard?
`gemini-3.5-flash` is in juni 2026 het stabiele standaardmodel voor de meeste toepassingen door de goede balans tussen snelheid, kosten en kwaliteit. Heb je extreem lage kosten nodig, kijk dan naar `gemini-3.1-flash-lite`. Voor de zwaarste redeneer- en codeertaken kijk je naar de Pro-lijn, die deels nog als preview wordt uitgerold.

### Kan ik AI Studio en de Developer API gebruiken voor een AVG-conforme applicatie?
Alleen als je met Google de juiste verwerkersovereenkomst hebt en de configuratie aantoonbaar aan je AVG-vereisten voldoet. Voor B2B-toepassingen met EU-persoonsgegevens is Vertex AI in een EU-regio doorgaans de veiligere en beter aantoonbare keuze, met regiokeuze, CMEK en VPC Service Controls.

### Verandert mijn code als ik later van Developer API naar Vertex AI overstap?
Met de unified SDK nauwelijks. De aanroepen op `client.models.generate_content` blijven identiek. Alleen het aanmaken van de `Client` verschilt, en zelfs dat kun je via omgevingsvariabelen sturen zodat dezelfde code in beide omgevingen werkt.
:::