Naar inhoud
lightbulb Welkom op de nieuwe kennisbank | We hebben de docs volledig vernieuwd met meer dan 160 features. Bekijk wat nieuw isarrow_forward

Video genereren met Google Veo

Ontdek Google Veo 3.1: hoe je met een tekstprompt realistische video's met geluid genereert via Google Flow, de Gemini-app of de Gemini API.

Wat is Google Veo?

Google Veo is het tekst-naar-video-model van Google DeepMind. Je beschrijft een scène in woorden en Veo genereert een videoclip die bij die beschrijving past. Het model begrijpt camera-instructies (pan, zoom, tracking shot), cinematografische stijlen en tijdsverloop.

De huidige generatie is Veo 3.1. Het grote verschil met eerdere versies is dat Veo nu native geluid genereert: gesynchroniseerde dialoog, omgevingsgeluid en geluidseffecten worden direct mee aangemaakt, zonder dat je achteraf een aparte audiotrack hoeft toe te voegen. Standaardclips duren ongeveer acht seconden in resoluties tot 4K.

Veo staat naast Imagen in Googles AI-mediaportfolio. Waar Imagen stilstaande beelden maakt, genereert Veo bewegend beeld met tijdsconsistentie: objecten en personages bewegen realistisch en blijven visueel consistent door de clip heen.

info

Waar vind je Veo?

Veo 3.1 is beschikbaar in de Gemini-app, in Google Flow (Googles filmmaak-tool, de opvolger van VideoFX), in Google Vids, en voor ontwikkelaars via de Gemini API en Vertex AI. Volledige toegang tot Flow met hoge resoluties vraagt doorgaans een Google AI Pro- of Ultra-abonnement.

Hoe Veo werkt

Veo is getraind op grote hoeveelheden video met beschrijvende metadata. Het model leert de relatie tussen tekst en bewegend beeld: hoe een tracking shot eruitziet, hoe water beweegt, hoe een drone omhoogvliegt.

Bij generatie zet het model eerst je prompt om in een interne representatie van de scène. Daarna produceert het de video frame voor frame met tijdsconsistentie, en genereert het de bijbehorende audio gesynchroniseerd met het beeld. Veo 3.1 ondersteunt resoluties van 720p tot 4K en zowel liggende (16:9) als staande (9:16) formaten, handig voor YouTube Shorts en andere verticale platforms.

Eerste video genereren

De snelste manier om te starten is via de Gemini-app of via Google Flow. Hieronder de stappen voor Flow, dat de meeste creatieve controle biedt.

Zo genereer je je eerste clip in Google Flow

  1. Ga naar labs.google/flow en log in met je Google-account.
  2. Maak een nieuw project aan en kies bij de modelinstellingen Veo 3.1.
  3. Schrijf in het promptveld een duidelijke beschrijving van je scène (zie de tips hieronder).
  4. Kies het beeldformaat (16:9 of 9:16), de resolutie en eventueel een stijl.
  5. Klik op genereren. Veo verwerkt je aanvraag doorgaans in tientallen seconden en levert een of meerdere varianten.
  6. Bekijk het resultaat en klik op de downloadknop om de clip als MP4 op te slaan.

Een goede prompt schrijven

Wees concreet over wat je in beeld wilt. Beschrijf in elk geval:

  • Onderwerp en actie
  • Omgeving en achtergrond
  • Camerabeweging
  • Sfeer en belichting
  • Eventueel geluid (omgevingsgeluid, dialoog, muziekstijl)

Voorbeeld: "Een drone stijgt langzaam op vanuit een groen stadspark bij zonsopgang, warme gouden tinten, cinematografisch, wide angle, met zacht vogelgezang en wind op de achtergrond."

Camera-instructies gebruiken

Een van de krachtigste eigenschappen van Veo is de ondersteuning voor camera-instructies. Verwerk ze direct in je prompt. De belangrijkste:

  • Pan left/right: de camera beweegt horizontaal
  • Tilt up/down: de camera kantelt verticaal
  • Zoom in/out: de camera zoomt in of uit
  • Tracking shot: de camera volgt een bewegend onderwerp
  • Crane shot / drone shot: omhoog bewegend perspectief
  • Handheld: licht onrustig, documentaire stijl
  • Static shot: de camera staat stil

Voorbeeld: "Statische camera op een drukke markt, medium shot, overvloed aan kleuren en mensen, warme middagbelichting, met levendig marktrumoer."

Geluid en langere video's

Sinds Veo 3.1 genereert het model native geluid: gesynchroniseerde dialoog, geluidseffecten en omgevingsgeluid die bij het beeld passen. Je hoeft dus niet meer standaard een aparte audiostap in een editor uit te voeren, al blijft nabewerking handig als je een eigen muziektrack of voice-over wilt.

Standaardclips duren ongeveer acht seconden. Voor langere video's gebruik je scene-extensie (scene extension): Veo genereert een nieuwe clip die naadloos aansluit op het laatste deel van de vorige, zodat je een doorlopend verhaal van een minuut of langer kunt opbouwen met behoud van visuele en audioconsistentie.

lightbulb

Personages consistent houden

Met de functie Ingredients to Video in Veo 3.1 kun je een of meerdere referentiebeelden meegeven, zodat hetzelfde personage of object er over meerdere scènes hetzelfde uit blijft zien. Dat is ideaal als je een kort verhaal met een terugkerend karakter wilt maken. Je kunt ook een enkele afbeelding als startframe gebruiken (afbeelding-naar-video).

Wat Veo goed kan, en waar het beperkt is

Veo presteert sterk bij:

  • Landschappen en omgevingen (natuur, steden, interieurs)
  • Abstracte en sfeervolle scènes
  • Objecten in beweging (water, vuur, wind in bomen)
  • Drone- en luchtopnames
  • Cinematografische establishing shots
  • Korte scènes met gesynchroniseerd geluid en dialoog

Veo is beperkter bij:

  • Heel fijne menselijke gezichtsuitdrukkingen en subtiele bewegingen
  • Complexe scènes met veel personages tegelijk
  • Exacte, leesbare tekst in beeld
  • Lange, ononderbroken verhalen zonder scene-extensie
warning

Controleer de gebruiksvoorwaarden

Of je een gegenereerde video commercieel mag inzetten, hangt af van je abonnement en de actuele voorwaarden van Google. Lees vooraf de gebruiksvoorwaarden van de dienst die je gebruikt (Flow, Gemini of Vertex AI) en zet de video's nooit in voor misleidende of schadelijke doeleinden.

Veo versus traditionele videoproductie

Aspect Traditioneel Veo
Kosten Hoog (crew, locatie) Laag (abonnement of API-kosten)
Doorlooptijd Dagen tot weken Seconden tot minuten
Revisies Kostbaar Snel opnieuw genereren
Geluid Apart opnemen of inkopen Native gegenereerd
Menselijke controle Volledig Beperkt, sturen via prompt
Clipduur Vrij Circa 8 sec, langer via scene-extensie

SynthID en herkomst

Net als Imagen voorziet Veo gegenereerde video's automatisch van een SynthID-watermerk. Dit watermerk zit onzichtbaar ingebouwd in de videoframes en is detecteerbaar met de juiste tools. In de Gemini-app kun je bovendien een video uploaden en vragen of die met Google AI is gemaakt, wat helpt bij het herkennen van AI-gegenereerd materiaal.

Welke Veo-versie is nu actueel?

De huidige generatie is Veo 3.1, met daarnaast een kostenefficiëntere variant (Veo 3.1 Lite). Eerdere versies zoals Veo 2 maakten nog geen geluid en boden kortere, minder gedetailleerde clips.

Genereert Veo nu ook geluid?

Ja. Vanaf Veo 3.1 maakt het model native, gesynchroniseerd geluid aan, waaronder dialoog, geluidseffecten en omgevingsgeluid. Dat was bij de eerste Veo-versies nog niet het geval.

Hoe lang zijn Veo-clips?

Een standaardgeneratie duurt ongeveer acht seconden. Met scene-extensie sluit je nieuwe clips naadloos aan op de vorige en bouw je zo een video van een minuut of langer op.

In welke resoluties en formaten genereert Veo?

Veo 3.1 ondersteunt 720p, 1080p en 4K, in zowel liggend (16:9) als staand (9:16) formaat. Staand formaat is handig voor YouTube Shorts en vergelijkbare platforms.

Waar kan ik Veo gebruiken?

Via de Gemini-app, Google Flow, Google Vids, en voor ontwikkelaars via de Gemini API en Vertex AI. Volledige toegang met hoge resoluties vraagt doorgaans een Google AI Pro- of Ultra-abonnement.

Kan ik een afbeelding als startpunt gebruiken?

Ja. Veo ondersteunt afbeelding-naar-video, waarbij je een foto of een Imagen-afbeelding als beginframe meegeeft en Veo de beweging genereert. Met Ingredients to Video houd je personages over meerdere scènes consistent.