Naar inhoud
lightbulb Welkom op de nieuwe kennisbank | We hebben de docs volledig vernieuwd met meer dan 160 features. Bekijk wat nieuw isarrow_forward

Feature Store gebruiken in Vertex AI

Een Feature Store beheert de kenmerken die je modellen voeden op een centrale, consistente plek. Leer hoe het werkt in Vertex AI, dat draait op BigQuery.

Een model voorspelt op basis van kenmerken: de gemiddelde besteding van een klant, het aantal dagen sinds het laatste bezoek, de leeftijd van een account. Die kenmerken, in vakjargon features, moet je berekenen, opslaan en beschikbaar maken. Doe je dat per project opnieuw, dan ontstaat een wirwar van dubbel werk en inconsistenties. Een Feature Store lost dat op.

Een Feature Store is een centrale opslag- en beheerlaag voor je features. Je berekent een kenmerk een keer, bewaart het op een plek en hergebruikt het in elk model dat het nodig heeft. Belangrijker nog: hij zorgt dat een kenmerk tijdens training precies zo wordt berekend als in productie, wat een berucht probleem voorkomt.

In Vertex AI draait de Feature Store tegenwoordig op BigQuery. Je kenmerken blijven in BigQuery-tabellen die je al beheert, en de Feature Store legt daar een serveerlaag overheen voor realtime voorspellen. Je dupliceert je data dus niet en je leunt op de toegangscontrole en governance die je in BigQuery al hebt ingericht.

Het probleem dat het oplost

Het grootste probleem zonder Feature Store heet training-serving skew. Dat klinkt ingewikkeld maar is simpel: je berekent een kenmerk tijdens training net even anders dan in productie. Het model leerde op de ene definitie en krijgt in productie de andere, en presteert daardoor slechter dan verwacht, zonder dat je begrijpt waarom.

Een Feature Store voorkomt dit door een kenmerk op een plek en op een manier te definieren. Of het model nu traint of voorspelt, het krijgt het kenmerk uit dezelfde bron met dezelfde definitie. Die consistentie is goud waard en lastig zelf betrouwbaar te regelen.

info

Wat is training-serving skew?

Training-serving skew ontstaat als een kenmerk tijdens training anders wordt berekend dan tijdens het voorspellen in productie. Het model presteert dan onverklaarbaar slechter. Een Feature Store voorkomt dit door een enkele bron van waarheid voor elk kenmerk.

Hergebruik en consistentie

Naast consistentie biedt een Feature Store hergebruik. Een kenmerk als de totale besteding van een klant is nuttig voor meerdere modellen: een model dat opzeggers voorspelt, een dat aanbevelingen doet, een dat fraude opspoort. Zonder Feature Store berekent elk team dat kenmerk apart, vaak net iets anders. Met een Feature Store delen ze er een.

Dat scheelt niet alleen werk maar voorkomt ook verwarring. Als iedereen hetzelfde kenmerk uit dezelfde bron haalt, praat iedereen over hetzelfde. Een nieuw model bouwen wordt sneller, omdat veel bruikbare kenmerken al klaarliggen.

Zo richt je het stap voor stap in

  1. Bepaal welke kenmerken je modellen nodig hebben.
  2. Definieer elk kenmerk een keer met een duidelijke berekening, bijvoorbeeld als een kolom in een BigQuery-tabel.
  3. Registreer de tabel als bron in de Feature Store en stel een feature view samen.
  4. Sync de geselecteerde kenmerken naar de online serveerlaag.
  5. Haal kenmerken op uit de store tijdens training.
  6. Haal dezelfde kenmerken op uit de store tijdens voorspellen, en hergebruik bestaande kenmerken in nieuwe modellen.

Online en offline gebruik

Een Feature Store dient twee soorten gebruik. Voor training heb je vaak grote hoeveelheden historische kenmerkwaarden nodig, in een keer opgehaald. Voor realtime voorspellen heb je de actuele waarde van een kenmerk nodig, razendsnel, voor een enkele klant op het moment dat het ertoe doet.

In Vertex AI vult BigQuery de offline kant: daaruit haal je massaal historische data voor training. De online kant levert in milliseconden de actuele waarde voor een live voorspelling. Beide putten uit dezelfde definities, zodat consistentie gewaarborgd blijft.

De volgende tabel zet de twee gebruiksvormen naast elkaar.

Aspect Offline gebruik Online gebruik
Doel Een model trainen Een live voorspelling doen
Volume Grote hoeveelheden historie ineens Een enkele entiteit per keer
Snelheid Mag in batch Razendsnel, in milliseconden
Bron in Vertex AI BigQuery-tabellen Gesynchroniseerde serveerlaag
Definitie Gedeeld, identiek aan online Gedeeld, identiek aan offline
warning

Let op de online-serveerlaag die je kiest

Vertex AI kent twee online-serveeropties. De optimized online serving wordt afgebouwd: vanaf 17 mei 2026 komen er geen nieuwe functies meer bij en op 17 februari 2027 verdwijnt de API. Google adviseert Bigtable online serving, dat ook near-realtime continue synchronisatie ondersteunt. Controleer altijd de actuele Vertex AI release notes voordat je een nieuwe Feature Store inricht.

Wanneer een Feature Store loont

Een Feature Store voegt structuur en dus enige overhead toe. Voor een enkel klein model is dat misschien overkill. De waarde komt naar boven zodra je meerdere modellen hebt die kenmerken delen, of zodra je realtime voorspellingen doet waarbij consistentie tussen training en productie kritiek is.

Bij organisaties met serieuze ML-ambities wordt een Feature Store al snel onmisbaar. Hij tilt je van losse, per project berekende kenmerken naar een georganiseerde, herbruikbare basis. Dat is het verschil tussen ML als losse projecten en ML als volwassen capaciteit.

Gebruik deze vuistregels om te beslissen:

  • Gebruik een Feature Store als je meerdere modellen hebt die kenmerken delen, of als consistentie tussen training en productie kritiek is.
  • Sla het over voor een enkel klein, op zichzelf staand model waar de overhead niet opweegt tegen het gemak.
  • Bouw het vroeg op zodra je ML-werk groeit, zodat je niet later een wildgroei aan dubbel berekende kenmerken hoeft op te ruimen.

Beheer en kwaliteit

Een Feature Store is pas waardevol als de kenmerken erin betrouwbaar zijn. Houd de definities up-to-date en zorg dat de waarden actueel blijven. Een kenmerk dat niet meer ververst wordt, voedt je modellen met verouderde informatie, wat erger kan zijn dan helemaal geen kenmerk.

Documenteer ook wat elk kenmerk betekent en hoe het wordt berekend. Een collega die een kenmerk wil hergebruiken, moet kunnen vertrouwen dat het is wat de naam suggereert. Goede documentatie maakt het verschil tussen een handige gedeelde bron en een bron van misverstanden.

warning

Bewaak de versheid van je kenmerken

Een kenmerk in de Feature Store dat niet meer wordt ververst, voedt je modellen stilletjes met verouderde waarden. Bewaak de versheid van je kenmerken, want een stale feature is een onzichtbare bron van slechte voorspellingen.

Tot slot

Een Feature Store brengt orde in de kenmerken die je modellen voeden. Hij voorkomt training-serving skew, maakt kenmerken herbruikbaar en houdt definities consistent. Voor groeiende ML-organisaties is het de stille ruggengraat die losse projecten verbindt tot een samenhangend geheel.

Wat is een feature in deze context?

Een kenmerk dat een model als invoer gebruikt, zoals de gemiddelde besteding van een klant of het aantal dagen sinds het laatste bezoek.

Wat is training-serving skew?

Het probleem dat een kenmerk tijdens training anders wordt berekend dan in productie, waardoor het model onverklaarbaar slechter presteert. Een Feature Store voorkomt dit met een enkele bron van waarheid.

Waar slaat Vertex AI de kenmerken op?

De moderne Vertex AI Feature Store gebruikt BigQuery als offline opslag. Je kenmerken blijven in tabellen die je al beheert, en een online serveerlaag levert ze razendsnel voor realtime voorspellen.

Welke online-serveeroptie kies ik?

Bigtable online serving wordt aangeraden. De optimized online serving wordt afgebouwd en verdwijnt naar verwachting op 17 februari 2027. Check de actuele release notes voordat je iets inricht.

Wanneer heb ik een Feature Store nodig?

Zodra meerdere modellen kenmerken delen of consistentie tussen training en productie kritiek is. Voor een enkel klein model is het vaak overkill.

Wat is het risico van een verouderd kenmerk?

Een kenmerk dat niet meer ververst, voedt je modellen met oude data en geeft stilletjes slechte voorspellingen. Bewaak daarom de versheid.

Een Feature Store maakt van kenmerkbeheer een georganiseerde, betrouwbare capaciteit. Hij voorkomt skew, bevordert hergebruik en houdt definities consistent, en wordt onmisbaar zodra je ML-werk serieus groeit.