Vision AI

Artikelen met tag «Vision AI»

3 artikelen gevonden.

Multimodale invoer met de Gemini API Stuur tekst, afbeeldingen, audio, video en PDF tegelijk naar de Gemini API en verwerk gecombineerde multimodale prompts in je Python-applicatie. Multimodale Invoer en Output · 7 min lezen · 5 uur
Afbeeldingen analyseren met Gemini Vision Gebruik Gemini Vision om afbeeldingen te beschrijven, objecten te detecteren, tekst te lezen (OCR) en visuele vragen te beantwoorden via de nieuwe google-genai SDK. Multimodale Invoer en Output · 6 min lezen · 5 uur
Multimodale prompts voor tekst en beeld Leer prompts schrijven die tekst en afbeeldingen combineren voor vision-AI-modellen zoals Gemini, Claude en GPT, met praktische voorbeelden voor documentanalyse en extractie. Prompts voor Specifieke Taken · 5 min lezen · 6 uur