Artikelen met tag «Vision AI»
3 artikelen gevonden.
- Multimodale prompts voor tekst en beeld Leer prompts schrijven die tekst en afbeeldingen combineren voor vision-AI-modellen zoals Gemini, Claude en GPT, met praktische voorbeelden voor documentanalyse en extractie. Prompts voor Specifieke Taken · 5 min lezen · 15 wkn
- Multimodale invoer met de Gemini API Stuur tekst, afbeeldingen, audio, video en PDF tegelijk naar de Gemini API en verwerk gecombineerde multimodale prompts in je Python-applicatie. Multimodale Invoer en Output · 7 min lezen · 15 wkn
- Afbeeldingen analyseren met Gemini Vision Gebruik Gemini Vision om afbeeldingen te beschrijven, objecten te detecteren, tekst te lezen (OCR) en visuele vragen te beantwoorden via de nieuwe google-genai SDK. Multimodale Invoer en Output · 6 min lezen · 15 wkn