A Gemini már fotók alapján is képes videókat generálni

A Google Gemini elnevezésű mesterséges intelligenciájának Veo3 modellje fotók alapján is képes mozgóképeket előállítani, írja a The Washington Post.

A Google néhány hete vezette be a szöveges parancsok alapján történő videógenerálás lehetőségét, most pedig kiterjeszti ezt a funkciót: a mesterséges intelligencia most már fényképek alapján is képes videókat készíteni.

A Veo 3 modellen alapuló funkció a statikus képeket legtöbb nyolc másodperc hosszúságú, 720p felbontású MP4 formátumban mentett videókká képes átalakítani. A Gemini által generált klipekhez nemsokára hangot is hozzá lehet majd adni, például emberi hangokat, környezeti hanghatásokat vagy háttérzajokat, amelyeket a mesterséges intelligencia megfelelőnek ítél az adott mozgóképsor számára.

A képek alapján történő videógenerálási funkció egyelőre csak bizonyos régiókban és kizárólag az AI Ultra és Pro előfizetők számára érhető el.

Exit mobile version