Google представя Gemini Omni – мултимоделен модел за създаване и редактиране на видео чрез разговор

Google представя Gemini Omni – мултимоделен модел за създаване и редактиране на видео чрез разговор
Google обяви новия си мултимодален модел Gemini Omni, който комбинира текст, изображения, аудио и видео, за да създава и редактира видеоклипове чрез лесен разговорен интерфейс. Първата му версия, Omni Flash, демонстрира възможностите на технологията.
Google представи своя нов мултимодален модел Gemini Omni, който интегрира обработка на текст, изображения, аудио и видео с цел създаване и редактиране на видео материали. Технологията позволява на потребителите да генерират и модифицират видеоклипове чрез обикновен разговор, което значително опростява процеса на видео продукция. Първата версия на модела, наречена Omni Flash, вече демонстрира потенциала на системата в различни приложения, като създаване на съдържание и интерактивни медии. Gemini Omni бележи значителен напредък в областта на изкуствения интелект, като комбинира различни видове данни и позволява по-интуитивна и гъвкава работа с мултимедийни формати.

Тази статия е автоматично обобщена и структурирана от AI News Tech въз основа на публично достъпни технологични източници.

Източници

Видео по темата

Gemini on MacOS demo
Gemini on MacOS demo The Verge
Google annouces Gemini 2.5 Pro-powered “Stitch” experiment
Google annouces Gemini 2.5 Pro-powered “Stitch” experiment The Verge
Would you let robots spend your money?
Would you let robots spend your money? The Verge
New Google Search feature will create "super apps"
New Google Search feature will create "super apps" The Verge