Google представи своя нов мултимодален модел Gemini Omni, който интегрира обработка на текст, изображения, аудио и видео с цел създаване и редактиране на видео материали. Технологията позволява на потребителите да генерират и модифицират видеоклипове чрез обикновен разговор, което значително опростява процеса на видео продукция. Първата версия на модела, наречена Omni Flash, вече демонстрира потенциала на системата в различни приложения, като създаване на съдържание и интерактивни медии. Gemini Omni бележи значителен напредък в областта на изкуствения интелект, като комбинира различни видове данни и позволява по-интуитивна и гъвкава работа с мултимедийни формати.
Google представя Gemini Omni – мултимоделен модел за създаване и редактиране на видео чрез разговор
Google обяви новия си мултимодален модел Gemini Omni, който комбинира текст, изображения, аудио и видео, за да създава и редактира видеоклипове чрез лесен разговорен интерфейс. Първата му версия, Omni Flash, демонстрира възможностите на технологията.
Тази статия е автоматично обобщена и структурирана от AI News Tech въз основа на публично достъпни технологични източници.