Google представя Gemini Omni – мултимоделен модел за създаване и редактиране на видео чрез разговор

Google представя Gemini Omni – мултимоделен модел за създаване и редактиране на видео чрез разговор
Google обяви новия си мултимодален модел Gemini Omni, който комбинира текст, изображения, аудио и видео, за да създава и редактира видеоклипове чрез лесен разговорен интерфейс. Първата му версия, Omni Flash, демонстрира възможностите на технологията.
Google представи своя нов мултимодален модел Gemini Omni, който интегрира обработка на текст, изображения, аудио и видео с цел създаване и редактиране на видео материали. Технологията позволява на потребителите да генерират и модифицират видеоклипове чрез обикновен разговор, което значително опростява процеса на видео продукция. Първата версия на модела, наречена Omni Flash, вече демонстрира потенциала на системата в различни приложения, като създаване на съдържание и интерактивни медии. Gemini Omni бележи значителен напредък в областта на изкуствения интелект, като комбинира различни видове данни и позволява по-интуитивна и гъвкава работа с мултимедийни формати.

Тази статия е автоматично обобщена и структурирана от AI News Tech въз основа на публично достъпни технологични източници.

Източници

Видео по темата

Sony Announces End of Physical Discs
Sony Announces End of Physical Discs Linus Tech Tips
Game Physics Just Got 170 Times Faster
Game Physics Just Got 170 Times Faster Two Minute Papers
MSI Trades Security for RGB
MSI Trades Security for RGB Gamers Nexus
The Best Car I've Ever Driven: McLaren W1
The Best Car I've Ever Driven: McLaren W1 Marques Brownlee