Новински извештај
Октобар КСНУМКС, КСНУМКС

Гоогле превазилази Мета покретањем новог Тект-то-Видео АИ генератора, Имаген Видео 

Укратко

Гоогле Имаген Видео покушава да помогне видео-генератору да се претвори у апликације убице

Гуглу није требало дуго да одговори на Маке-а-Видео од Мета. Коришћењем текстуалног упита, Имаген Видео може произвести фантастичан видео. Резултати су огроман напредак у односу на стање технике упркос бројним недостацима.

У поређењу са Фацебоок-овим Тект-то-Видео АИ генератором Направи видео, резултати су приметно бољи. Међутим, ова стратегија је такође захтевала већи надзор. За разлику од Имаген Видео-а, где су микро радници напорно радили да анотирају филмове писаним описима, Маке-а-Сцене је користио неозначене видео записе за обуку.

Улазити у специфичности архитектуре је бесмислено; требало би да прочитате о томе у чланку ovde. Можемо само да потврдимо да се 16 кадрова прво генерише из уграђивања текста Т5 енкодера у резолуцији 48×24 са 3 фрејма у секунди, и да се то затим повећава бројним дифузионим моделима у коначни филм од 128 кадрова. при 1280×768 и 24 кадра у секунди.

Шта је Имаген Видео?

Имаген Видео је метода за креирање текстуалних условних видео записа на основу серије модела видео дифузије. Имаген Видео производи филмове високог квалитета од текстуална упутства комбиновањем основног модела видео продукције са серијом испреплетених просторних и временских видео модела супер-резолуције. Прегледајте тим за избор дизајна који је направио док је систем скалирао као високо-defiмодел текста у видео, укључујући одлуку да се в-параметризују модели дифузије и избор потпуно конволуционих модела временске и просторне супер-резолуције при специфичним резолуцијама. Поред тога, он валидира и примењује резултате из ранијег рада на производњи слика заснованој на дифузији у контексту видео генерисање. Видео модели се затим подвргавају прогресивној дестилацији са навођењем без класификатора за брзо узорковање високог квалитета.

Гоогле истраживачки тим тврди да систем прихвата текстуални опис и генерише филм од 16 кадрова при три кадра у секунди са резолуцијом од 24 пута 48 пиксела. Систем скалира и „предвиђа“ додатне кадрове, стварајући коначни видео са 128 кадрова при 24 кадра у секунди и резолуцијом од 720п (1280×768). Постоји 60 милиона парова слика-текст и 14 милиона парова видео-текста је коришћено за обуку Имаген Видео-а.

Имаген Видео Самплес

Чак и ако само зато што је коришћење вештачке интелигенције за прављење видеа брже и јефтиније, такве технологије ће се несумњиво користити свуда.

Заинтересовани сте за више читања? Ево неколико додатних тема које можете погледати:

Одрицање од одговорности

У складу са Смернице пројекта Труст, имајте на уму да информације дате на овој страници нису намењене и не треба да се тумаче као правни, порески, инвестициони, финансијски или било који други облик савета. Важно је да инвестирате само оно што можете приуштити да изгубите и да тражите независан финансијски савет ако сумњате. За додатне информације, предлажемо да погледате одредбе и услове, као и странице помоћи и подршке које пружа издавач или оглашивач. MetaversePost је посвећен тачном, непристрасном извештавању, али тржишни услови су подложни променама без претходне најаве.

О аутору

Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења. 

više чланака
Дамир Иалалов
Дамир Иалалов

Дамир је вођа тима, менаџер производа и уредник у Metaverse Post, покривајући теме као што су АИ/МЛ, АГИ, ЛЛМ, Метаверсе и Web3-сродна поља. Његови чланци привлаче огромну публику од преко милион корисника сваког месеца. Чини се да је стручњак са 10 година искуства у СЕО и дигиталном маркетингу. Дамир се помиње у Масхабле, Виред, Cointelegraph, Тхе Нев Иоркер, Инсиде.цом, Ентрепренеур, БеИнЦрипто и друге публикације. Путује између УАЕ, Турске, Русије и ЗНД као дигитални номад. Дамир је стекао диплому физике, за коју верује да му је дало вештине критичког размишљања које су му потребне да буде успешан у свету интернета који се стално мења. 

Hot Stories
Придружите се нашем билтену.
Најновије вести

Доге Френзи: Анализа недавног пораста вредности Догецоин-а (ДОГЕ)

Индустрија криптовалута се брзо шири, а мем кованице се припремају за значајан успон. Догецоин (ДОГЕ), ...

Знате више

Еволуција садржаја генерисаног вештачком интелигенцијом у метаверзуму

Појава генеративног АИ садржаја је један од најфасцинантнијих развоја у виртуелном окружењу...

Знате више
Придружите се нашој заједници иновативних технологија
Опширније
opširnije
Тигер Брокерс ће покренути трговање без провизије за Босера ХасхКеи, Цхина Ассет Манагемент и Харвест Спот крипто ЕТФ-ове
Posao tržišta Новински извештај
Тигер Брокерс ће покренути трговање без провизије за Босера ХасхКеи, Цхина Ассет Манагемент и Харвест Спот крипто ЕТФ-ове
Април КСНУМКС, КСНУМКС
Сцролл завршава Берноулли Маиннет надоградњу, предвиђа 10к смањење трошкова трансакције
Новински извештај технологија
Сцролл завршава Берноулли Маиннет надоградњу, предвиђа 10к смањење трошкова трансакције
Април КСНУМКС, КСНУМКС
ОККС Јумпстарт наводи Рунецоин, омогућава БТЦ улагање за зараду РУНЕ токена
tržišta Новински извештај технологија
ОККС Јумпстарт наводи Рунецоин, омогућава БТЦ улагање за зараду РУНЕ токена
Април КСНУМКС, КСНУМКС
Најбоље понуде ове недеље, велике инвестиције у вештачку интелигенцију, ИТ, Web3, и Црипто (22-26.04)
Дигест Posao tržišta технологија
Најбоље понуде ове недеље, велике инвестиције у вештачку интелигенцију, ИТ, Web3, и Црипто (22-26.04)
Април КСНУМКС, КСНУМКС
ЦРИПТОМЕРИА ЛАБС ПТЕ. ЛТД.