Nyhetsrapport
November 08, 2022

Google introducerar sin nya AI-modell för att skapa HD-video, med stöd av Imagen och Phenaki

I korthet

Google presenterar en ny AI-modell för att skapa HD-video

AI-driven video kan hjälpa till att överbrygga klyftan mellan människor från olika kulturer

Googles nya AI-modell för att skapa HD-video är en spelomvandlare för branschen. Det är en djupinlärningsmodell som kan generera högupplösta videor från textinmatning. Detta är ett betydande framsteg inom området för videoskapande, eftersom det kommer att göra det möjligt för kreatörer att producera videor av mycket högre kvalitet utan behov av dyr utrustning eller timmar av mödosamt arbete.

Google introducerade nyligen sin nya AI-modell för att skapa HD-video
AI-modeller kan hjälpa människor att uttrycka sig i video

Du kan nu göra långa filmer med en eller flera textuppmaningar med hjälp av Googles nya AI-modell för HD-videoskapande, som kombinerar Google Imagen och Phenaki. En enorm språkmodell används av Phenaki, "en modell som kan realistisk videosyntes givet en sekvens av texttips", för att producera tokens över tid som AI:n sedan använder för att konstruera en lång sammanhängande historia.

Föreställ dig att manuset är uppdelat i prompter, den där neurala nätverk håller reda på deras uppkoppling, att ett andra neuralt nätverk skapar korta filmer och att AI:n sedan "redigerar" dem med långa bilder.

Med hjälp av video, bilder och design kan människor från alla kulturer kanske uttrycka sig på sätt som de tidigare inte kunde tack vare AI-drivet generativa modeller. Våra forskare har arbetat hårt för att skapa modeller som är bäst i branschen på att producera bilder som mänskliga bedömare föredrar framför de som produceras av andra modeller. Den senaste betydande utvecklingen inkluderar tillämpningen av vår diffusionsmodell till videosekvenser och skapandet av långa, sammanhängande filmer som svar på en rad textsignaler. Vi kan kombinera dessa metoder för att skapa video; idag tillhandahåller vi superupplösta bilder skapade av AI för första gången.

Jeff Dean,
Google Senior Fellow och SVP, Google Research

Modellen fungerar genom att först skapa en lågupplöst version av videon, som sedan uppskalas med hjälp av en specialiserad algoritm. Denna algoritm kan behålla detaljerna och skärpan i originalvideon samtidigt som den lägger till nya detaljer som inte fanns i den lågupplösta versionen.

Detta är en spännande utveckling för dem inom videoskapande industrin, och det kommer säkerligen att ha en stor inverkan på kvaliteten på videor som produceras i framtiden.

Läs relaterade inlägg:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

fler artiklar
Damir Yalalov
Damir Yalalov

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

Hot Stories
Gå med i vårt nyhetsbrev.
Senaste nytt

Maj 2024:s kryptogenombrott: Bitgert Coins triumf

by Gregory Pudovsky
Maj 06, 2024

Institutionell aptit växer mot Bitcoin ETFs mitt i volatilitet

Avslöjande genom 13F-anmälningar avslöjar anmärkningsvärda institutionella investerare som sysslar med Bitcoin ETF:er, vilket understryker en växande acceptans av ...

Lär dig mer

Straffdagen anländer: CZ:s öde hänger i balans när den amerikanska domstolen överväger DOJ:s vädjande

Changpeng Zhao är redo att dömas i en amerikansk domstol i Seattle i dag.

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Maj 2024:s kryptogenombrott: Bitgert Coins triumf
Nyhetsrapport
Maj 2024:s kryptogenombrott: Bitgert Coins triumf
Maj 6, 2024
Bitcoin Network överträffar 1B transaktioner, femton år efter lanseringen
Marknader Nyhetsrapport Teknologi
Bitcoin Network överträffar 1B transaktioner, femton år efter lanseringen
Maj 6, 2024
Injective går samman med AltLayer för att ge inEVM återupptagande säkerhet
Företag Nyhetsrapport Teknologi
Injective går samman med AltLayer för att ge inEVM återupptagande säkerhet
Maj 3, 2024
Masa samarbetar med Teller för att introducera MASA Lending Pool, möjliggör USDC-lån på basen
Marknader Nyhetsrapport Teknologi
Masa samarbetar med Teller för att introducera MASA Lending Pool, möjliggör USDC-lån på basen
Maj 3, 2024