Google introducerar sin nya AI-modell för att skapa HD-video, med stöd av Imagen och Phenaki
I korthet
Google presenterar en ny AI-modell för att skapa HD-video
AI-driven video kan hjälpa till att överbrygga klyftan mellan människor från olika kulturer
Googles nya AI-modell för att skapa HD-video är en spelomvandlare för branschen. Det är en djupinlärningsmodell som kan generera högupplösta videor från textinmatning. Detta är ett betydande framsteg inom området för videoskapande, eftersom det kommer att göra det möjligt för kreatörer att producera videor av mycket högre kvalitet utan behov av dyr utrustning eller timmar av mödosamt arbete.
Du kan nu göra långa filmer med en eller flera textuppmaningar med hjälp av Googles nya AI-modell för HD-videoskapande, som kombinerar Google Imagen och Phenaki. En enorm språkmodell används av Phenaki, "en modell som kan realistisk videosyntes givet en sekvens av texttips", för att producera tokens över tid som AI:n sedan använder för att konstruera en lång sammanhängande historia.
Föreställ dig att manuset är uppdelat i prompter, den där neurala nätverk håller reda på deras uppkoppling, att ett andra neuralt nätverk skapar korta filmer och att AI:n sedan "redigerar" dem med långa bilder.
Modellen fungerar genom att först skapa en lågupplöst version av videon, som sedan uppskalas med hjälp av en specialiserad algoritm. Denna algoritm kan behålla detaljerna och skärpan i originalvideon samtidigt som den lägger till nya detaljer som inte fanns i den lågupplösta versionen.
Detta är en spännande utveckling för dem inom videoskapande industrin, och det kommer säkerligen att ha en stor inverkan på kvaliteten på videor som produceras i framtiden.
Läs relaterade inlägg:
Villkor
I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.
Om författaren
Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.
fler artiklarDamir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.