Nieuwsverslag Technologie
06 december 2023

Google Research en de Universiteit van Tel Aviv ontwikkelen een AI-framework voor nauwkeurige beeldgeneratie

In het kort

Google Research en de Universiteit van Tel Aviv hebben AI ontwikkeld die tekst-naar-beeld-diffusie combineert met lensgeometrie voor beeldweergave.

Google Research en Universiteit van Tel Aviv onthullen AI-framework voor nauwkeurige beeldgeneratie

Google Research in samenwerking met Tel Aviv University, heeft een nieuw raamwerk voor kunstmatige intelligentie (AI) geïntroduceerd dat een tekst-naar-beeld-diffusiemodel combineert met gespecialiseerde lensgeometrie voor afbeelding weergave.

Deze integratie zorgt voor nauwkeurige controle over de weergavegeometrie, waardoor het gemakkelijker wordt om met behulp van één enkel diffusiemodel diverse visuele effecten te genereren, zoals fish-eye, panoramische weergaven en sferische texturen.

In een laatste research paperhebben wetenschappers de taak aangepakt om diverse optische bedieningselementen te integreren in tekst-naar-beeld-diffusiemodellen. Deze aanpak hield in dat het model rekening hield met de lokale lensgeometrie, waardoor het vermogen om ingewikkelde optische effecten te repliceren en realistisch ogende beelden te creëren werd vergroot.

In plaats van alleen maar de standaardvorm van afbeeldingen te veranderen, maakt deze methode vrijwel elke rastervervorming mogelijk door coördinatenconditionering per pixel. Deze innovatieve aanpak ondersteunt diverse toepassingen, zoals het genereren van panoramische scènes die een gevoel van aanwezigheid geven en sfeertextuur. 

Bovendien introduceert het raamwerk een veelvuldig geometriebewust raamwerk voor het genereren van beelden met metrische tensorconditionering. Dit biedt extra mogelijkheden voor het controleren en wijzigen van de manier waarop afbeeldingen worden gegenereerd, waardoor talloze mogelijkheden voor het maken en verfijnen van afbeeldingen worden onthuld.

Nauwkeurige beeldgeneratie door integratie van tekst-naar-beeld-diffusie

Het raamwerk integreert tekst-naar-afbeelding diffusiemodellen met specifieke lensgeometrie door coördinatenconditionering per pixel. De methode omvat het verfijnen van een vooraf getraind latent diffusiemodel door gebruik te maken van gegevens die zijn gegenereerd door de vervorming van beelden met willekeurige kromtrekkingsvelden.

Het herwegen van tokens werd geïmplementeerd in zelfaandachtslagen, waardoor de krommingseigenschappen konden worden gemanipuleerd en verschillende effecten konden worden verkregen, zoals visoog- en panoramische beelden. Deze aanpak gaat verder dan een vaste resolutie bij het genereren van beelden en omvat metrische tensorconditionering voor verbeterde controle.

Een revolutie in beeldmanipulatie

Het raamwerk breidt de mogelijkheden van beeldmanipulatie uit, waarbij uitdagingen worden aangepakt zoals het genereren van grote beelden en het aanpassen van de zelfaandachtsschalen in diffusiemodellen.

In feite integreert het raamwerk een tekst-naar-beeld diffusiemodel met specifieke lensgeometrie, waardoor een reeks visuele effecten mogelijk is, zoals fish-eye, panoramische weergaven en sferische texturen met behulp van één enkel model. Het biedt nauwgezette controle over de krommingseigenschappen en de weergavegeometrie, wat leidt tot het creëren van realistische en genuanceerde beelden.

De methode is getraind op een substantiële tekstueel geannoteerde dataset en per pixel kromtrekkende velden en produceert willekeurige kromgetrokken beelden met fijne, onvervormde resultaten die nauw aansluiten bij de doelgeometrie. Bovendien vergemakkelijkt het de ontwikkeling van bolvormige panorama's die worden gekenmerkt door realistische proporties en minimale artefacten.

Google Research en Universiteit van Tel Aviv onthullen AI-framework voor nauwkeurige beeldgeneratie

Het onlangs geïntroduceerde raamwerk, dat diverse lensgeometrieën integreert in de beeldweergave, biedt verbeterde controle over krommingseigenschappen en visuele effecten.

De onderzoekers stellen voor om deze aanpak uit te breiden om resultaten te bereiken die vergelijkbaar zijn met die van gespecialiseerde lenzen die verschillende scènes vastleggen. Door het potentiële gebruik van meer geavanceerde conditioneringstechnieken in overweging te nemen, voorziet het raamwerk in verbeterde beeldgeneratie en uitgebreide mogelijkheden.

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Alisa, een toegewijd journalist bij de MPost, is gespecialiseerd in cryptocurrency, zero-knowledge proofs, investeringen en het uitgebreide domein van Web3. Met een scherp oog voor opkomende trends en technologieën levert ze uitgebreide berichtgeving om lezers te informeren en te betrekken bij het steeds evoluerende landschap van digitale financiën.

Meer artikelen
Alisa Davidson
Alisa Davidson

Alisa, een toegewijd journalist bij de MPost, is gespecialiseerd in cryptocurrency, zero-knowledge proofs, investeringen en het uitgebreide domein van Web3. Met een scherp oog voor opkomende trends en technologieën levert ze uitgebreide berichtgeving om lezers te informeren en te betrekken bij het steeds evoluerende landschap van digitale financiën.

Hot Stories
Schrijf je in op onze nieuwsbrief.
Laatste Nieuws

Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid

Laten we initiatieven onderzoeken die het potentieel van digitale valuta voor goede doelen benutten.

Meer weten

AlphaFold 3, Med-Gemini en anderen: de manier waarop AI de gezondheidszorg transformeert in 2024

AI manifesteert zich op verschillende manieren in de gezondheidszorg, van het blootleggen van nieuwe genetische correlaties tot het versterken van robotchirurgische systemen...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Crypto Exchange Jupiter introduceert Jupiter Swap V3, Dynamic Slippage, naast andere belangrijke updates in de komende weken
markten Nieuwsverslag Technologie
Crypto Exchange Jupiter introduceert Jupiter Swap V3, Dynamic Slippage, naast andere belangrijke updates in de komende weken
14 June 2024
Polygon introduceert zijn governance-hub, die een uniforme, transparante interface biedt voor gemeenschapsbestuur
Nieuwsverslag Technologie
Polygon introduceert zijn governance-hub, die een uniforme, transparante interface biedt voor gemeenschapsbestuur 
14 June 2024
Binance registreert meer dan 30 miljoen nieuwe gebruikers in 2024, klantenactiva overschrijden de mijlpaal van $100 miljard
markten Nieuwsverslag Technologie
Binance registreert meer dan 30 miljoen nieuwe gebruikers in 2024, klantenactiva overschrijden de mijlpaal van $100 miljard
14 June 2024
Amazon ondersteunt generatieve AI-startups met een investering van $230 miljoen en wijst $80 miljoen toe aan zijn tweede AWS Generative AI Accelerator-programma
Business Nieuwsverslag Technologie
Amazon ondersteunt generatieve AI-startups met een investering van $230 miljoen en wijst $80 miljoen toe aan zijn tweede AWS Generative AI Accelerator-programma
14 June 2024