Buletin de stiri Tehnologia
December 06, 2023

Google Research și Universitatea Tel Aviv dezvoltă un cadru AI pentru generarea de imagini precise

Pe scurt

Google Research și Universitatea Tel Aviv au dezvoltat AI care combină difuzarea text-la-imagine cu geometria lentilelor pentru redarea imaginii.

Google Research și Universitatea Tel Aviv dezvăluie un cadru AI pentru generarea de imagini de precizie

Google Research în colaborare cu Universitatea din Tel Aviv, a introdus un nou cadru de inteligență artificială (AI) care combină un model de difuzare text-la-imagine cu geometria lentilelor specializate pentru redarea imaginii.

Această integrare permite un control precis asupra geometriei de redare, facilitând generarea de efecte vizuale diverse, cum ar fi ochi de pește, vederi panoramice și texturare sferică folosind un singur model de difuzie.

Într-un ultim lucrare de cercetare, oamenii de știință au abordat sarcina de a încorpora diverse controale optice în modelele de difuzare text-la-imagine. Această abordare a implicat ca modelul să ia în considerare geometria lentilei locale, sporind capacitatea acestuia de a replica efecte optice complexe și de a crea imagini cu aspect realist.

În loc să modifice pur și simplu forma standard a imaginilor, această metodă permite practic orice deformare a grilei prin condiționarea coordonatelor per pixel. Această abordare inovatoare acceptă diverse aplicații, cum ar fi generarea de scene panoramice care conferă un sentiment de prezență și texturarea sferei. 

În plus, cadrul introduce un cadru multiplu de generare a imaginii conștient de geometrie cu condiționare metrică a tensorului. Aceasta oferă posibilități suplimentare de control și modificare a modului în care sunt generate imaginile, dezvăluind numeroase posibilități de creare și rafinare a imaginilor.

Generare precisă de imagini prin integrarea difuzării text-la-imagine

Cadrul se integrează text-to-image modele de difuzie cu geometrie specifică a lentilei prin condiționarea coordonatelor per pixel. Metoda implică rafinarea unui model de difuzie latentă pre-antrenat prin utilizarea datelor generate prin distorsiunea imaginilor cu câmpuri de deformare aleatoare.

Reponderarea jetoanelor a fost implementată în straturi de auto-atenție, permițând manipularea proprietăților de curbură și producând diferite efecte, cum ar fi ochi de pește și vederi panoramice. Această abordare depășește rezoluția fixă ​​în generarea de imagini și include condiționarea tensorului metric pentru un control îmbunătățit.

Revoluționând manipularea imaginilor

Cadrul extinde capacitățile de manipulare a imaginii, abordând provocări precum generarea de imagini mari și ajustarea scalelor de autoatenție în modelele de difuzie.

În mod eficient, cadrul integrează un model de difuzie text-imagine cu geometrie specifică a lentilei, permițând o serie de efecte vizuale, cum ar fi ochi de pește, vederi panoramice și texturare sferică folosind un singur model. Oferă un control meticulos asupra proprietăților de curbură și a geometriei de redare, ceea ce duce la crearea de imagini realiste și nuanțate.

Antrenată pe un set substanțial de date adnotate textual și pe câmpuri de deformare per pixel, metoda produce imagini deformate arbitrare cu rezultate fin nedistorsionate, aliniate îndeaproape cu geometria țintă. În plus, facilitează dezvoltarea unor panorame sferice caracterizate prin proporții realiste și artefacte minime.

Google Research și Universitatea Tel Aviv dezvăluie un cadru AI pentru generarea de imagini de precizie

Cadrul recent introdus, care integrează diverse geometrii de lentile în redarea imaginii, oferă un control îmbunătățit asupra proprietăților de curbură și a efectelor vizuale.

Cercetătorii sugerează extinderea acestei abordări pentru a obține rezultate comparabile cu lentilele specializate care surprind scene distincte. Luând în considerare utilizarea potențială a tehnicilor de condiționare mai avansate, cadrul prevede generarea de imagini îmbunătățită și capabilități extinse.

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Alisa, o jurnalistă dedicată la MPost, este specializată în criptomonede, dovezi fără cunoștințe, investiții și tărâmul expansiv al Web3. Cu un ochi aprofundat pentru tendințele și tehnologiile emergente, ea oferă o acoperire cuprinzătoare pentru a informa și a implica cititorii în peisajul în continuă evoluție al finanțelor digitale.

Mai multe articole
Alisa Davidson
Alisa Davidson

Alisa, o jurnalistă dedicată la MPost, este specializată în criptomonede, dovezi fără cunoștințe, investiții și tărâmul expansiv al Web3. Cu un ochi aprofundat pentru tendințele și tehnologiile emergente, ea oferă o acoperire cuprinzătoare pentru a informa și a implica cititorii în peisajul în continuă evoluție al finanțelor digitale.

Hot Stories
Alăturați-vă Newsletter-ului nostru.
Ultimele ştiri

De la Ripple la Big Green DAO: Cum contribuie proiectele de criptomonede la caritate

Să explorăm inițiativele care valorifică potențialul monedelor digitale pentru cauze caritabile.

Aflați mai multe

AlphaFold 3, Med-Gemini și alții: modul în care AI transformă asistența medicală în 2024

Inteligența artificială se manifestă în diferite moduri în asistența medicală, de la descoperirea de noi corelații genetice până la abilitarea sistemelor chirurgicale robotizate...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Perspective inovatoare: note cheie și panouri care au modelat viitorul blockchain la conferința Hack Seasons
Opinie Afaceri Stil de viață pieţe Software Tehnologia
Perspective inovatoare: note cheie și panouri care au modelat viitorul blockchain la conferința Hack Seasons
Iulie 12, 2024
Mantle lansează AI Fest, încurajând participanții să îndeplinească sarcini de la 1 milion MNT și fondul de recompense pentru proiectul ecosistemului
Stil de viață Buletin de stiri Tehnologia
Mantle lansează AI Fest, încurajând participanții să îndeplinească sarcini de la 1 milion MNT și fondul de recompense pentru proiectul ecosistemului
Iulie 12, 2024
Vitalik Buterin Despre viitorul Ethereum, scalabilitatea comunității cripto și altele
Opinie pieţe Software Tehnologia
Vitalik Buterin Despre viitorul Ethereum, scalabilitatea comunității cripto și altele
Iulie 12, 2024
Protocolul Solv lansează a doua fază a depozitelor SolvBTC.BBN cu un plafon de miză crescut și un plan de stimulare actualizat
pieţe Buletin de stiri Tehnologia
Protocolul Solv lansează a doua fază a depozitelor SolvBTC.BBN cu un plafon de miză crescut și un plan de stimulare actualizat
Iulie 12, 2024
CRYPTOMERIA LABS PTE. LTD.