Buletin de stiri Tehnologia
Martie 15, 2023

GPT-4 Poate gestiona solicitările dvs. de imagini, documente, diagrame și capturi de ecran

Pe scurt

GPT-4 poate gestiona solicitările de imagini, documente, diagrame și capturi de ecran. Este o îmbunătățire față de GPT-3, care trata doar text.

GPT-4 are performanțe superioare la diferite examene și teste și poate accesa informații și detalii suplimentare prin imagini care este posibil să nu fie disponibile în formă scrisă.

gpt-4 imagini documente capturi de ecran

OpenAIcea mai recentă piatră de hotar a lui, noul model GPT-4, poate accepta cereri care includ imagini, documente cu text, diagrame sau capturi de ecran ca intrări. Aceasta reprezintă o îmbunătățire semnificativă față de versiunea anterioară, GPT-3, care putea înțelege și scoate doar text. Cu această nouă caracteristică, GPT-4 generează ieșiri de text date intrări constând din text și imagini intercalate.

„Pe o gamă largă de domenii, inclusiv documente cu text și fotografii, diagrame sau capturi de ecran—GPT-4 prezintă capacități asemănătoare cu cele ale intrărilor de text,”

OpenAI a scris.

ChatGPT-4 are o dimensiune mai mare decât predecesorii săi, ceea ce indică faptul că a fost instruit pe o cantitate mai mare de date și conține mai multe greutăți în fișierul său model, ceea ce duce la un cost mai mare pentru funcționarea sa. Cel mai nou limbaj AI poate genera text asemănător omului utilizând învățare profundă și a fi pregătit în prealabil pe un set de date mare.

GPT-4 are a demonstrat performanță superioară față de alte limbi AI într-o varietate de examene și teste, în parte datorită capacității sale de a accesa informații și detalii suplimentare prin imagini care ar putea să nu fie disponibile într-o formă scrisă.

Noul GPT-4 modelul vă poate spune exact ce este descris în ilustrație, îl poate analiza și chiar explica semnificația acestuia. În demo, GPT-4 a explicat gluma vizuală în care un cablu VGA este conectat la iPhone. Ar putea explica, de asemenea, ce este neobișnuit într-o imagine care prezintă „călcare extremă”, pe care o puteți verifica mai jos.

gpt-4 imagini
Sursa: OpenAI

Cu toate acestea, există și implicații mai utile pentru GPT-4noile cunoștințe ale lui. În prezentare, s-a arătat că PGT-4 poate spune ce se poate găti din ingredientele prezentate în imagine. Aceasta înseamnă că modelul vă poate ajuta să gătiți dacă aveți produse alimentare și nu aveți nicio idee ce să faceți cu ele. Fă un instantaneu al alimentelor pe care le ai și chat-GPT vă poate spune ce puteți pregăti din ingredientele pe care le aveți acasă.

Această capacitate de a înțelege și interpreta informațiile vizuale face GPT-4 un instrument puternic pentru sarcini precum subtitrărea imaginilor, răspunsurile vizuale la întrebări și chiar crearea de conținut. Prin integrarea atât a textului, cât și a înțelegerii vizuale, GPT-4 are potențialul de a revoluționa diverse industrii, cum ar fi publicitatea, designul și comerțul electronic, și de a ajuta oamenii să facă sarcinile plictisitoare și banale pentru ei.

avansate model de limbaj de asemenea, „înțelege” capturi de ecran și documente cu text, tabele, diagrame sau alte reprezentări vizuale. De exemplu, dacă încărcați o lucrare de cercetare de trei pagini și aveți nevoie să fie rezumată și explicată, GPT-4 este capabil să facă asta. 

Ancora lui Bloomberg, Jon Erlichman, a demonstrat cum a reușit să transforme un design schițat manual într-un site web funcțional.

Noua tehnologie poate fi folosită și ca ajutor pentru mobilitate, deoarece ar putea fi folosită pentru a descrie mediul pentru persoanele cu deficiențe de vedere. În acest scop, Open AI a încheiat deja un parteneriat cu o aplicație numită Fii ochii mei care a fost conceput pentru a oferi orbilor o mână de ajutor atunci când au nevoie să arunce o privire la ceva, de exemplu, la cumpărături. Aplicația le permite „voluntarilor și profesioniștilor văzători să-și dea ochii pentru a rezolva sarcini mari și mici, pentru a ajuta oamenii nevăzători și cu vederea slabă să ducă o viață mai independentă”. Acum, oferă și un instrument virtual de voluntariat alimentat de OpenAI'S GPT-4.

Cu toate ca OpenAI'S GPT-4 oferă în prezent capacitatea de a procesa text și imagini ca intrări, modelul nu este încă echipat pentru a gestiona intrările audio și video. Cu toate acestea, există indicii că aceste modalități ar putea fi incluse în următoarea iterație a tehnologiei.

Citeşte mai mult:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Agne este o jurnalistă care acoperă cele mai recente tendințe și evoluții în metaverse, AI și Web3 industrii pentru Metaverse Post. Pasiunea ei pentru povestire a determinat-o să conducă numeroase interviuri cu experți în aceste domenii, căutând mereu să descopere povești interesante și captivante. Agne deține o diplomă de licență în literatură și are o experiență vastă în scris despre o gamă largă de subiecte, inclusiv călătorii, artă și cultură. De asemenea, s-a oferit voluntar ca editor pentru organizația pentru drepturile animalelor, unde a contribuit la creșterea gradului de conștientizare cu privire la problemele de bunăstare a animalelor. Contactează-o pe [e-mail protejat].

Mai multe articole
Agne Cimerman
Agne Cimerman

Agne este o jurnalistă care acoperă cele mai recente tendințe și evoluții în metaverse, AI și Web3 industrii pentru Metaverse Post. Pasiunea ei pentru povestire a determinat-o să conducă numeroase interviuri cu experți în aceste domenii, căutând mereu să descopere povești interesante și captivante. Agne deține o diplomă de licență în literatură și are o experiență vastă în scris despre o gamă largă de subiecte, inclusiv călătorii, artă și cultură. De asemenea, s-a oferit voluntar ca editor pentru organizația pentru drepturile animalelor, unde a contribuit la creșterea gradului de conștientizare cu privire la problemele de bunăstare a animalelor. Contactează-o pe [e-mail protejat].

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe

Fondatorii portofelului Samourai sunt acuzați că au facilitat 2 miliarde de dolari în oferte Darknet

Reținerea fondatorilor Samourai Wallet reprezintă un regres notabil pentru industrie, subliniind persistenta...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Chainlink și Rapid Addition colaborează pentru a dezvolta un adaptor Blockchain bazat pe CCIP
Afaceri Buletin de stiri Tehnologia
Chainlink și Rapid Addition colaborează pentru a dezvolta un adaptor Blockchain bazat pe CCIP
1 Mai, 2024
BitSmiley lansează Alphanet V1, debutează pe Bitcoin Layer 2 Network Bitlayer
Buletin de stiri Tehnologia
BitSmiley lansează Alphanet V1, debutează pe Bitcoin Layer 2 Network Bitlayer
1 Mai, 2024
Aprilie 2024 înregistrează un nivel scăzut istoric al hackurilor și înșelătoriilor, CertiK raportează o scădere cu 141% față de martie
pieţe Securitate Wiki Povești și recenzii Tehnologia
Aprilie 2024 înregistrează un nivel scăzut istoric al hackurilor și înșelătoriilor, CertiK raportează o scădere cu 141% față de martie
1 Mai, 2024
Prețul Bitcoin scade înaintea anunțului deciziei Rezervei Federale privind rata dobânzii, analiștii avertizează asupra unei potențiale schimbări ale pieței
pieţe Buletin de stiri Tehnologia
Prețul Bitcoin scade înaintea anunțului deciziei Rezervei Federale privind rata dobânzii, analiștii avertizează asupra unei potențiale schimbări ale pieței
1 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.