Nieuwsverslag Technologie
15 maart 2023

GPT-4 Kan uw verzoeken om afbeeldingen, documenten, diagrammen en screenshots afhandelen

In het kort

GPT-4 kan verzoeken om afbeeldingen, documenten, diagrammen en schermafbeeldingen afhandelen. Het is een verbetering ten opzichte van GPT-3, die alleen tekst verwerkte.

GPT-4 presteert superieur bij verschillende examens en tests en heeft toegang tot aanvullende informatie en details via afbeeldingen die mogelijk niet in schriftelijke vorm beschikbaar zijn.

gpt-4 afbeeldingen documenten screenshots

OpenAI's nieuwste mijlpaal, het nieuwe model GPT-4, kan verzoeken accepteren die afbeeldingen, documenten met tekst, diagrammen of schermafbeeldingen als invoer bevatten. Dit betekent een aanzienlijke verbetering ten opzichte van de vorige versie, GPT-3, die alleen tekst kon begrijpen en uitvoeren. Met deze nieuwe functie GPT-4 genereert tekstuitvoer gegeven invoer bestaande uit afwisselende tekst en afbeeldingen.

“Over een reeks domeinen – inclusief documenten met tekst en foto’s, diagrammen of schermafbeeldingen –GPT-4 vertoont vergelijkbare mogelijkheden als bij invoer met alleen tekst”,

OpenAI schreef.

ChatGPT-4 heeft een grotere omvang dan zijn voorgangers, wat aangeeft dat het training heeft gevolgd over een grotere hoeveelheid gegevens en meer gewichten in het modelbestand bevat, wat resulteert in hogere kosten voor de werking ervan. De nieuwste AI-taal kan mensachtige tekst genereren door gebruik te maken van diepgaand leren en vooraf getraind zijn op een grote dataset.

GPT-4 heeft toonde superieure prestaties ten opzichte van andere AI-talen in een verscheidenheid aan examens en tests, deels vanwege het vermogen om toegang te krijgen tot aanvullende informatie en details via afbeeldingen die mogelijk niet beschikbaar zijn in schriftelijke vorm.

De nieuwe GPT-4 model kan u vertellen wat er precies in de afbeelding wordt weergegeven, het analyseren en zelfs de betekenis ervan uitleggen. In de demo, GPT-4 legde de visuele grap uit waarbij een VGA-kabel op de iPhone wordt aangesloten. Het zou ook kunnen verklaren wat ongebruikelijk is in een foto met ‘extreem strijken’, die je hieronder kunt bekijken.

gpt-4 afbeeldingen
Bron: OpenAI

Er zijn echter ook meer nuttige implicaties aan verbonden GPT-4's nieuwe kennis. In de presentatie werd aangetoond dat PGT-4 kon vertellen wat er gekookt kon worden met de ingrediënten op de afbeelding. Dit betekent dat het model je kan helpen met koken als je voedselproducten hebt en geen idee hebt wat je ermee moet doen. Maak een momentopname van het voedsel dat je hebt, en chat-GPT kan u vertellen wat u kunt bereiden met de ingrediënten die u in huis heeft.

Dit vermogen om visuele informatie te begrijpen en te interpreteren maakt GPT-4 een krachtig hulpmiddel voor taken zoals het ondertitelen van afbeeldingen, het visueel beantwoorden van vragen en zelfs het maken van inhoud. Met de integratie van zowel tekst- als visueel begrip, GPT-4 heeft het potentieel om een ​​revolutie teweeg te brengen in verschillende sectoren, zoals reclame, design en e-commerce, en mensen te helpen de saaie, alledaagse taken voor hen uit te voeren.

De geavanceerde taalmodel 'begrijpt' ook schermafbeeldingen en documenten met tekst, tabellen, diagrammen of andere visuele representaties. Als u bijvoorbeeld een onderzoeksartikel van drie pagina's uploadt en dit wilt samenvatten en uitleggen, GPT-4 is daartoe in staat. 

Bloombergs presentator Jon Erlichman demonstreerde hoe hij een met de hand geschetst ontwerp kon omzetten in een functionele website.

De nieuwe technologie kan ook worden gebruikt als mobiliteitshulpmiddel, omdat het kan worden gebruikt om de omgeving voor slechtzienden te beschrijven. Daartoe werkt Open AI al samen met een applicatie genaamd Wees mijn ogen die is ontworpen om blinde mensen een helpende hand te bieden als ze ergens naar moeten kijken, bijvoorbeeld tijdens het boodschappen doen. Met de app kunnen “ziende vrijwilligers en professionals hun ogen lenen om grote en kleine taken op te lossen, zodat blinde en slechtziende mensen een onafhankelijker leven kunnen leiden.” Nu biedt het ook een virtuele vrijwilligerstool, mogelijk gemaakt door OpenAI's GPT-4.

Hoewel OpenAI's GPT-4 biedt momenteel de mogelijkheid om tekst en afbeeldingen als invoer te verwerken, het model is nog niet uitgerust om audio- en video-invoer te verwerken. Niettemin zijn er aanwijzingen dat deze modaliteiten mogelijk worden opgenomen in de volgende iteratie van de technologie.

Lees verder:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Agne is een journalist die de laatste trends en ontwikkelingen in de metaverse, AI en Web3 industrieën voor de Metaverse Post. Haar passie voor het vertellen van verhalen heeft ertoe geleid dat ze talloze interviews heeft gehouden met experts op deze gebieden, waarbij ze altijd op zoek is naar spannende en boeiende verhalen. Agne heeft een bachelordiploma in literatuur en een uitgebreide achtergrond in het schrijven over een breed scala aan onderwerpen, waaronder reizen, kunst en cultuur. Ze heeft zich ook vrijwillig aangemeld als redacteur voor de dierenrechtenorganisatie, waar ze hielp het bewustzijn over dierenwelzijnskwesties te vergroten. Neem contact met haar op [e-mail beveiligd].

Meer artikelen
Agne Cimerman
Agne Cimerman

Agne is een journalist die de laatste trends en ontwikkelingen in de metaverse, AI en Web3 industrieën voor de Metaverse Post. Haar passie voor het vertellen van verhalen heeft ertoe geleid dat ze talloze interviews heeft gehouden met experts op deze gebieden, waarbij ze altijd op zoek is naar spannende en boeiende verhalen. Agne heeft een bachelordiploma in literatuur en een uitgebreide achtergrond in het schrijven over een breed scala aan onderwerpen, waaronder reizen, kunst en cultuur. Ze heeft zich ook vrijwillig aangemeld als redacteur voor de dierenrechtenorganisatie, waar ze hielp het bewustzijn over dierenwelzijnskwesties te vergroten. Neem contact met haar op [e-mail beveiligd].

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten

Oprichters van Samourai Wallet beschuldigd van het faciliteren van $2 miljard aan Darknet-deals

De arrestatie van de oprichters van Samourai Wallet betekent een opmerkelijke tegenslag voor de sector en onderstreept de aanhoudende ...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
De AI-renaissance in gameontwikkeling in 2024
AI Wiki metaverse Wiki Onderwijs Markten Software Technologie
De AI-renaissance in gameontwikkeling in 2024
1 mei 2024
Een kijkje in het nieuwe AI Innovation Lab van Estée Lauder: een nadere blik op hoe generatieve AI beautymerken transformeert
Lifestyle Software Verhalen en recensies Technologie
Een kijkje in het nieuwe AI Innovation Lab van Estée Lauder: een nadere blik op hoe generatieve AI beautymerken transformeert
1 mei 2024
Chainlink en Rapid Addition werken samen aan de ontwikkeling van een op CCIP gebaseerde Blockchain-adapter
Business Nieuwsverslag Technologie
Chainlink en Rapid Addition werken samen aan de ontwikkeling van een op CCIP gebaseerde Blockchain-adapter
1 mei 2024
BitSmiley lanceert Alphanet V1, debuteert op Bitcoin Layer 2 Network Bitlayer
Nieuwsverslag Technologie
BitSmiley lanceert Alphanet V1, debuteert op Bitcoin Layer 2 Network Bitlayer
1 mei 2024