Onderzoekers van MIT en Google introduceren StableRep, een AI-model om de beeldproductie te versterken
In het kort
Computerwetenschappers van MIT en Google hebben StableRep onthuld, een AI-model dat tekstprompts omzet in nauwkeurige afbeeldingen Stable Diffusion.
MIT en Google computerwetenschappers hebben StableRep onthuld, een AI-model dat is ontworpen om beschrijvende geschreven bijschriften om te zetten in nauwkeurige overeenkomstige afbeeldingen met behulp van afbeeldingen die zijn gegenereerd door Stable Diffusion. Deze tool is gericht op het verbeteren van het vermogen van neurale netwerken om afbeeldingen te genereren op basis van tekstuele beschrijvingen.
Volgens de onderzoekers kunnen synthetische afbeeldingen AI-modellen helpen visuele representaties nauwkeuriger te leren in vergelijking met echte foto's.
StableRep heeft tot doel onderzoekers in staat te stellen het algoritmische proces van machinaal leren te beheren door een model te trainen op basis van een groot aantal afbeeldingen die worden gegenereerd door Stable Diffusion als antwoord op dezelfde vraag. Het model leert dus een breder scala aan visuele representaties, defibepalen welke afbeeldingen nauw aansluiten bij de gegeven aanwijzingen.
Onderzoekers voorzien de opkomst van een ecosysteem van AI-modellen, waarvan sommige zullen worden getraind op echte of synthetische gegevens. Momenteel zijn de inspanningen gericht op het leren van het model om meer te leren over concepten op hoog niveau door middel van contextueel begrip en variabiliteit, in plaats van er simpelweg gegevens aan toe te voegen.
StableRep gaat AI-ontwikkelaars en -engines helpen
In de kern van tekst-naar-beeld modellen ligt hun vermogen om objecten met woorden te verbinden. Wanneer ze worden gepresenteerd met een invoertekstprompt, moeten deze modellen een afbeelding genereren die nauw aansluit bij de opgegeven beschrijving. Om dit te bereiken, moeten ze inzicht verwerven in de visuele representaties van objecten uit de echte wereld.
Volgens een recente voorgedrukt papier op arXiv, presteert StableRep beter dan SimCLR en CLIP in termen van geleerde representaties met behulp van dezelfde set tekstprompts en bijbehorende echte afbeeldingen op grootschalige datasets, waarbij uitsluitend wordt vertrouwd op synthetische afbeeldingen.
Het artikel vervolgt: “Wanneer we taalsupervisie verder introduceren, bereikt StableRep, getraind met 20 miljoen synthetische afbeeldingen, een betere nauwkeurigheid dan CLIP, getraind met 50 miljoen echte afbeeldingen.”
SimCLR en CLIP zijn machine-learning-algoritmen die worden gebruikt voor het genereren van afbeeldingen op basis van tekstprompts.
Deze innovatieve aanpak stelt AI-ontwikkelaars in staat neurale netwerken te trainen met minder synthetische beelden dan echte, terwijl ze betere resultaten behalen. De opkomst van StableRep-achtige methoden suggereert een toekomst waarin tekst-naar-afbeelding-modellen voornamelijk op synthetische gegevens kunnen worden getraind, waardoor de afhankelijkheid van echte afbeeldingen wordt verminderd en AI-engines worden ondersteund wanneer ze worden geconfronteerd met beperkingen in de beschikbare online bronnen.
Disclaimer
In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.
Over de auteur
Alisa, een toegewijd journalist bij de MPost, is gespecialiseerd in cryptocurrency, zero-knowledge proofs, investeringen en het uitgebreide domein van Web3. Met een scherp oog voor opkomende trends en technologieën levert ze uitgebreide berichtgeving om lezers te informeren en te betrekken bij het steeds evoluerende landschap van digitale financiën.
Meer artikelen
Alisa, een toegewijd journalist bij de MPost, is gespecialiseerd in cryptocurrency, zero-knowledge proofs, investeringen en het uitgebreide domein van Web3. Met een scherp oog voor opkomende trends en technologieën levert ze uitgebreide berichtgeving om lezers te informeren en te betrekken bij het steeds evoluerende landschap van digitale financiën.