Stability AIStableVicuna is de eerste chatbot die is getraind met menselijke feedback
In het kort
Stability AI brengt StableVicuna uit, de eerste grootschalige open-source chatbot, die Reinforcement Learning with Human Feedback (RLHF) gebruikt.
StableVicuna is gebaseerd op de Vicuna-chatbot en gebruikt een parameter van 13 miljard LLaMA model.
Stability AI heeft geïntroduceerd zijn laatste doorbraak in AI, StableVicuna, de eerste grootschalige open-source chatbot getraind met menselijke feedback. De innovatieve chatbot is het geesteskind van Stability AI, het bedrijf dat het populaire open-source afbeeldingsmodel heeft gemaakt, Stable Diffusion, en het nieuwste AI-algoritme voor het genereren van afbeeldingen, DiepFloyd.
StableVicuna is gebaseerd op de Vicuna-chatbot die in april werd uitgebracht en die een parameter van 13 miljard gebruikt LLaMA model. Waar is de Vicuna-variant van? Stability AI en Carper AI apart is het gebruik van Reinforcement Learning with Human Feedback (RLHF). Deze methode stelt het model in staat om continu te verbeteren.
Stability AI suggereert dat chatbots succesvol zijn vanwege twee soorten trainingsmethoden: het afstemmen van instructies en het versterken van leren door middel van menselijke feedback. De meeste bestaande chatbotmodellen gebruiken echter slechts één van deze methoden en niet beide. Onlangs zijn datasets voor RLHF-training publiekelijk beschikbaar geworden. Samen met een gebruiksvriendelijke trainingstool heeft dit de creatie van StableVicuna mogelijk gemaakt, de eerste grootschalige chatbot-model dat beide soorten training omvat.
StableVicuna bevat tekstgeneratie, eenvoudige wiskundige functies en de mogelijkheid om code te schrijven. Het is vergelijkbaar met andere open-source chatbots in gemeenschappelijke benchmarks.
Think De decoder, riskeren open-source chatbots die zijn afgestemd op gegevens van andere chatbots bestaande fouten en vooroordelen te versterken door herhaalde training, waardoor een echokamereffect ontstaat. Fijnafstemming van gegevens kan ook hallucinaties verergeren door informatie te introduceren die niet aanwezig is in het oorspronkelijke model.
Gebruikers hebben toegang tot een demo van de chatbot op KnuffelenGezicht. Het bedrijf heeft ook plannen bekendgemaakt om StableVicuna in de toekomst via een chatinterface aan te bieden.
Lees verder:
Disclaimer
In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.
Over de auteur
Agne is een journalist die de laatste trends en ontwikkelingen in de metaverse, AI en Web3 industrieën voor de Metaverse Post. Haar passie voor het vertellen van verhalen heeft ertoe geleid dat ze talloze interviews heeft gehouden met experts op deze gebieden, waarbij ze altijd op zoek is naar spannende en boeiende verhalen. Agne heeft een bachelordiploma in literatuur en een uitgebreide achtergrond in het schrijven over een breed scala aan onderwerpen, waaronder reizen, kunst en cultuur. Ze heeft zich ook vrijwillig aangemeld als redacteur voor de dierenrechtenorganisatie, waar ze hielp het bewustzijn over dierenwelzijnskwesties te vergroten. Neem contact met haar op [e-mail beveiligd].
Meer artikelenAgne is een journalist die de laatste trends en ontwikkelingen in de metaverse, AI en Web3 industrieën voor de Metaverse Post. Haar passie voor het vertellen van verhalen heeft ertoe geleid dat ze talloze interviews heeft gehouden met experts op deze gebieden, waarbij ze altijd op zoek is naar spannende en boeiende verhalen. Agne heeft een bachelordiploma in literatuur en een uitgebreide achtergrond in het schrijven over een breed scala aan onderwerpen, waaronder reizen, kunst en cultuur. Ze heeft zich ook vrijwillig aangemeld als redacteur voor de dierenrechtenorganisatie, waar ze hielp het bewustzijn over dierenwelzijnskwesties te vergroten. Neem contact met haar op [e-mail beveiligd].