Nyhetsrapport Teknologi
Maj 01, 2023

Stability AI's StableVicuna är den första chatboten som tränas med mänsklig feedback

I korthet

Stability AI släpper StableVicuna, den första storskaliga chatboten med öppen källkod, som använder Reinforcement Learning with Human Feedback (RLHF).

StableVicuna är baserad på Vicuna chatbot och använder en parameter på 13 miljarder LLaMA modell.

stablevicuna

Stability AI har introducerade dess senaste genombrott inom AI, StableVicuna, den första storskaliga chatboten med öppen källkod som tränas med mänsklig feedback. Den innovativa chatboten är skapad av Stability AI, företaget som skapade den populära bildmodellen med öppen källkod, Stable Diffusion, och den senaste AI-bildgenereringsalgoritmen, DeepFloyd

StableVicuna är baserad på Vicuna chatbot som släpptes i april, som använder en 13 miljarder parameter LLaMA modell. Vad sätter Vicuna-varianten av Stability AI och Carper AI åtskild är dess användning av Reinforcement Learning with Human Feedback (RLHF). Denna metod gör att modellen kan förbättras kontinuerligt.

Stability AI föreslår att chatbots är framgångsrika på grund av två typer av träningsmetoder: finjustering av instruktion och förstärkningsinlärning genom mänsklig feedback. De flesta befintliga chatbotmodeller använder dock bara en av dessa metoder och inte båda. Nyligen har datauppsättningar för RLHF-utbildning blivit allmänt tillgängliga. Tillsammans med ett användarvänligt träningsverktyg har detta alltså möjliggjort skapandet av StableVicuna, som är den första storskaliga chatbot-modell som inkluderar båda typerna av träning.

StableVicuna innehåller textgenerering, enkla matematiska funktioner och möjligheten att skriva kod. Det är jämförbart med andra chatbots med öppen källkod i vanliga riktmärken. 

stablevicuna
Källa: Stability AI

Enligt Avkodaren, chatbots med öppen källkod finjusterade med data från andra chatbots riskerar att förstärka befintliga fel och fördomar genom repetitiv träning, vilket orsakar en ekokammareffekt. Finjustering av data kan också förvärra hallucinationer genom att introducera information som inte finns i den ursprungliga modellen.

Användare kan komma åt en demo av chatboten på Kramar ansikte. Företaget har också avslöjat planer på att tillhandahålla StableVicuna via ett chattgränssnitt i framtiden.

Läs mer:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Agne är en journalist som täcker de senaste trenderna och utvecklingen inom metaversen, AI och Web3 industrier för Metaverse Post. Hennes passion för berättande har lett till att hon har genomfört ett flertal intervjuer med experter inom dessa områden och alltid försökt avslöja spännande och engagerande berättelser. Agne har en kandidatexamen i litteratur och har en omfattande bakgrund i att skriva om ett brett spektrum av ämnen, inklusive resor, konst och kultur. Hon har också varit volontär som redaktör för djurrättsorganisationen, där hon hjälpt till att öka medvetenheten om djurskyddsfrågor. Kontakta henne på [e-postskyddad].

fler artiklar
Agne Cimerman
Agne Cimerman

Agne är en journalist som täcker de senaste trenderna och utvecklingen inom metaversen, AI och Web3 industrier för Metaverse Post. Hennes passion för berättande har lett till att hon har genomfört ett flertal intervjuer med experter inom dessa områden och alltid försökt avslöja spännande och engagerande berättelser. Agne har en kandidatexamen i litteratur och har en omfattande bakgrund i att skriva om ett brett spektrum av ämnen, inklusive resor, konst och kultur. Hon har också varit volontär som redaktör för djurrättsorganisationen, där hon hjälpt till att öka medvetenheten om djurskyddsfrågor. Kontakta henne på [e-postskyddad].

Straffdagen anländer: CZ:s öde hänger i balans när den amerikanska domstolen överväger DOJ:s vädjande

Changpeng Zhao är redo att dömas i en amerikansk domstol i Seattle i dag.

Lär dig mer

Samourai Wallet-grundare anklagade för att underlätta $2 miljarder i Darknet-erbjudanden

Uppfattningen av Samourai Wallet-grundarna representerar ett anmärkningsvärt bakslag för branschen, vilket understryker den ihållande ...

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Galxe samarbetar med Jambo för att utöka den globala tillgängligheten till Web3
Företag Nyhetsrapport Teknologi
Galxe samarbetar med Jambo för att utöka den globala tillgängligheten till Web3
Maj 2, 2024
Googles Med-Gemini redo att ge ett försprång GPT-4 Med sin överlägsna prestanda inom sjukvården
AI Wiki Nyheter Mjukvara Teknologi
Googles Med-Gemini redo att ge ett försprång GPT-4 Med sin överlägsna prestanda inom sjukvården
Maj 2, 2024
Hongkongs lagstiftande rådsmedlem Wu Jiezhuang signalerar civilprocess mot JPEX Crypto Exchange
Företag Nyhetsrapport Teknologi
Hongkongs lagstiftande rådsmedlem Wu Jiezhuang signalerar civilprocess mot JPEX Crypto Exchange
Maj 2, 2024
AltLayer går in i andra fasen av sitt insatsinitiativ, introducerar reALT Token
Marknader Nyhetsrapport Teknologi
AltLayer går in i andra fasen av sitt insatsinitiativ, introducerar reALT Token
Maj 2, 2024