Stability AI's StableVicuna er den første chatbot trænet med menneskelig feedback
Kort sagt
Stability AI frigiver StableVicuna, den første store open source chatbot, som bruger Reinforcement Learning with Human Feedback (RLHF).
StableVicuna er baseret på Vicuna chatbot og bruger en parameter på 13 milliarder LLaMA model.
Stability AI har introduceret sit seneste gennembrud inden for kunstig intelligens, StableVicuna, den første store open source chatbot trænet med menneskelig feedback. Den innovative chatbot er udtænkt af Stability AI, virksomheden, der skabte den populære open source billedmodel, Stable Diffusion, og den nyeste AI-billedgenereringsalgoritme, DeepFloyd.
StableVicuna er baseret på Vicuna chatbot udgivet i april, som bruger en 13 milliarder parameter LLaMA model. Hvad sætter Vicuna-varianten af Stability AI og Carper AI bortset fra dets brug af Reinforcement Learning with Human Feedback (RLHF). Denne metode gør det muligt for modellen at forbedre sig løbende.
Stability AI antyder, at chatbots er succesfulde på grund af to typer træningsmetoder: finjustering af instruktion og forstærkningslæring gennem menneskelig feedback. De fleste eksisterende chatbot-modeller bruger dog kun én af disse metoder og ikke begge. For nylig er datasæt til RLHF-træning blevet offentligt tilgængelige. Sammen med et brugervenligt træningsværktøj har dette således muliggjort skabelsen af StableVicuna, som er den første storskala chatbot model der omfatter begge typer træning.
StableVicuna inkorporerer tekstgenerering, enkle matematiske funktioner og evnen til at skrive kode. Det kan sammenlignes med andre open source chatbots i almindelige benchmarks.
Ifølge Dekoderen, open source chatbots finjusteret med data fra andre chatbots risikerer at forstærke eksisterende fejl og skævheder gennem gentagen træning, hvilket forårsager en ekkokammereffekt. Finjustering af data kan også forværre hallucinationer ved at introducere information, der ikke findes i den originale model.
Brugere kan få adgang til en demo af chatbotten på KrammerFace. Virksomheden har også afsløret planer om at levere StableVicuna gennem en chat-grænseflade i fremtiden.
Læs mere:
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Agne er en journalist, der dækker de seneste trends og udviklinger inden for metaverset, AI og Web3 industrier for Metaverse Post. Hendes passion for historiefortælling har fået hende til at gennemføre adskillige interviews med eksperter inden for disse områder, hvor hun altid søger at afdække spændende og engagerende historier. Agne er uddannet bachelor i litteratur og har en omfattende baggrund i at skrive om en bred vifte af emner, herunder rejser, kunst og kultur. Hun har også været frivillig som redaktør for dyrerettighedsorganisationen, hvor hun var med til at skabe opmærksomhed omkring dyrevelfærdsspørgsmål. Kontakt hende på [e-mail beskyttet].
Flere artiklerAgne er en journalist, der dækker de seneste trends og udviklinger inden for metaverset, AI og Web3 industrier for Metaverse Post. Hendes passion for historiefortælling har fået hende til at gennemføre adskillige interviews med eksperter inden for disse områder, hvor hun altid søger at afdække spændende og engagerende historier. Agne er uddannet bachelor i litteratur og har en omfattende baggrund i at skrive om en bred vifte af emner, herunder rejser, kunst og kultur. Hun har også været frivillig som redaktør for dyrerettighedsorganisationen, hvor hun var med til at skabe opmærksomhed omkring dyrevelfærdsspørgsmål. Kontakt hende på [e-mail beskyttet].