Stability AI's StableVicuna je první chatbot vyškolený s lidskou zpětnou vazbou
Stručně
Stability AI uvádí StableVicuna, prvního rozsáhlého chatbota s otevřeným zdrojovým kódem, který využívá posilování učení s lidskou zpětnou vazbou (RLHF).
StableVicuna je založena na chatbotu Vicuna a používá parametr 13 miliard LLaMA model.
Stability AI má Představený jeho nejnovější průlom v AI, StableVicuna, první rozsáhlý chatbot s otevřeným zdrojovým kódem vyškolený s lidskou zpětnou vazbou. Inovativní chatbot je duchovním dítětem Stability AI, společnost, která vytvořila populární model obrázků s otevřeným zdrojovým kódem, Stable Diffusiona nejnovější algoritmus generování obrázků AI, DeepFloyd.
StableVicuna je založena na chatbotu Vicuna vydaném v dubnu, který používá parametr 13 miliard LLaMA Modelka. Co nastavuje variantu Vicuna Stability AI a Carper AI kromě toho, že používá Reinforcement Learning with Human Feedback (RLHF). Tato metoda umožňuje model neustále zlepšovat.
Stability AI naznačuje, že chatboti jsou úspěšní díky dvěma typům tréninkových metod: dolaďování instrukcí a posilování učení prostřednictvím lidské zpětné vazby. Většina stávajících modelů chatbotů však používá pouze jednu z těchto metod a nikoli obě. Nedávno byly veřejně dostupné datové soubory pro výcvik RLHF. Spolu s uživatelsky přívětivým školicím nástrojem to umožnilo vytvoření StableVicuna, která je prvním velkým model chatbota který zahrnuje oba typy školení.
StableVicuna zahrnuje generování textu, jednoduché matematické funkce a schopnost psát kód. V běžných benchmarcích je srovnatelný s ostatními open-source chatboty.
Podle Dekodér, chatboti s otevřeným zdrojovým kódem vyladění pomocí dat z jiných chatbotů riskují zesílení existujících chyb a zkreslení prostřednictvím opakovaného školení, což způsobí efekt echo komory. Jemné doladění dat může také zhoršit halucinace zavedením informací, které původní model neobsahuje.
Uživatelé mají přístup k ukázce chatbota na Objímání tváře. Společnost také zveřejnila plány na poskytování StableVicuna prostřednictvím chatovacího rozhraní v budoucnu.
Čtěte více:
Odmítnutí odpovědnosti
V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.
O autorovi
Agne je novinářka, která se zabývá nejnovějšími trendy a vývojem v metaverse, AI a Web3 průmysl pro Metaverse Post. Její vášeň pro vyprávění ji přivedla k četným rozhovorům s odborníky v těchto oblastech, ve kterých se vždy snažila odhalit vzrušující a poutavé příběhy. Agne má bakalářský titul z literatury a má rozsáhlé zkušenosti s psaním o široké škále témat, včetně cestování, umění a kultury. Přihlásila se také jako redaktorka do organizace pro práva zvířat, kde pomáhala zvyšovat povědomí o otázkách dobrých životních podmínek zvířat. Kontaktujte ji [chráněno e-mailem].
Další článkyAgne je novinářka, která se zabývá nejnovějšími trendy a vývojem v metaverse, AI a Web3 průmysl pro Metaverse Post. Její vášeň pro vyprávění ji přivedla k četným rozhovorům s odborníky v těchto oblastech, ve kterých se vždy snažila odhalit vzrušující a poutavé příběhy. Agne má bakalářský titul z literatury a má rozsáhlé zkušenosti s psaním o široké škále témat, včetně cestování, umění a kultury. Přihlásila se také jako redaktorka do organizace pro práva zvířat, kde pomáhala zvyšovat povědomí o otázkách dobrých životních podmínek zvířat. Kontaktujte ji [chráněno e-mailem].