Novinky Technika
01

Stability AI's StableVicuna je první chatbot vyškolený s lidskou zpětnou vazbou

Stručně

Stability AI uvádí StableVicuna, prvního rozsáhlého chatbota s otevřeným zdrojovým kódem, který využívá posilování učení s lidskou zpětnou vazbou (RLHF).

StableVicuna je založena na chatbotu Vicuna a používá parametr 13 miliard LLaMA model.

stablevicuna

Stability AI má Představený jeho nejnovější průlom v AI, StableVicuna, první rozsáhlý chatbot s otevřeným zdrojovým kódem vyškolený s lidskou zpětnou vazbou. Inovativní chatbot je duchovním dítětem Stability AI, společnost, která vytvořila populární model obrázků s otevřeným zdrojovým kódem, Stable Diffusiona nejnovější algoritmus generování obrázků AI, DeepFloyd

StableVicuna je založena na chatbotu Vicuna vydaném v dubnu, který používá parametr 13 miliard LLaMA Modelka. Co nastavuje variantu Vicuna Stability AI a Carper AI kromě toho, že používá Reinforcement Learning with Human Feedback (RLHF). Tato metoda umožňuje model neustále zlepšovat.

Stability AI naznačuje, že chatboti jsou úspěšní díky dvěma typům tréninkových metod: dolaďování instrukcí a posilování učení prostřednictvím lidské zpětné vazby. Většina stávajících modelů chatbotů však používá pouze jednu z těchto metod a nikoli obě. Nedávno byly veřejně dostupné datové soubory pro výcvik RLHF. Spolu s uživatelsky přívětivým školicím nástrojem to umožnilo vytvoření StableVicuna, která je prvním velkým model chatbota který zahrnuje oba typy školení.

StableVicuna zahrnuje generování textu, jednoduché matematické funkce a schopnost psát kód. V běžných benchmarcích je srovnatelný s ostatními open-source chatboty. 

stablevicuna
Zdroj: Stability AI

Podle Dekodér, chatboti s otevřeným zdrojovým kódem vyladění pomocí dat z jiných chatbotů riskují zesílení existujících chyb a zkreslení prostřednictvím opakovaného školení, což způsobí efekt echo komory. Jemné doladění dat může také zhoršit halucinace zavedením informací, které původní model neobsahuje.

Uživatelé mají přístup k ukázce chatbota na Objímání tváře. Společnost také zveřejnila plány na poskytování StableVicuna prostřednictvím chatovacího rozhraní v budoucnu.

Čtěte více:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Agne je novinářka, která se zabývá nejnovějšími trendy a vývojem v metaverse, AI a Web3 průmysl pro Metaverse Post. Její vášeň pro vyprávění ji přivedla k četným rozhovorům s odborníky v těchto oblastech, ve kterých se vždy snažila odhalit vzrušující a poutavé příběhy. Agne má bakalářský titul z literatury a má rozsáhlé zkušenosti s psaním o široké škále témat, včetně cestování, umění a kultury. Přihlásila se také jako redaktorka do organizace pro práva zvířat, kde pomáhala zvyšovat povědomí o otázkách dobrých životních podmínek zvířat. Kontaktujte ji [chráněno e-mailem].

Další články
Agne Cimermanová
Agne Cimermanová

Agne je novinářka, která se zabývá nejnovějšími trendy a vývojem v metaverse, AI a Web3 průmysl pro Metaverse Post. Její vášeň pro vyprávění ji přivedla k četným rozhovorům s odborníky v těchto oblastech, ve kterých se vždy snažila odhalit vzrušující a poutavé příběhy. Agne má bakalářský titul z literatury a má rozsáhlé zkušenosti s psaním o široké škále témat, včetně cestování, umění a kultury. Přihlásila se také jako redaktorka do organizace pro práva zvířat, kde pomáhala zvyšovat povědomí o otázkách dobrých životních podmínek zvířat. Kontaktujte ji [chráněno e-mailem].

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více

Zakladatelé peněženky Samourai byli obviněni z usnadňování 2 miliard dolarů v obchodech Darknet

Obavy zakladatelů Peněženky Samourai představují pro průmysl významnou překážku, která podtrhuje přetrvávající ...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Galxe spolupracuje se společností Jambo, aby rozšířila globální dostupnost Web3
Business Novinky Technika
Galxe spolupracuje se společností Jambo, aby rozšířila globální dostupnost Web3
2
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
AI Wiki Novinky Vývoj Technika
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
2
Člen hongkongské legislativní rady Wu Jiezhuang signalizuje civilní žalobu proti krypto burze JPEX
Business Novinky Technika
Člen hongkongské legislativní rady Wu Jiezhuang signalizuje civilní žalobu proti krypto burze JPEX
2
AltLayer vstupuje do druhé fáze své vytyčovací iniciativy a představuje token realALT
Trhy Novinky Technika
AltLayer vstupuje do druhé fáze své vytyčovací iniciativy a představuje token realALT
2
CRYPTOMERIA LABS PTE. LTD.