Stability AIStableVicuna je prvý chatbot vyškolený s ľudskou spätnou väzbou
Stručne
Stability AI uvádza na trh StableVicuna, prvý rozsiahly chatbot s otvoreným zdrojovým kódom, ktorý využíva posilňovanie učenia s ľudskou spätnou väzbou (RLHF).
StableVicuna je založená na chatbote Vicuna a používa parameter 13 miliárd LLaMA model.
Stability AI má zavedená jeho najnovší prielom v oblasti AI, StableVicuna, prvý rozsiahly chatbot s otvoreným zdrojovým kódom vyškolený s ľudskou spätnou väzbou. Inovatívny chatbot je duchovným dieťaťom Stability AI, spoločnosť, ktorá vytvorila populárny model obrázkov s otvoreným zdrojovým kódom, Stable Diffusiona najnovší algoritmus generovania obrázkov AI, DeepFloyd.
StableVicuna je založená na chatbotovi Vicuna vydanom v apríli, ktorý používa parameter 13 miliárd LLaMA Model. Čo stanovuje variant Vicuna Stability AI a Carper AI okrem toho je použitie posilňovacieho učenia s ľudskou spätnou väzbou (RLHF). Táto metóda umožňuje neustále zlepšovanie modelu.
Stability AI naznačuje, že chatboty sú úspešné vďaka dvom typom tréningových metód: dolaďovaniu pokynov a posilňovaniu učenia prostredníctvom ľudskej spätnej väzby. Väčšina existujúcich modelov chatbotov však používa iba jednu z týchto metód a nie obe. Nedávno boli verejne dostupné súbory údajov pre výcvik RLHF. Spolu s užívateľsky prívetivým školiacim nástrojom to umožnilo vytvorenie StableVicuna, ktorá je prvým veľkým model chatbota ktorý zahŕňa oba typy tréningu.
StableVicuna zahŕňa generovanie textu, jednoduché matematické funkcie a schopnosť písať kód. V bežných benchmarkoch je porovnateľný s inými open-source chatbotmi.
Podľa Dekodér, open-source chatboty vyladené s údajmi z iných chatbotov riskujú zosilnenie existujúcich chýb a skreslení prostredníctvom opakovaného školenia, čo spôsobí efekt echo komory. Jemné doladenie údajov môže tiež zhoršiť halucinácie zavedením informácií, ktoré sa nenachádzajú v pôvodnom modeli.
Používatelia majú prístup k ukážke chatbota na HuggingFace. Spoločnosť tiež zverejnila plány na poskytovanie StableVicuna prostredníctvom chatovacieho rozhrania v budúcnosti.
Prečítajte si viac:
Vylúčenie zodpovednosti
V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.
O autorovi
Agne je novinárka, ktorá pokrýva najnovšie trendy a vývoj v oblasti metaverse, AI a Web3 priemyslu pre Metaverse Post. Jej vášeň pre rozprávanie ju priviedla k mnohým rozhovorom s odborníkmi v týchto oblastiach, pričom sa vždy snažila odhaliť vzrušujúce a pútavé príbehy. Agne má bakalársky titul v odbore literatúra a má rozsiahle skúsenosti s písaním o širokej škále tém vrátane cestovania, umenia a kultúry. Dobrovoľne pracovala aj ako redaktorka organizácie za práva zvierat, kde pomáhala zvyšovať povedomie o otázkach dobrých životných podmienok zvierat. Kontaktujte ju [chránené e-mailom].
Ďalšie článkyAgne je novinárka, ktorá pokrýva najnovšie trendy a vývoj v oblasti metaverse, AI a Web3 priemyslu pre Metaverse Post. Jej vášeň pre rozprávanie ju priviedla k mnohým rozhovorom s odborníkmi v týchto oblastiach, pričom sa vždy snažila odhaliť vzrušujúce a pútavé príbehy. Agne má bakalársky titul v odbore literatúra a má rozsiahle skúsenosti s písaním o širokej škále tém vrátane cestovania, umenia a kultúry. Dobrovoľne pracovala aj ako redaktorka organizácie za práva zvierat, kde pomáhala zvyšovať povedomie o otázkach dobrých životných podmienok zvierat. Kontaktujte ju [chránené e-mailom].