Stability AIStableVicuna je prvi chatbot obučen za ljudske povratne informacije
Ukratko
Stability AI izdaje StableVicuna, prvi veliki chatbot otvorenog koda, koji koristi učenje s pojačanjem s ljudskim povratnim informacijama (RLHF).
StableVicuna se temelji na chatbotu Vicuna i koristi parametar od 13 milijardi LLaMA Model.
Stability AI ima uveo njegov najnoviji napredak u umjetnoj inteligenciji, StableVicuna, prvi veliki open-source chatbot obučen s ljudskim povratnim informacijama. Inovativni chatbot je zamisao tvrtke Stability AI, tvrtka koja je stvorila popularni model slike otvorenog koda, Stable Diffusion, i najnoviji algoritam za generiranje slike AI, DeepFloyd.
StableVicuna se temelji na chatbotu Vicuna objavljenom u travnju, koji koristi parametar od 13 milijardi LLaMA model. Što postavlja Vicuna varijantu od Stability AI Osim Carper AI-a, to je njegova upotreba učenja s pojačanjem uz povratnu informaciju od čovjeka (RLHF). Ova metoda omogućuje kontinuirano poboljšanje modela.
Stability AI sugerira da su chatbotovi uspješni zbog dvije vrste metoda obuke: finog podešavanja instrukcija i učenja s pojačanjem putem ljudskih povratnih informacija. Međutim, većina postojećih modela chatbota koristi samo jednu od ovih metoda, a ne obje. Nedavno su skupovi podataka za RLHF obuku postali javno dostupni. Tako je, zajedno s alatom za obuku prilagođenom korisniku, ovo omogućilo stvaranje StableVicune, prve velike model chatbota koji uključuje obje vrste treninga.
StableVicuna uključuje generiranje teksta, jednostavne matematičke funkcije i mogućnost pisanja koda. Usporediv je s drugim otvorenim chatbotovima u uobičajenim mjerilima.
Prema Dekoder, chatbotovi otvorenog koda koji su fino podešeni s podacima iz drugih chatbotova riskiraju pojačavanje postojećih pogrešaka i pristranosti kroz ponavljanje obuke, uzrokujući učinak komore odjeka. Podaci finog podešavanja također mogu pogoršati halucinacije uvođenjem informacija koje nisu prisutne u izvornom modelu.
Korisnici mogu pristupiti demonstraciji chatbota na HuggingFace. Tvrtka je također otkrila planove za pružanje StableVicune putem chat sučelja u budućnosti.
Pročitajte više:
Izjava o odricanju od odgovornosti
U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.
O autoru
Agne je novinarka koja pokriva najnovije trendove i razvoj u metaverzumu, umjetnoj inteligenciji i Web3 industrije za Metaverse Post. Njezina strast za pripovijedanjem dovela ju je do brojnih intervjua sa stručnjacima u tim područjima, uvijek nastojeći otkriti uzbudljive i privlačne priče. Agne je diplomirala književnost i ima opsežno iskustvo u pisanju o širokom rasponu tema, uključujući putovanja, umjetnost i kulturu. Također je volontirala kao urednica organizacije za prava životinja, gdje je pomogla u podizanju svijesti o pitanjima dobrobiti životinja. Kontaktirajte je na [e-pošta zaštićena].
Više članakaAgne je novinarka koja pokriva najnovije trendove i razvoj u metaverzumu, umjetnoj inteligenciji i Web3 industrije za Metaverse Post. Njezina strast za pripovijedanjem dovela ju je do brojnih intervjua sa stručnjacima u tim područjima, uvijek nastojeći otkriti uzbudljive i privlačne priče. Agne je diplomirala književnost i ima opsežno iskustvo u pisanju o širokom rasponu tema, uključujući putovanja, umjetnost i kulturu. Također je volontirala kao urednica organizacije za prava životinja, gdje je pomogla u podizanju svijesti o pitanjima dobrobiti životinja. Kontaktirajte je na [e-pošta zaštićena].