Pot 01, 2023

Stability AIStableVicuna és el primer chatbot format amb comentaris humans

Publicat: 01 de maig de 2023 a les 12:00 Actualitzat: 01 de maig de 2023 a les 12:00

En breu

Stability AI llança StableVicuna, el primer chatbot de codi obert a gran escala, que utilitza Reinforcement Learning with Human Feedback (RLHF).

StableVicuna es basa en el chatbot Vicuna i utilitza un paràmetre de 13 milions LLaMA model.

Stability AI té introduir el seu darrer avenç en IA, StableVicuna, el primer chatbot de codi obert a gran escala entrenat amb comentaris humans. L'innovador chatbot és una creació de Stability AI, l'empresa que va crear el popular model d'imatge de codi obert, Stable Diffusioni el nou algorisme de generació d'imatges d'IA, DeepFloyd.

StableVicuna es basa en el chatbot Vicuna llançat a l'abril, que utilitza un paràmetre de 13 milions LLaMA model. El que marca la variant Vicunya Stability AI i Carper AI a part és el seu ús de l'aprenentatge de reforç amb retroalimentació humana (RLHF). Aquest mètode permet que el model millori contínuament.

Stability AI suggereix que els chatbots tenen èxit a causa de dos tipus de mètodes d'entrenament: l'ajustament de les instruccions i l'aprenentatge de reforç mitjançant la retroalimentació humana. Tanmateix, la majoria dels models de chatbots existents només utilitzen un d'aquests mètodes i no tots dos. Recentment, els conjunts de dades per a la formació RLHF s'han fet públics. Així, juntament amb una eina de formació fàcil d'utilitzar, això ha permès la creació de StableVicuna, que és la primera a gran escala model de chatbot que incorpori ambdós tipus de formació.

StableVicuna incorpora la generació de text, funcions matemàtiques senzilles i la capacitat d'escriure codi. És comparable a altres chatbots de codi obert en punts de referència comuns.

D'acord amb El descodificador, els chatbots de codi obert ajustats amb dades d'altres chatbots corren el risc d'amplificar els errors i els biaixos existents mitjançant un entrenament repetitiu, provocant un efecte de cambra d'eco. Les dades d'ajustament també poden agreujar les al·lucinacions introduint informació no present al model original.

Els usuaris poden accedir a una demostració del chatbot Cara abraçada. La companyia també ha revelat plans per proporcionar StableVicuna a través d'una interfície de xat en el futur.

Llegir més:

etiquetes:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

L'Agne és una periodista que cobreix les últimes tendències i desenvolupaments en el metavers, IA i Web3 indústries per a Metaverse Post. La seva passió per la narració l'ha portat a realitzar nombroses entrevistes amb experts en aquests camps, sempre buscant descobrir històries apassionants i atractives. L'Agne és llicenciada en literatura i té una àmplia experiència en l'escriptura sobre una àmplia gamma de temes, com ara viatges, art i cultura. També ha estat voluntaria com a editora de l'organització dels drets dels animals, on va ajudar a conscienciar sobre els problemes de benestar animal. Contacta amb ella [protegit per correu electrònic].

més articles

Agne Cimerman