Stability AI„StableVicuna“ yra pirmasis pokalbių robotas, išmokytas su žmonių atsiliepimais
Trumpai
Stability AI išleidžia StableVicuna, pirmąjį didelio masto atvirojo kodo pokalbių robotą, kuris naudoja sustiprinimo mokymąsi su žmogaus atsiliepimais (RLHF).
StableVicuna yra pagrįsta Vicuna pokalbių robotu ir naudoja 13 mlrd. parametrą LLaMA modelis.
Stability AI turi pristatė naujausias AI proveržis – StableVicuna – pirmasis didelio masto atvirojo kodo pokalbių robotas, apmokytas atsižvelgiant į žmonių atsiliepimus. Novatoriškas pokalbių robotas yra sumanymas Stability AI, kompanija, sukūrusi populiarų atvirojo kodo vaizdo modelį, Stable Diffusionir naujausias AI vaizdo generavimo algoritmas, DeepFloyd.
„StableVicuna“ yra pagrįstas Vicuna pokalbių robotu, išleistu balandžio mėnesį, kuris naudoja 13 mlrd LLaMA modelis. Kas nustato Vicuna variantą Stability AI ir Carper AI, išskyrus tai, kad jis naudoja mokymąsi su žmogaus atsiliepimais (RLHF). Šis metodas leidžia nuolat tobulinti modelį.
Stability AI rodo, kad pokalbių robotai yra sėkmingi dėl dviejų mokymo metodų tipų: instrukcijų koregavimo ir mokymosi per žmogaus grįžtamąjį ryšį sustiprinimo. Tačiau dauguma esamų pokalbių robotų modelių naudoja tik vieną iš šių metodų, o ne abu. Neseniai RLHF mokymo duomenų rinkiniai tapo viešai prieinami. Taigi, kartu su patogia mokymo priemone, tai leido sukurti StableVicuna, kuri yra pirmoji didelio masto chatbot modelis kuri apima abiejų tipų mokymus.
StableVicuna apima teksto generavimą, paprastas matematines funkcijas ir galimybę rašyti kodą. Pagal įprastus etalonus jis yra panašus į kitus atvirojo kodo pokalbių robotus.
Pagal Dekoderis, atvirojo kodo pokalbių robotai, suderinti su duomenimis iš kitų pokalbių robotų, gali sustiprinti esamas klaidas ir paklaidas per pasikartojančius mokymus, sukeldami aido kameros efektą. Tikslūs duomenys taip pat gali sustiprinti haliucinacijas, nes pateikia informaciją, kurios nėra pradiniame modelyje.
Vartotojai gali pasiekti pokalbių roboto demonstracinę versiją ApkabinantisVeidas. Bendrovė taip pat atskleidė planus ateityje teikti „StableVicuna“ per pokalbių sąsają.
Plačiau paskaitykite čia:
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Agnė yra žurnalistė, kuri pasakoja apie naujausias tendencijas ir pokyčius metaverse, AI ir Web3 pramonės šakoms Metaverse Post. Jos aistra pasakojimui paskatino ją vesti daugybę interviu su šių sričių ekspertais, visada siekdama atskleisti įdomių ir įtraukiančių istorijų. Agnė yra įgijusi literatūros bakalauro laipsnį ir daug rašo įvairiomis temomis, įskaitant keliones, meną ir kultūrą. Ji taip pat savanoriavo gyvūnų teisių organizacijos redaktore, kur padėjo didinti informuotumą apie gyvūnų gerovės problemas. Susisiekite su ja [apsaugotas el. paštu].
Daugiau straipsniųAgnė yra žurnalistė, kuri pasakoja apie naujausias tendencijas ir pokyčius metaverse, AI ir Web3 pramonės šakoms Metaverse Post. Jos aistra pasakojimui paskatino ją vesti daugybę interviu su šių sričių ekspertais, visada siekdama atskleisti įdomių ir įtraukiančių istorijų. Agnė yra įgijusi literatūros bakalauro laipsnį ir daug rašo įvairiomis temomis, įskaitant keliones, meną ir kultūrą. Ji taip pat savanoriavo gyvūnų teisių organizacijos redaktore, kur padėjo didinti informuotumą apie gyvūnų gerovės problemas. Susisiekite su ja [apsaugotas el. paštu].