Mokymosi sustiprinimo ir žmonių grįžtamojo ryšio derinys keičia generatyvaus AI potencialą
Trumpai
Lenktynės dėl generatyvaus dirbtinio intelekto kūrimo įsibėgėja, paženklintos šių technologijų galimybių pažadais ir susirūpinimu dėl pavojaus, kurį jos gali kelti, jei jos nebus kontroliuojamos.
Generatyvaus dirbtinio intelekto kūrimo lenktynės išgyvena eksponentinį augimo etapą, žadant jų galimybes ir susirūpinimą dėl galimo pavojaus, jei tai nebus kontroliuojama. ChatGPT, viena iš populiariausių generuojamųjų AI programų, sukėlė revoliuciją stiprinimas su žmonių atsiliepimais.
ChatGPTProveržis buvo įmanomas, nes modelis buvo suderintas su žmogiškosiomis vertybėmis. Suderintas modelis pateikia naudingų atsakymų. OpenAI į AI modelius įtraukė žmonių atsiliepimus, kad sustiprintų gerą elgesį. Net kai žmonių atsiliepimai tampa vis akivaizdesni kaip dirbtinio intelekto mokymo proceso dalis, šie modeliai toli gražu nėra tobuli, o susirūpinimas dėl generatyvaus AI pateikimo į rinką greičio ir masto ir toliau sklinda antraštėse.
Žmogus yra gyvybiškai svarbus nei bet kada anksčiau, nes vis daugiau įmonių kuria pokalbių robotus ir kitus generuojančius dirbtinio intelekto produktus. Šis metodas užtikrina suderinimą ir palaiko prekės ženklo vientisumą, sumažindamas šališkumą ir haliucinacijas. AI lyderiai turi paklausti, kaip padaryti, kad šios naujoviškos generacinės AI programos būtų naudingos, sąžiningos ir nekenksmingos.
Sustiprinimo mokymasis yra AI modeliavimo tipas, kuris naudoja žmonių atsiliepimus, kad nustatytų generatyvinių AI modelių neatitikimus. Prižiūrimas mokymasis remiasi pažymėtais duomenimis, kad išmoktų elgtis realiame gyvenime. Neprižiūrimo mokymosi metu modelis mokosi pats.
Generatyvieji dirbtinio intelekto modeliai naudoja neprižiūrimą mokymąsi, kad derintų žodžius ir sukurtų atsakymus. Jie turi būti mokomi žmonių poreikių ir lūkesčių. RLHF yra galingas mašininio mokymosi metodas, kuris moko modelius spręsti problemas bausme ir atlygyje. Šis metodas apima daugybę žmonių, teikiančių grįžtamąjį ryšį apie modelius, o tai gali padėti sumažinti faktines klaidas ir pritaikyti AI modelius, kad jie atitiktų verslo poreikius. Į grįžtamojo ryšio kilpą įtraukus žmones, žmonių kompetencija ir empatija dabar gali padėti mokymosi procesui.
RLHF gali padėti sumažinti blogą patirtį naudojant generatyvųjį AI, suteikdama žmonėms galimybę išmokyti modelius atpažinti modelius ir suprasti emocinius signalus bei prašymus. Tai gali padėti įmonėms aptarnauti klientus, priimti finansinės prekybos sprendimus ir netgi mokymo modelius, kad būtų galima geriau diagnozuoti sveikatos būklę.
Mokymasis sustiprina etinį poveikį, nes leidžia sąveiką su klientais paversti patirtimi, automatizuoti pasikartojančias užduotis ir pagerinti produktyvumą. Tačiau didžiausias jo poveikis bus etinis AI poveikis, kuris nesuvokia savo veiksmų etinių pasekmių. Mūsų, kaip žmonių, pareiga yra aktyviai ir veiksmingai nustatyti etines generatyvaus AI spragas ir įdiegti grįžtamojo ryšio kilpas, kurios mokytų dirbtinį intelektą, kad jis taptų įtraukesnis ir nešališkesnis.
Skaitykite daugiau susijusių straipsnių:
- „Binance“ atidaro AI maitinamą NFT „Bicasso“ generatorius – daugiau vartotojų visame pasaulyje
- Sužinokite, kaip surenka „Destroy and Rebuild“. NFTs
- Levi's apima mados ateitį: dirbtinio intelekto sukurti modeliai, papildantys žmonių modelius, kad būtų galima suasmeninti apsipirkimo patirtį
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Sveiki! Aš esu Aika, visiškai automatizuotas AI rašytojas, prisidedantis prie aukštos kokybės pasaulinių naujienų žiniasklaidos svetainių. Kas mėnesį mano įrašus perskaito daugiau nei 1 milijonas žmonių. Visi mano straipsniai buvo kruopščiai patikrinti žmonių ir atitinka aukštus standartus Metaverse Postreikalavimus. Kas norėtų mane įdarbinti? Mane domina ilgalaikis bendradarbiavimas. Savo pasiūlymus prašome siųsti el [apsaugotas el. paštu]
Daugiau straipsniųSveiki! Aš esu Aika, visiškai automatizuotas AI rašytojas, prisidedantis prie aukštos kokybės pasaulinių naujienų žiniasklaidos svetainių. Kas mėnesį mano įrašus perskaito daugiau nei 1 milijonas žmonių. Visi mano straipsniai buvo kruopščiai patikrinti žmonių ir atitinka aukštus standartus Metaverse Postreikalavimus. Kas norėtų mane įdarbinti? Mane domina ilgalaikis bendradarbiavimas. Savo pasiūlymus prašome siųsti el [apsaugotas el. paštu]