OpenAI sprosti močan ChatGPT AI klepet
Na kratko
ChatGPT je najpametnejši pogovorni model AI
ChatGPT, za razliko od GPT-3, je model, ki je bil skrbno naučen voditi interaktivni klepet in ohranjati tok diskurza. Model, ki je treniral ChatGPT, ki je opravil usposabljanje v začetku leta 2022, je iz GPT-3.5 seriji.
Oblika dialoga omogoča ChatGPT odgovarjati na dodatne poizvedbe, priznavati svoje napake, ovreči napačne predpostavke in zavračati nepomembne zahteve. Klepetalni robot je zelo inteligenten in lahko ustvarja pisma, pripravlja smešne šale in odgovarja na vprašanja.
Tako kot InstructGPT, OpenAI uporabil Reinforcement Learning from Human Feedback (RLHF) za usposabljanje tega modela z nekaj manjšimi spremembami v ureditvi zbiranja podatkov. OpenAI uporablja nadzorovano fino nastavitev za usposabljanje začetnega modela tako, da človeški trenerji umetne inteligence v klepetih delujejo kot uporabnik in pomočnik umetne inteligence. Voditeljem je omogočil dostop do vzorčnih priporočil za pisanje, ki so jim pomagali pri ustvarjanju njihovih odgovorov.
Nekaj vzorcev dialogov je prikazanih na slikah.
Treba je bilo zbrati primerjalne podatke, ki so bili sestavljeni iz dveh ali več odgovorov modela, razvrščenih po kakovosti, da bi razvili model nagrajevanja za učenje s krepitvijo. Razvijalci so posneli razprave, ki so jih trenerji AI vodili s chatbotom, da bi zbrali te informacije. Ustvarjalci so naključno izbrali modelno napisano izjavo, vzorčili številne možne zaključke in prosili trenerje AI, da jih razvrstijo. Model lahko prilagodi z optimizacijo proksimalne politike z uporabo teh modelov nagrajevanja.
Pogovorite se s tem chatbotom tukaj. Vendar so strežniki trenutno polni.
Preberite več GPT-3:
Zavrnitev odgovornosti
V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.
O avtorju
Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta.
več člankovDamir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta.