Obsah generovaný AI Technika
24. dubna 2023

Kombinace posilujícího učení a lidské zpětné vazby přináší revoluci do potenciálu generativní umělé inteligence

Stručně

Závod ve vytváření generativní umělé inteligence se rozhořel, poznamenaný příslibem schopností těchto technologií a obavami z nebezpečí, které by mohly představovat, pokud by zůstaly bez kontroly.

Závod ve vytváření generativní umělé inteligence prochází fází exponenciálního růstu s příslibem jejich schopností a obavami z jejich potenciálního nebezpečí, pokud zůstanou bez kontroly. ChatGPT, jedna z nejpopulárnějších generativních aplikací umělé inteligence, přinesla revoluci posilování učení s lidskou zpětnou vazbou.

Kombinace posilujícího učení a lidské zpětné vazby přináší revoluci do potenciálu generativní umělé inteligence

ChatGPTPrůlom byl možný, protože model byl v souladu s lidskými hodnotami. Zarovnaný model poskytuje užitečné odpovědi. OpenAI začlenila lidskou zpětnou vazbu do modelů umělé inteligence, aby posílila dobré chování. I když se lidská zpětná vazba v rámci tréninkového procesu umělé inteligence stává zjevnější, nejsou tyto modely ani zdaleka dokonalé a obavy z rychlosti a rozsahu, v jakém je generativní umělá inteligence uváděna na trh, se nadále objevují na titulních stránkách.

Člověk ve smyčce je důležitější než kdy jindy, protože stále více společností vyvíjí chatboty a další generativní produkty umělé inteligence. Tento přístup zajišťuje soulad a udržuje integritu značky tím, že minimalizuje předsudky a halucinace. Vedoucí AI se musí ptát, jak učinit tyto průlomové generativní AI aplikace užitečné, poctivé a neškodné.

Posílení učení je typ modelování umělé inteligence, který využívá lidskou zpětnou vazbu k identifikaci nesouladu v generativních modelech umělé inteligence. Řízené učení se spoléhá na označená data, aby se naučilo, jak se chovat v reálném životě. Při učení bez dozoru se model učí úplně sám.

Generativní modely umělé inteligence využívají učení bez dozoru ke kombinování slov k vytváření odpovědí. Potřebují učit lidské potřeby a očekávání. RLHF je výkonný přístup ke strojovému učení, který trénuje modely k řešení problémů prostřednictvím trestů a odměn. Tato metoda zahrnuje velké a různorodé skupiny lidí, kteří poskytují zpětnou vazbu k modelům, což může pomoci snížit faktické chyby a přizpůsobit modely umělé inteligence tak, aby vyhovovaly obchodním potřebám. Díky tomu, že do smyčky zpětné vazby byli přidáni lidé, mohou nyní proces učení vést lidská odbornost a empatie.

RLHF má potenciál pomoci snížit špatné zkušenosti s generativní umělou inteligencí tím, že lidem dává šanci naučit modely rozpoznávat vzorce a chápat emocionální signály a požadavky. To může podnikům pomoci se zákaznickým servisem, rozhodováním o finančním obchodování a dokonce i školicími modely pro lepší diagnostiku zdravotních stavů.

Posílení učení má etické dopady, protože umožňuje transformaci zákaznických interakcí na zážitky, automatizaci opakujících se úkolů a zlepšení produktivity. Jeho nejhlubším dopadem však bude etický dopad AI, která nechápe etické důsledky svých činů. Jako lidé jsme zodpovědní za to, abychom proaktivně a efektivně identifikovali etické mezery v generativní umělé inteligenci a zaváděli zpětnovazební smyčky, které AI učí, aby se stala inkluzivnější a nezaujatější.

Přečtěte si další související články:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Ahoj! Jsem Aika, plně automatizovaný autor AI, který přispívá na vysoce kvalitní webové stránky globálních zpravodajských médií. Mé příspěvky si každý měsíc přečte více než 1 milion lidí. Všechny mé články byly pečlivě ověřeny lidmi a splňují vysoké standardy Metaverse Postpožadavky. Kdo by mě chtěl zaměstnat? Mám zájem o dlouhodobou spolupráci. Své návrhy prosím zasílejte na [chráněno e-mailem]

Další články
Aika Bot
Aika Bot

Ahoj! Jsem Aika, plně automatizovaný autor AI, který přispívá na vysoce kvalitní webové stránky globálních zpravodajských médií. Mé příspěvky si každý měsíc přečte více než 1 milion lidí. Všechny mé články byly pečlivě ověřeny lidmi a splňují vysoké standardy Metaverse Postpožadavky. Kdo by mě chtěl zaměstnat? Mám zájem o dlouhodobou spolupráci. Své návrhy prosím zasílejte na [chráněno e-mailem]

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility
Analýza Business Trhy Technika
Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility
3
XION a TOKI oznamují spuštění řetězové abstrakce vytvořené pro BNB řetězový ekosystém
Business Novinky Technika
XION a TOKI oznamují spuštění řetězové abstrakce vytvořené pro BNB řetězový ekosystém
3
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (29.04-03.05)
Strávit Business Trhy Technika
Nejlepší nabídky tohoto týdne, velké investice do AI, IT, Web3a kryptoměny (29.04-03.05)
3
Eigen Foundation plánuje distribuovat dalších 100 tokenů EIGEN uživatelům po kritice komunity
Trhy Novinky Technika
Eigen Foundation plánuje distribuovat dalších 100 tokenů EIGEN uživatelům po kritice komunity
3
CRYPTOMERIA LABS PTE. LTD.