Novinky SMW Technika
10

Anthropic navrhuje „kontextovou umělou inteligenci“ pro modely chatu založenou na 60 principech

Stručně

OpenAI využívá k sladění učení zesilování z lidské zpětné vazby (RLHF). jazykové modely s lidskými zásadami, bezpečností a užitečností.

Společnost Antropic navrhla alternativní přístup: kontextovou umělou inteligenci, která zahrnuje lidi píšící ústavu, kterou by se měl model řídit.

Tato ústava je založena na Deklarace lidských práv Organizace spojených národů, smluvních podmínkách společnosti Apple a zásadách podporujících zvažování nezápadních perspektiv.

Společnost Anthropic navrhla nový přístup k trénování modelů chatu pomocí 'Ústavní AI'. Tato metoda staví na OpenAIJe posilování učení z lidské zpětné vazby, ale staví na ní tím, že se vyhýbá nutnosti psát hluboké tréninkové vzorky. Místo toho je model trénován tak, aby reagoval na vstupy prostřednictvím použití ústavy, která má fungovat jako soubor zákonů, které má model následovat.

Anthropic navrhuje „kontextovou umělou inteligenci“ pro modely chatu založenou na 60 principech
anthropic.com
Doporučená: Ex-OpenAI zaměstnanci založili společnost Anthropic, která přilákala více než 700 milionů dolarů na financování

Prostřednictvím této metody může umělá inteligence generovat své vlastní tréninkové vzorky vyhodnocením toho, co řekla, oproti souboru právně přijatých zásad. Tato technika šetřící čas může být viděna jako Isaac Asimov's Zákony robotiky uvést do praxe.

Principů, které tvoří základ modelu, je příliš mnoho na to, abychom je mohli podrobně probrat. Pokrývají však mnoho témat, jako je morálka, averze k riziku, ekonomika a umělá inteligence. Každý z nich byl vyvinut, aby pomohl AI řídit rozhodnutí, pokud jde o reakci konverzační výzvy.

Anthropic dokázal efektivně vycvičit model umělé inteligence jménem Claude, který úspěšně konkuruje OpenAIJe ChatGPT. Za použití Constitution-AI metodaClaude mohl reagovat na konverzační výzvy s působivou úrovní přesnosti, ale očekává se další vylepšení, protože Anthropic pokračuje v budování této technologie, která mění hru.

Pomocí sady principů a několika příkladů procesů se model učí, jak vyhodnocovat a revidovat své vlastní odpovědi během první fáze. Druhá fáze zahrnuje trénování modelu pomocí posilovacího učení, ale místo využití vstupu od lidí využívá zpětnou vazbu generovanou umělou inteligencí založenou na souboru principů k výběru příznivějšího výstupu.

Tento nový přístup má skutečně potenciál ušetřit čas a peníze společnostem, které již nebudou muset vytvářet vlastní vzorky školení. Tuto „hotovou“ metodu lze spíše použít jako základ pro vytváření modelů přizpůsobených na míru – nejsou vyžadovány žádné znalosti programování. Je také důležité poznamenat, že tato technologie také slibuje zvýšení bezpečnosti, pokud jde o konverzační roboty. Vytvoření souboru právně akceptovaných principů zmírňuje riziko AI šířících se darebáků.

Constituation AI proto nejen slibuje, že vývoj modelu chatu usnadní a urychlí, ale také jej učiní bezpečnější. Situace oboustranně výhodná pro svět umělé inteligence a chatbotů.

Analytický pohled na „kontextovou umělou inteligenci“ Anthropic pro chatboty

Kontextová umělá inteligence společnosti Anthropic je založena na začlenění více než 60 principů odvozených z Deklarace lidských práv Organizace spojených národů, smluvních podmínek společnosti Apple, zásad podporujících zvažování nezápadních perspektiv, Deepmind's Vrabčí pravidla a antropický výzkum sada 1 a sada 2.

Skutečnost, že umělou inteligenci lze nyní naučit chovat se podle principů odvozených z tak rozsáhlé a rozmanité řady zdrojů, je skutečně pozoruhodná. Začleněním zásad z Deklarace lidských práv OSN například nyní odpovědi chatbotů odrážejí důležitost zachování pojmu svobody, rovnosti a bratrství. Takové zásady jsou zásadní součástí zajištění toho konverzace chatbotů zůstat etický a respektující. Stejně tak začlenění smluvních podmínek společnosti Apple zajišťuje chatbot zohledňuje zájmy soukromí svých uživatelů.

Zásady podporující zohlednění nezápadních perspektiv také hrají důležitou roli v modelu „kontextové umělé inteligence“. Tyto principy odrážejí potřebu, aby umělá inteligence respektovala jiné kultury a zajistila, že odpovědi chatbotů nebudou vnímány jako škodlivé nebo urážlivé. Podobně pravidla Deepmind Sparrow nařizují, aby chatbot reagoval odpověďmi určenými k vybudování vztahu s uživatelem.

Začlenění Anthropic Research Set 1 a Set 2 poskytuje konečnou záruku, že konverzace s umělou inteligencí zůstanou civilní a uctivé. Umělá inteligence je vycvičena, aby zajistila, že bude odpovídat na otázky promyšleným a zdvořilým způsobem.

Celkově vzato je model „Contextual AI“ společnosti Anthropic neuvěřitelně důležitým průlomem v oblasti výzkum AI. Tím, že umožňuje výuku umělé inteligence podle principů odvozených z tak rozmanité škály zdrojů, se výrazně zlepšily etické důsledky automatizovaných konverzací.

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
Business Novinky Technika
Injective spojuje síly s AltLayer, aby přineslo zabezpečení při opětovném skládání do inEVM
3
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
Trhy Novinky Technika
Masa se spojila s Tellerem, aby zavedla MASA Půjčovací fond, umožní USDC půjčování na základně
3
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
Trhy Novinky Technika
Velodrome spouští v nadcházejících týdnech beta verzi Superchain a rozšiřuje se o blockchainy OP Stack Layer 2
3
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
Business Novinky Technika
CARV oznamuje partnerství se společností Aethir za účelem decentralizace její datové vrstvy a distribuce odměn
3
CRYPTOMERIA LABS PTE. LTD.