Novinová správa SMW Technológia
Môže 10, 2023

Anthropic navrhuje „kontextovú AI“ pre modely chatu založenú na 60 princípoch

Stručne

OpenAI na zosúladenie využíva učenie sa zosilnením z ľudskej spätnej väzby (RLHF). jazykové modely s ľudskými princípmi, bezpečnosťou a užitočnosťou.

Antropic navrhol alternatívny prístup: kontextovú AI, ktorá zahŕňa ľudí, ktorí píšu ústavu, ktorú by mal model nasledovať.

Táto ústava je založená na Deklarácii ľudských práv Organizácie Spojených národov, zmluvných podmienkach spoločnosti Apple a zásadách povzbudzujúcich zohľadňovanie nezápadných perspektív.

Antropic navrhol nový prístup k trénovaniu modelov chatu pomocou 'Ústavná AI'. Táto metóda stavia na OpenAI'S posilňovanie učenia od ľudskej spätnej väzby, ale stavia na nej tým, že sa vyhýba potrebe písať hlboké tréningové vzorky. Namiesto toho je model trénovaný tak, aby reagoval na vstupy prostredníctvom použitia ústavy, ktorá má pôsobiť ako súbor zákonov, ktoré má model nasledovať.

Anthropic navrhuje „kontextovú AI“ pre modely chatu založenú na 60 princípoch
anthropic.com
Odporúčaná: ex-OpenAI zamestnanci založili spoločnosť Anthropic, ktorá prilákala viac ako 700 miliónov dolárov na financovanie

Prostredníctvom tejto metódy môže AI generovať svoje vlastné tréningové vzorky vyhodnotením toho, čo povedala, v porovnaní so súborom právne akceptovaných princípov. Táto technika šetriaca čas môže byť videná ako Isaac Asimov, s Zákony robotiky uviesť do praxe.

Princípov, ktoré tvoria základ modelu, je príliš veľa na to, aby sme ich mohli podrobne rozobrať. Zaoberajú sa však mnohými témami, ako je morálka, averzia k riziku, ekonomika a umelá inteligencia. Každý z nich bol vyvinutý s cieľom pomôcť pri rozhodovaní AI, pokiaľ ide o reakciu konverzačné výzvy.

Anthropicu sa podarilo efektívne vycvičiť model AI menom Claude, ktorý úspešne konkuruje OpenAI'S ChatGPT, Pomocou Metóda Constitution-AI, Claude mohol reagovať na konverzačné výzvy s pôsobivou úrovňou presnosti, ale očakávajú sa ďalšie vylepšenia, pretože Anthropic pokračuje v budovaní tejto technológie, ktorá mení hru.

Pomocou súboru princípov a niekoľkých príkladov procesov sa model učí, ako hodnotiť a revidovať svoje vlastné odpovede počas prvej fázy. Druhá fáza zahŕňa trénovanie modelu pomocou posilňovacieho učenia, ale namiesto využívania vstupov od ľudí používa spätnú väzbu vygenerovanú AI na základe súboru princípov na výber priaznivejšieho výstupu.

Tento nový prístup má skutočne potenciál ušetriť čas a peniaze spoločnostiam, ktoré už nebudú musieť vytvárať svoje vlastné školiace vzorky. Túto „pripravenú“ metódu možno skôr použiť ako základ na vytváranie modelov prispôsobených na mieru – nie sú potrebné žiadne znalosti programovania. Je tiež dôležité poznamenať, že táto technológia tiež sľubuje zvýšenie bezpečnosti, pokiaľ ide o konverzačné roboty. Vytvorenie súboru právne akceptovaných princípov zmierňuje riziko umelej inteligencie.

Preto Constituation AI nielen sľubuje, že vývoj modelu chatu bude jednoduchší a rýchlejší, ale bude tiež bezpečnejší. Obojstranne výhodná situácia pre svet umelej inteligencie a chatbotov.

Analytický pohľad na „kontextovú AI“ spoločnosti Anthropic pre chatboty

Kontextová umelá inteligencia Antropic je založená na začlenení viac ako 60 princípov odvodených z Deklarácie ľudských práv Organizácie Spojených národov, zmluvných podmienok spoločnosti Apple, princípov povzbudzujúcich zohľadňovanie nezápadných perspektív, Deepmind's Vrabčie pravidlá a antropický výskum Set 1 a Set 2.

Skutočnosť, že AI sa teraz dá naučiť správať sa podľa princípov odvodených z tak rozsiahleho a rozmanitého množstva zdrojov, je skutočne pozoruhodná. Začlenením princípov z Deklarácie ľudských práv Organizácie Spojených národov, napríklad, odpovede chatbotov teraz odrážajú dôležitosť zachovania pojmu slobody, rovnosti a bratstva. Takéto zásady sú dôležitou súčasťou zabezpečenia toho konverzácie chatbotov zostať etický a rešpektujúci. Podobne začlenenie zmluvných podmienok spoločnosti Apple zabezpečuje Chatbot zohľadňuje záujmy svojich používateľov v oblasti súkromia.

Princípy podporujúce zohľadňovanie nezápadných perspektív tiež zohrávajú dôležitú úlohu v modeli „kontextovej AI“. Tieto princípy odrážajú potrebu, aby AI rešpektovala iné kultúry a zabezpečili, že odpovede chatbotov nebudú vnímané ako škodlivé alebo urážlivé. Podobne pravidlá Deepmind Sparrow diktujú, že chatbot reaguje odpoveďami určenými na vybudovanie vzťahu s používateľom.

Začlenenie Anthropic Research Set 1 a Set 2 poskytuje konečnú záruku, že konverzácie AI zostanú civilné a úctivé. Umelá inteligencia je vyškolená, aby zaistila, že na otázky odpovedá premysleným a zdvorilým spôsobom.

Celkovo možno povedať, že model „kontextovej AI“ spoločnosti Anthropic je neuveriteľne dôležitým prielomom v oblasti výskum AI. Umožnením vyučovania AI podľa princípov odvodených z tak rozmanitej škály zdrojov sa výrazne zlepšili etické dôsledky automatizovaných konverzácií.

Prečítajte si viac o AI:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Injective spája svoje sily s AltLayer, aby priniesla bezpečnosť pri prestavbe inEVM
firmy Novinová správa Technológia
Injective spája svoje sily s AltLayer, aby priniesla bezpečnosť pri prestavbe inEVM
Môže 3, 2024
Masa sa spojila so spoločnosťou Teller, aby predstavila fond pôžičiek MASA a umožnila požičiavanie USDC na základni
trhy Novinová správa Technológia
Masa sa spojila so spoločnosťou Teller, aby predstavila fond pôžičiek MASA a umožnila požičiavanie USDC na základni
Môže 3, 2024
Velodrome uvádza na trh beta verziu Superchain v najbližších týždňoch a rozširuje sa o blockchainy OP Stack Layer 2
trhy Novinová správa Technológia
Velodrome uvádza na trh beta verziu Superchain v najbližších týždňoch a rozširuje sa o blockchainy OP Stack Layer 2
Môže 3, 2024
CARV oznamuje partnerstvo so spoločnosťou Aethir s cieľom decentralizovať svoju dátovú vrstvu a distribuovať odmeny
firmy Novinová správa Technológia
CARV oznamuje partnerstvo so spoločnosťou Aethir s cieľom decentralizovať svoju dátovú vrstvu a distribuovať odmeny
Môže 3, 2024
CRYPTOMERIA LABS PTE. LTD.