Buletin de stiri SMW Tehnologia
10 Mai, 2023

Anthropic propune o „IA contextuală” pentru modelele de chat bazate pe 60 de principii

Pe scurt

OpenAI folosește învățarea prin întărire din feedbackul uman (RLHF) pentru a se alinia modele de limbaj cu principii umane, siguranță și utilitate.

Anthropic a propus o abordare alternativă: IA contextuală, care implică oamenii care scriu o constituție pe care modelul ar trebui să o urmeze.

Această constituție se bazează pe Declarația Națiunilor Unite a Drepturilor Omului, Termenii și condițiile Apple, Principiile care încurajează luarea în considerare a perspectivelor non-occidentale.

Anthropic a propus o nouă abordare pentru formarea modelelor de chat folosind „AI constituțional'. Această metodă se bazează pe OpenAI'S Consolidarea învățării din feedbackul uman, dar se bazează pe acesta, evitând necesitatea de a scrie mostre de antrenament profund. În schimb, modelul este antrenat să răspundă la input prin utilizarea unei constituții care este menită să acționeze ca un set de legi pe care modelul trebuie să le urmeze.

Anthropic propune o „IA contextuală” pentru modelele de chat bazate pe 60 de principii
antropic.com
Recomandat: ex-OpenAI angajații au fondat Anthropic, o afacere care a atras finanțare de peste 700 de milioane de dolari

Prin această metodă, IA își poate genera propriile mostre de antrenament, evaluând ceea ce a spus față de setul său de principii acceptate legal. Această tehnică de economisire a timpului poate fi văzută ca Isaac Asimov„s Legile roboticii puse în practică.

Principiile care stau la baza modelului sunt prea numeroase pentru a fi discutate în detaliu. Cu toate acestea, ele acoperă multe subiecte, cum ar fi moralitatea, aversiunea la risc, economia și inteligența artificială. Fiecare a fost dezvoltat pentru a ajuta la ghidarea deciziilor AI atunci când vine vorba de răspuns sugestii conversaționale.

Anthropic a reușit să antreneze eficient un model AI pe nume Claude, cu care concurează cu succes OpenAI'S ChatGPT. Folosind Metoda Constituție-AI, Claude ar putea răspunde la solicitările conversaționale la un nivel impresionant de acuratețe, dar sunt de așteptat îmbunătățiri suplimentare pe măsură ce Anthropic continuă să se bazeze pe această tehnologie care schimbă jocul.

Folosind setul de principii și câteva exemple de proces, modelul este învățat cum să-și evalueze și să-și revizuiască propriile răspunsuri pe parcursul primei faze. A doua etapă implică antrenarea unui model folosind învățarea prin întărire, dar în loc să folosească inputuri de la oameni, acesta folosește feedback generat de AI bazat pe un set de principii pentru a selecta rezultatul mai bun.

Într-adevăr, această nouă abordare are potențialul de a economisi timp și bani pentru companiile care nu vor mai avea nevoie să-și construiască propriile mostre de formare. Mai degrabă, această metodă „gata făcută” poate fi folosită ca bază pentru crearea modelelor personalizate – nu sunt necesare cunoștințe de programare. De asemenea, este important să rețineți că această tehnologie promite, de asemenea, să sporească siguranța atunci când vine vorba de roboții conversaționali. Crearea unui set de principii acceptate legal atenuează riscul a IA care devine necinstită.

Prin urmare, Constituation AI nu numai că promite că va face dezvoltarea modelului de chat mai ușoară și mai rapidă, dar o va face și mai sigură. O situație de câștig-câștig pentru lumea inteligenței artificiale și a chatBot-urilor deopotrivă.

O privire analitică asupra „IA contextuală” de la Anthropic pentru chatbot

IA contextuală de la Anthropic se bazează pe încorporarea a peste 60 de principii derivate din Declarația Națiunilor Unite a Drepturilor Omului, Termenii și condițiile Apple, Principiile care încurajează luarea în considerare a perspectivelor non-occidentale, Al minții adânci Reguli Sparrow și Setul 1 și Setul 2 de cercetare antropică.

Faptul că AI poate fi acum învățat să se comporte conform principiilor derivate dintr-o gamă atât de extinsă și diversă de surse este cu adevărat remarcabil. Prin încorporarea principiilor din Declarația Națiunilor Unite a Drepturilor Omului, de exemplu, răspunsurile chatbot reflectă acum importanța păstrării noțiunii de libertate, egalitate și fraternitate. Astfel de principii sunt o componentă vitală pentru asigurarea acestui fapt conversații chatbot rămâne etică și respectuoasă. De asemenea, încorporarea Termenilor și condițiilor Apple asigură chatbot ia în considerare interesele de confidențialitate ale utilizatorilor săi.

Principiile care încurajează luarea în considerare a perspectivelor non-occidentale joacă, de asemenea, un rol important în modelul „IA contextuală”. Aceste principii reflectă necesitatea ca AI să respecte alte culturi și să se asigure că răspunsurile chatbot nu sunt percepute ca fiind dăunătoare sau ofensatoare. În mod similar, Regulile Sparrow ale Deepmind dictează că chatbot-ul răspunde cu răspunsuri menite să construiască o relație cu utilizatorul.

Încorporarea setului 1 și a setului 2 de cercetare antropică oferă garanția finală că conversațiile AI rămân civile și respectuoase. AI este antrenat pentru a se asigura că răspunde la întrebări într-un mod atent și politicos.

Una peste alta, modelul „Contextual AI” al Anthropic este o descoperire incredibil de importantă în domeniul Cercetare AI. Permițând AI să fie predată conform principiilor derivate dintr-o gamă atât de diversă de surse, implicațiile etice ale conversațiilor automate sunt mult îmbunătățite.

Citiți mai multe despre AI:

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Apetitul instituțional crește față de ETF-urile Bitcoin pe fondul volatilității

Dezvăluirile prin dosarele 13F dezvăluie investitori instituționali de seamă care se amestecă în ETF-uri Bitcoin, subliniind o acceptare tot mai mare a...

Aflați mai multe

Sosește ziua sentinței: soarta lui CZ este în echilibru, în timp ce tribunalul american ia în considerare pledoaria DOJ

Changpeng Zhao este pe cale de a fi condamnat astăzi într-un tribunal american din Seattle.

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
Afaceri Buletin de stiri Tehnologia
Injective își unește forțele cu AltLayer pentru a aduce securitatea refacerii în EVM
3 Mai, 2024
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
pieţe Buletin de stiri Tehnologia
Masa face echipă cu Teller pentru a introduce grupul de împrumuturi MASA, care permite împrumuturile USDC pe bază
3 Mai, 2024
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
pieţe Buletin de stiri Tehnologia
Velodrome lansează versiunea Beta a Superchain în săptămânile următoare și se extinde în blockchainurile OP Stack Layer 2
3 Mai, 2024
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
Afaceri Buletin de stiri Tehnologia
CARV anunță parteneriat cu Aethir pentru a-și descentraliza stratul de date și a distribui recompense
3 Mai, 2024
CRYPTOMERIA LABS PTE. LTD.