GPT-4 Peri "Hallusinoivat" tosiasiat ja päättelyvirheet aikaisemmasta GPT Mallit
Lyhyesti
OpenAI sanoo GPT-4 on samat rajoitukset kuin aiemmin GPT mallit.
GPT-4 edelleen hallusinoi tosiasioita ja tekee päättelyvirheitä.
Kuitenkin, GPT-4 pisteet 40 % korkeammat kuin OpenAIviimeisin GPT-3.5 yhtiön sisäisistä kontradiktorisista tosiasiaarvioista.
OpenAI on varoittanut käyttäjiä, että sen uusin kielimalli, GPT-4, ei ole vieläkään täysin luotettava ja voi "halusinoida" tosiasioita ja tehdä päättelyvirheitä. Yritys kehottaa käyttäjiä olemaan varovainen käytettäessä kielimallin tuloksia, erityisesti "korkeiden panosten konteksteissa".
Hyvä uutinen on kuitenkin se GPT-4 vähentää merkittävästi hallusinaatioita verrattuna aikaisempiin malleihin. OpenAI väittää että GPT-4 40 % korkeampi kuin viimeisin GPT-3.5 sisäisistä kontradiktorisen tosiasian arvioinneista.
"Olemme edistyneet ulkoisissa vertailuarvoissa, kuten TruthfulQA, joka testaa mallin kykyä erottaa tosiasiat kilpailevan tahdon perusteella valituista virheellisistä väitteistä. Nämä kysymykset yhdistetään tosiasiallisesti vääriin vastauksiin, jotka ovat tilastollisesti houkuttelevia. OpenAI kirjoitti a blogi.
Tästä parannuksesta huolimatta mallista puuttuu edelleen tieto syyskuun 2021 jälkeen tapahtuneista tapahtumista ja se tekee toisinaan yksinkertaisia päättelyvirheitä, kuten aikaisemmat mallit tekevät. Lisäksi se voi olla liian herkkäuskoinen hyväksyessään ilmeisiä vääriä lausuntoja käyttäjiltä ja epäonnistua vaikeissa ongelmissa, kuten tietoturva-aukkojen lisäämisessä koodiinsa. Se ei myöskään tarkasta tosiasiallisesti antamiaan tietoja.
Kuten edeltäjiäkin, GPT-4 voi tuottaa haitallisia neuvoja, virheellistä koodia tai epätarkkoja tietoja. Mallin lisäominaisuudet johtavat kuitenkin uusiin riskipintoihin, jotka on ymmärrettävä. Näiden riskien laajuuden arvioimiseksi yli 50 asiantuntijaa Useilta eri aloilta, mukaan lukien tekoälyn kohdistusriskit, kyberturvallisuus, bioriski, luottamus ja turvallisuus sekä kansainvälinen turvallisuus, osallistuivat mallin vastakkaiseen testaukseen. Heidän palautetta ja tietoja käytettiin sitten mallin parantamiseen, kuten lisätietojen keräämiseen parantamiseksi GPT-4kyky hylätä vaarallisten kemikaalien syntetisointia koskevat pyynnöt.
Yksi tärkeimmistä tavoista OpenAI Haitallisten tulosten vähentäminen on sisällyttämällä ylimääräinen turvapalkkiosignaali RLHF-koulutuksen (Reinforcement Learning from Human Feedback) aikana. Signaali kouluttaa mallin hylkäämään haitallisen sisällön pyynnöt, kuten defimallin käyttöohjeiden mukaan. Palkinnon tarjoaa a GPT-4 zero-shot -luokitin, joka arvioi turvallisuuden rajat ja valmistumistyylin turvallisuuteen liittyvien kehotteiden perusteella.
OpenAI sanoi myös, että se oli vähentänyt mallin taipumusta vastata kiellettyä sisältöä koskeviin pyyntöihin 82 % verrattuna GPT-3.5 ja GPT-4 vastaa arkaluonteisiin pyyntöihin, kuten lääketieteellisiin neuvoihin ja itsensä vahingoittamiseen yrityksen politiikan mukaisesti 29 % useammin.
Vaikka OpenAIn interventiot ovat lisänneet vaikeutta saada esiin huonoa käytöstä GPT-4, se on edelleen mahdollista, ja edelleen on jailbreakit, jotka voivat luoda sisältöä, joka rikkoo käyttösääntöjä.
”Tekoälyjärjestelmien yleistyessä näiden interventioiden korkean luotettavuuden saavuttaminen tulee yhä kriittisemmäksi. Toistaiseksi on olennaista täydentää näitä rajoituksia käyttöönottoajan turvatekniikoilla, kuten väärinkäytösten valvonnalla”, yhtiö lisäsi.
OpenAI tekee yhteistyötä ulkopuolisten tutkijoiden kanssa ymmärtääkseen ja arvioidakseen paremmin toiminnan mahdollisia vaikutuksia GPT-4 ja sen seuraajamallit. Tiimi kehittää myös arvioita vaarallisista ominaisuuksista, joita saattaa ilmaantua tulevissa tekoälyjärjestelmissä. Kun he jatkavat potentiaalisten sosiaalisten ja taloudellisia vaikutuksia of GPT-4 ja muut tekoälyjärjestelmät, OpenAI jakavat havaintonsa ja näkemyksensä yleisön kanssa ajoissa.
Lue lisää:
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Cindy on toimittaja osoitteessa Metaverse Post, joka kattaa aiheeseen liittyviä aiheita web3, NFT, metaverse ja AI, keskittyen haastatteluihin Web3 alan toimijoita. Hän on puhunut yli 30 C-tason johtajalle ja tuonut heidän arvokkaita oivalluksiaan lukijoille. Alunperin Singaporesta kotoisin oleva Cindy on nykyään Tbilisissä, Georgiassa. Hänellä on kandidaatin tutkinto viestinnästä ja mediatutkimuksesta Etelä-Australian yliopistosta, ja hänellä on vuosikymmenen kokemus journalismista ja kirjoittamisesta. Ota häneen yhteyttä kautta [sähköposti suojattu] lehdistöpuheilla, ilmoituksilla ja haastattelumahdollisuuksilla.
lisää artikkeleitaCindy on toimittaja osoitteessa Metaverse Post, joka kattaa aiheeseen liittyviä aiheita web3, NFT, metaverse ja AI, keskittyen haastatteluihin Web3 alan toimijoita. Hän on puhunut yli 30 C-tason johtajalle ja tuonut heidän arvokkaita oivalluksiaan lukijoille. Alunperin Singaporesta kotoisin oleva Cindy on nykyään Tbilisissä, Georgiassa. Hänellä on kandidaatin tutkinto viestinnästä ja mediatutkimuksesta Etelä-Australian yliopistosta, ja hänellä on vuosikymmenen kokemus journalismista ja kirjoittamisesta. Ota häneen yhteyttä kautta [sähköposti suojattu] lehdistöpuheilla, ilmoituksilla ja haastattelumahdollisuuksilla.