Phi-1, kompakti kielimalli, ohittaa GPT Tehokas koodin luominen
Lyhyesti
Tutkijat kehittivät Phi-1, a kompakti kielimalli tehokkaaseen koodin luomiseen käyttämällä 1.3 miljardia parametria ja pienempää opetustietojoukkoa.
Pienemmästä koostaan huolimatta se saavuttaa vaikuttavia tuloksia: Pass@1-tarkkuus on 50.6 % HumanEvalissa ja 55.5 % MBPP-mittausarvoissa.
Phi-1, kompakti mutta tehokas malli, joka on erityisesti suunniteltu koodinluontitehtäviin. Toisin kuin edeltäjänsä, Phi-1 osoittaa ylivoimaista suorituskykyä koodauksessa ja muissa asiaan liittyvissä tehtävissä, samalla kun se käyttää huomattavasti vähemmän parametreja ja pienempää koulutustietojoukkoa.
Suositus: 12 parasta tekoälyn koodaustyökalua 2023 |
Phi-1, Transformer-pohjainen malli, erottuu joukosta vain 1.3 miljardilla parametrilla, mikä on vain murto-osa muiden kilpailevien mallien koosta. On huomattava, että se koulutettiin vain neljässä päivässä kahdeksalla A100:lla. Koulutusprosessi sisälsi huolellisesti kuratoitua "oppikirjalaatuista" verkosta peräisin olevaa dataa (6 miljardia merkkiä) sekä synteettisiä oppikirjoja ja harjoituksia, jotka luotiin GPT-3.5 (1 miljardi merkkiä).
Pienemmästä mittakaavasta huolimatta Phi-1 saavuttaa vaikuttavia tuloksia, ja sen pass@1-tarkkuus on 50.6 % HumanEvalissa ja 55.5 % MBPP-vertailuarvoissa. Lisäksi sillä on odottamattomia ilmentyviä ominaisuuksia verrattuna Phi-1-baseen, aikaisempaan malliin ennen hienosäätöä, ja Phi-1-small-malliin, pienempään malliin, jossa on 350 miljoonaa parametria. Pienemmästä koostaan huolimatta Phi-1 saavuttaa edelleen kiitettävän 45 % tarkkuuden HumanEvalissa.
Phi-1:n menestys johtuu harjoittelun aikana käytetystä korkealaatuisesta datasta. Aivan kuten kattava ja hyvin muotoiltu oppikirja auttaa oppilaita uusien aineiden hallitsemisessa, tutkijat keskittyivät "oppikirjalaatuisen" tiedon luomiseen parantaakseen oppimisen tehokkuutta. kielimalli. Tämä lähestymistapa johti malliin, joka ylittää useimmat avoimen lähdekoodin mallit koodauksen vertailuarvoissa, kuten HumanEval ja MBPP, huolimatta pienemmästä mallin koosta ja tietojoukon määrästä.
On kuitenkin tärkeää huomata joitain Phi-1:n rajoituksia suurempiin malleihin verrattuna. Ensinnäkin Phi-1 on erikoistunut Python-koodaukseen, ja siitä puuttuu monikielisten mallien monipuolisuus. Lisäksi siitä puuttuu laajemmissa malleissa olevaa verkkotunnuskohtaista tietoa, kuten ohjelmointi tietyillä API-liittymillä tai vähemmän yleisten pakettien käyttö. Lopuksi, johtuen tietojoukkojen rakenteellisesta luonteesta ja kielen ja tyylin monimuotoisuuden puutteesta, Phi-1 on vähemmän kestävä kehotteen tyylivaihteluille tai virheille.
Tutkijat tunnustavat nämä rajoitukset ja uskovat, että lisätyö voi korjata ne kaikki. He ehdottavat käyttöä GPT-4 synteettisen tiedon luomiseen sen sijaan GPT-3.5, koska he havaitsivat korkean virhetason jälkimmäisen tiedoissa. Virheistä huolimatta Phi-1 osoittaa huomattavaa koodaustaitoa, joka on samanlainen kuin aikaisemmassa tutkimuksessa, jossa a kielimalli tuotti oikeita vastauksia jopa silloin, kun se oli koulutettu dataan, jonka virheprosentti on 100 %.
Lue lisää tekoälystä:
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.
lisää artikkeleitaDamir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.