Uutisraportti Elektroniikka
Kesäkuu 22, 2023

Phi-1, kompakti kielimalli, ohittaa GPT Tehokas koodin luominen

Lyhyesti

Tutkijat kehittivät Phi-1, a kompakti kielimalli tehokkaaseen koodin luomiseen käyttämällä 1.3 miljardia parametria ja pienempää opetustietojoukkoa.

Pienemmästä koostaan ​​huolimatta se saavuttaa vaikuttavia tuloksia: Pass@1-tarkkuus on 50.6 % HumanEvalissa ja 55.5 % MBPP-mittausarvoissa.

Phi-1, kompakti mutta tehokas malli, joka on erityisesti suunniteltu koodinluontitehtäviin. Toisin kuin edeltäjänsä, Phi-1 osoittaa ylivoimaista suorituskykyä koodauksessa ja muissa asiaan liittyvissä tehtävissä, samalla kun se käyttää huomattavasti vähemmän parametreja ja pienempää koulutustietojoukkoa.

Phi-1, kompakti kielimalli, ohittaa GPT Tehokas koodin luominen
Pistetilanne: Midjourney / Yumtoast#2538
Suositus: 12 parasta tekoälyn koodaustyökalua 2023

Phi-1, Transformer-pohjainen malli, erottuu joukosta vain 1.3 miljardilla parametrilla, mikä on vain murto-osa muiden kilpailevien mallien koosta. On huomattava, että se koulutettiin vain neljässä päivässä kahdeksalla A100:lla. Koulutusprosessi sisälsi huolellisesti kuratoitua "oppikirjalaatuista" verkosta peräisin olevaa dataa (6 miljardia merkkiä) sekä synteettisiä oppikirjoja ja harjoituksia, jotka luotiin GPT-3.5 (1 miljardi merkkiä).

Pienemmästä mittakaavasta huolimatta Phi-1 saavuttaa vaikuttavia tuloksia, ja sen pass@1-tarkkuus on 50.6 % HumanEvalissa ja 55.5 % MBPP-vertailuarvoissa. Lisäksi sillä on odottamattomia ilmentyviä ominaisuuksia verrattuna Phi-1-baseen, aikaisempaan malliin ennen hienosäätöä, ja Phi-1-small-malliin, pienempään malliin, jossa on 350 miljoonaa parametria. Pienemmästä koostaan ​​huolimatta Phi-1 saavuttaa edelleen kiitettävän 45 % tarkkuuden HumanEvalissa.

Phi-1:n menestys johtuu harjoittelun aikana käytetystä korkealaatuisesta datasta. Aivan kuten kattava ja hyvin muotoiltu oppikirja auttaa oppilaita uusien aineiden hallitsemisessa, tutkijat keskittyivät "oppikirjalaatuisen" tiedon luomiseen parantaakseen oppimisen tehokkuutta. kielimalli. Tämä lähestymistapa johti malliin, joka ylittää useimmat avoimen lähdekoodin mallit koodauksen vertailuarvoissa, kuten HumanEval ja MBPP, huolimatta pienemmästä mallin koosta ja tietojoukon määrästä.

On kuitenkin tärkeää huomata joitain Phi-1:n rajoituksia suurempiin malleihin verrattuna. Ensinnäkin Phi-1 on erikoistunut Python-koodaukseen, ja siitä puuttuu monikielisten mallien monipuolisuus. Lisäksi siitä puuttuu laajemmissa malleissa olevaa verkkotunnuskohtaista tietoa, kuten ohjelmointi tietyillä API-liittymillä tai vähemmän yleisten pakettien käyttö. Lopuksi, johtuen tietojoukkojen rakenteellisesta luonteesta ja kielen ja tyylin monimuotoisuuden puutteesta, Phi-1 on vähemmän kestävä kehotteen tyylivaihteluille tai virheille.

Tutkijat tunnustavat nämä rajoitukset ja uskovat, että lisätyö voi korjata ne kaikki. He ehdottavat käyttöä GPT-4 synteettisen tiedon luomiseen sen sijaan GPT-3.5, koska he havaitsivat korkean virhetason jälkimmäisen tiedoissa. Virheistä huolimatta Phi-1 osoittaa huomattavaa koodaustaitoa, joka on samanlainen kuin aikaisemmassa tutkimuksessa, jossa a kielimalli tuotti oikeita vastauksia jopa silloin, kun se oli koulutettu dataan, jonka virheprosentti on 100 %.

Lue lisää tekoälystä:

Vastuun kieltäminen

Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.

Author

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

lisää artikkeleita
Damir Yalalov
Damir Yalalov

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

Ripplesta The Big Green DAO:hon: Kuinka kryptovaluuttaprojektit edistävät hyväntekeväisyyttä

Tutkitaan aloitteita, joilla hyödynnetään digitaalisten valuuttojen potentiaalia hyväntekeväisyyteen.

Tiedä enemmän

AlphaFold 3, Med-Gemini ja muut: The Way AI Transforms Healthcare vuonna 2024

Tekoäly ilmenee monin eri tavoin terveydenhuollossa, uusien geneettisten korrelaatioiden paljastamisesta robottikirurgisten järjestelmien voimaannuttamiseen...

Tiedä enemmän
Liity innovatiiviseen teknologiayhteisöömme
Lue lisää
Lue lisää
Top 10 ilmaista tekoälytyökalua sisällön luomiseen, videoiden muokkaamiseen ja muuhun
AI Wiki Sulattaa koulutus Lifestyle Tuotteemme Elektroniikka
Top 10 ilmaista tekoälytyökalua sisällön luomiseen, videoiden muokkaamiseen ja muuhun
Voi 14, 2024
Hongkongin arvopaperikomissio varoittaa salausalalle kohdistetuista deepfake-huijauksista: vaikutukset sijoittajien turvallisuuteen
Lifestyle Turvallisuus Wiki Tuotteemme Tarinoita ja arvosteluja Elektroniikka
Hongkongin arvopaperikomissio varoittaa salausalalle kohdistetuista deepfake-huijauksista: vaikutukset sijoittajien turvallisuuteen
Voi 14, 2024
Ripple ja Evmos tekevät yhteistyötä XRP Ledger EVM -sivuketjun kehittämiseksi EvmOS-tekniikan avulla
Bisnes Uutisraportti Elektroniikka
Ripple ja Evmos tekevät yhteistyötä XRP Ledger EVM -sivuketjun kehittämiseksi EvmOS-tekniikan avulla
Voi 14, 2024
5ireChain käynnistää kannustetun "Testnet Thunder: GA" verkon stressitestaukseen, kutsuu käyttäjiä osallistumaan Airdrop Palkkiot
Uutisraportti Elektroniikka
5ireChain käynnistää kannustetun "Testnet Thunder: GA" verkon stressitestaukseen, kutsuu käyttäjiä osallistumaan Airdrop Palkkiot
Voi 14, 2024
CRYPTOMERIA LABS PTE. OY.