Nieuwsverslag Technologie
18 juli 2023

Meta onthult baanbrekende open source LLaMa-2-Chat met ongeëvenaarde prestaties

In het kort

Meta is vrijgegeven LLaMa-2-Chat-modellen, een grote doorbraak in open source AI.

Deze modellen, met 70B-parameters, zijn vergelijkbaar met GPT-3.5 en overtref benchmarks.

Gefinetuned met behulp van RLHF, bieden ze gepersonaliseerd ChatGPT equivalenten, menselijke evaluatiestatistieken en wiskundig probleemoplossend vermogen.

Meta heeft onlangs heeft een set uitgebracht LLaMa-2-Chat-modellen in verschillende maten. Deze release van de LLM-afdeling van GenAI heeft voor veel ophef gezorgd in de branche.

Meta onthult baanbrekende open source LLaMa-2-Chat met ongeëvenaarde prestaties
credit: Metaverse Post (mpost.io)

LLaMa-2-Chat is een werkelijk opmerkelijke prestatie gecreëerd door het getalenteerde team van de LLM-afdeling van GenAI. Met een indrukwekkend aantal parameters van 70 miljard is dit model vergelijkbaar en zelfs presteert beter dan de hoog aangeschreven GPT-3.5 op bepaalde maatstaven.

Hoogtepunten:

  • Commercieel vriendelijk
  • Vooraf getraind op 2T-tokens
  • Sterke MMLU-scores (dwz sterke redenering)
  • 4K-context
  • (Uitschuifbare) RoPE inbeddingen
  • Codeerprestaties zijn meh
  • SFT/RLHF-chatversies

Dat LLaMa-2-Chat is het eerste model van zijn omvang dat is verfijnd met behulp van RLHF (Reinforcement Learning from Human Feedback), wat het nog opmerkelijker maakt. Op een ongekende manier heeft Meta dit model volledig gratis gemaakt voor commercieel gebruik. Geïnteresseerden kunnen de downloadlink opvragen via hun officiële website.

Een van de belangrijkste voordelen van LLaMa-2-Chat is zijn potentieel om te creëren ChatGPT analogen zonder de noodzaak om gegevens mee te delen OpenAI. Dit stelt ontwikkelaars en onderzoekers in staat om de kracht van het model te benutten terwijl ze de volledige controle over hun gegevens behouden. Jij kan Download nieuw model hier.

In termen van menselijke evaluatiestatistieken, LLaMa-2-Chat staat er schouder aan schouder mee ChatGPT-3.5 qua kwaliteit. Het toont met name uitzonderlijke prestaties op het gebied van wiskundige problemen en presteert beter dan andere modellen op dit gebied.

  • In februari, Meta is vrijgegeven LLaMA model, een groot taalmodel dat is ontworpen om AI-onderzoekers te ondersteunen. Verkrijgbaar in verschillende maten (7B-, 13B-, 33B- en 65B-parameters), LLaMA toestaat onderzoekers om nieuwe benaderingen te testen en nieuwe gebruiksscenario's verkennen. Het model is ideaal voor het verfijnen van taken en is gebouwd op een grote set ongelabelde gegevens. Ondanks zijn veelzijdigheid, LLaMA loopt het risico van vooringenomenheid, giftige opmerkingen en hallucinaties. Het model wordt vrijgegeven onder een niet-commerciële licentie die is gericht op gebruiksscenario's voor onderzoek, en of u in aanmerking komt voor toegang wordt van geval tot geval beoordeeld.
  • De LLaMa model, met 7 miljard parameters, heeft razendsnelle conclusies getrokken op een MacBook met de M2 ​​Max-chip. Deze prestatie werd mogelijk gemaakt door Greganovs succesvolle implementatie van modelinferentie op de Metal GPU, een gespecialiseerde accelerator die te vinden is in de nieuwste chips van Apple. De LLaMa Het model demonstreert een CPU-gebruik van 0%, waarbij de verwerkingskracht van alle 38 metalen kernen wordt benut. Deze visie van gepersonaliseerde AI-assistentie en lokalisatie op persoonlijke apparaten biedt een enorm potentieel voor een toekomst waarin AI een integraal onderdeel wordt van het leven van mensen, door gepersonaliseerde assistentie te bieden en routinetaken te stroomlijnen.

Lees meer over AI:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Hot Stories
Schrijf je in op onze nieuwsbrief.
Laatste Nieuws

Van Ripple tot The Big Green DAO: hoe cryptocurrency-projecten bijdragen aan liefdadigheid

Laten we initiatieven onderzoeken die het potentieel van digitale valuta voor goede doelen benutten.

Meer weten

AlphaFold 3, Med-Gemini en anderen: de manier waarop AI de gezondheidszorg transformeert in 2024

AI manifesteert zich op verschillende manieren in de gezondheidszorg, van het blootleggen van nieuwe genetische correlaties tot het versterken van robotchirurgische systemen...

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
Alchemy Pay werkt samen met BounceBit om het Bitcoin Restaking-ecosysteem te ondersteunen
Business Nieuwsverslag Technologie
Alchemy Pay werkt samen met BounceBit om het Bitcoin Restaking-ecosysteem te ondersteunen
17 mei 2024
Top 5 Liquid Restaking-protocollen gebouwd bovenop EigenLayer
Verteren Markten Software Technologie
Top 5 Liquid Restaking-protocollen gebouwd bovenop EigenLayer
17 mei 2024
Magic Square onthult IDO-platform Magic Launchpad om retailtoegang te democratiseren Web3 Investeerders
Business Markten Nieuwsverslag
Magic Square onthult IDO-platform Magic Launchpad om retailtoegang te democratiseren Web3 Investeerders
17 mei 2024
Binance werkt samen met Taiwanese autoriteiten om het witwassen van cryptogeld ter waarde van $6 miljoen aan het licht te brengen
Advies Business Markten Software Technologie
Binance werkt samen met Taiwanese autoriteiten om het witwassen van cryptogeld ter waarde van $6 miljoen aan het licht te brengen
17 mei 2024