Raport aktualności Technologia
24 lutego 2023 r.

Wydania Meta LLaMA: Najnowocześniejszy podstawowy model języka do badań nad sztuczną inteligencją

W skrócie

Meta ogłosiła wydanie nowego, dużego modelu językowego o nazwie LLaMA, zaprojektowane, aby pomóc badaczom sztucznej inteligencji w rozwoju ich prac w dziedzinie sztucznej inteligencji.

LLaMA dostępny jest w kilku rozmiarach, w zakresie parametrów od 7B do 65B i zaprojektowany jest z myślą o uniwersalności.

meta llama

Meta ma wydany nowy model dużego języka tzw LLaMA (Large Language Model Meta AI), aby wspierać badaczy sztucznej inteligencji. Model umożliwi studiowanie większej liczbie osób ze społeczności badawczej modele językowe i zapewnić łatwiejszy dostęp do tej ważnej dziedziny.

LLaMA dostępny jest w kilku rozmiarach (parametry 7B, 13B, 33B, 65B). Trenując mniejsze modele podstawowe, takie jak LLaMAbadacze mogą zużywać mniej mocy obliczeniowej i zasobów do testowania nowych podejść i odkrywania nowych przypadków użycia. Meta to napisała LLaMA jest idealny do dostrajania różnych zadań, ponieważ trenuje na dużym zestawie nieoznaczonych danych. Meta twierdzi, że angażuje się w odpowiedzialne praktyki związane ze sztuczną inteligencją i dzieli się: LLAMA model karta który szczegółowo opisuje, w jaki sposób model został zbudowany.

Rozwijać LLaMA, Meta wybrała teksty z 20 najczęściej używanych języków, koncentrując się na językach używających alfabetu łacińskiego i cyrylicy. Ten duży model językowy generuje tekst na podstawie sekwencji słów jako danych wejściowych i rekursywnie przewiduje następne słowo, podobnie jak inne modele w tej kategorii.

„Jako podstawowy model LLaMA został zaprojektowany tak, aby był wszechstronny i można go zastosować w wielu różnych przypadkach użycia, w przeciwieństwie do precyzyjnie dostrojonego modelu zaprojektowanego do konkretnego zadania. Udostępniając kod dla LLaMA, inny naukowcy mogą łatwiej testować nowe podejścia do ograniczania lub eliminowania tych problemów w dużych modelach językowych”

Meta napisała.

Firma przyznaje, że nadal musi zająć się ryzykiem uprzedzeń, toksycznych komentarzy i halucynacji w dużej mierze modele językowe, w tym LLaMA.

Meta udostępnia model na licencji niekomercyjnej, skupiającej się na badaniach przypadków użycia „w celu zachowania integralności i zapobiegania nadużyciom”. Osoby i organizacje ubiegające się o dostęp do modelu będą oceniane indywidualnie dla każdego przypadku. Uprawnione strony to badacze akademiccy, organizacje rządowe i społeczeństwa obywatelskiego oraz branżowe laboratoria badawcze na całym świecie.

Możesz przeczytać cały artykuł na LLaMA tutaj. Jeśli kwalifikujesz się, możesz również zastosować przetestować model językowy.

Czytaj więcej:

tagi:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Agne jest dziennikarką, która zajmuje się najnowszymi trendami i wydarzeniami w metaverse, sztucznej inteligencji i Web3 branże dla Metaverse Post. Jej pasja do opowiadania historii skłoniła ją do przeprowadzenia licznych wywiadów z ekspertami w tych dziedzinach, zawsze starając się odkryć ekscytujące i wciągające historie. Agne posiada tytuł licencjata z literatury i rozległe doświadczenie w pisaniu na różne tematy, w tym podróże, sztukę i kulturę. Zgłosiła się także jako wolontariuszka jako redaktorka do organizacji praw zwierząt, gdzie pomagała podnosić świadomość na temat kwestii związanych z dobrostanem zwierząt. Skontaktuj się z nią [email chroniony].

Więcej artykułów
Agnieszka Cimerman
Agnieszka Cimerman

Agne jest dziennikarką, która zajmuje się najnowszymi trendami i wydarzeniami w metaverse, sztucznej inteligencji i Web3 branże dla Metaverse Post. Jej pasja do opowiadania historii skłoniła ją do przeprowadzenia licznych wywiadów z ekspertami w tych dziedzinach, zawsze starając się odkryć ekscytujące i wciągające historie. Agne posiada tytuł licencjata z literatury i rozległe doświadczenie w pisaniu na różne tematy, w tym podróże, sztukę i kulturę. Zgłosiła się także jako wolontariuszka jako redaktorka do organizacji praw zwierząt, gdzie pomagała podnosić świadomość na temat kwestii związanych z dobrostanem zwierząt. Skontaktuj się z nią [email chroniony].

Hot Stories
Dołącz do naszego newslettera.
Najnowsze wieści

Szał DOGE: analiza niedawnego wzrostu wartości Dogecoina (DOGE).

Branża kryptowalut szybko się rozwija, a monety memowe przygotowują się na znaczny wzrost. Dogecoin (DOGE), ...

Dowiedz się więcej

Ewolucja treści generowanych przez sztuczną inteligencję w Metaverse

Pojawienie się generatywnych treści AI jest jednym z najbardziej fascynujących osiągnięć w środowisku wirtualnym…

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Najlepsze oferty tego tygodnia, duże inwestycje w sztuczną inteligencję, IT, Web3i Krypto (22-26.04)
Digest Biznes rynki Technologia
Najlepsze oferty tego tygodnia, duże inwestycje w sztuczną inteligencję, IT, Web3i Krypto (22-26.04)
26 kwietnia 2024 r.
Vitalik Buterin komentuje centralizację PoW, zauważa, że ​​był to etap tymczasowy do czasu PoS
Raport aktualności Technologia
Vitalik Buterin komentuje centralizację PoW, zauważa, że ​​był to etap tymczasowy do czasu PoS
26 kwietnia 2024 r.
Offchain Labs ujawnia dwie krytyczne luki w dowodach oszustwa OP Stack Optymizmu
Raport aktualności Tworzenie Technologia
Offchain Labs ujawnia dwie krytyczne luki w dowodach oszustwa OP Stack Optymizmu
26 kwietnia 2024 r.
Otwarty rynek firmy Dymension zapewniający płynność dzięki RollApps eIBC zostaje uruchomiony w sieci głównej
Raport aktualności Technologia
Otwarty rynek firmy Dymension zapewniający płynność dzięki RollApps eIBC zostaje uruchomiony w sieci głównej 
26 kwietnia 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.