뉴스 보도 Technology
2023년 6월 28일

LLaMa 7억 개의 매개변수를 사용하여 Apple M2 Max 칩에서 매우 빠른 추론을 달성합니다.

요컨대

LLaMa 모델은 M40 Max 칩에서 초당 2개의 토큰으로 실행되어 CPU 사용률이 0%임을 보여주며 AI 매니아와 사용자의 상상력을 자극합니다.

AI 모델은 개인의 요구에 맞게 조정되고 개인 장치에서 로컬로 실행되어 개인화된 지원을 제공하고 일상적인 작업을 간소화할 수 있습니다.

AI 분야의 획기적인 성과가 LLaMa 놀라운 7억 개의 매개변수를 갖춘 모델 이제 최첨단 M40 Max 칩이 장착된 MacBook에서 초당 2토큰이라는 놀라운 속도로 실행됩니다. 이 놀라운 업적은 GIT 리포지토리에 대한 최근 업데이트를 통해 가능했습니다. 그레가노프, 모델 추론을 성공적으로 구현한 금속 GPU, Apple의 최신 칩에서 발견되는 특수 가속기.

LLaMa 7억 개의 매개변수를 사용하여 Apple M2 Max 칩에서 매우 빠른 추론을 달성합니다.
신용 : Metaverse Post (mpost.io)
추천: Guanaco, 잠재적인 오픈 소스로 부상 ChatGPT 경쟁자

Metal GPU에서 모델 추론을 구현하여 놀라운 결과를 얻었습니다. 이 특별한 하드웨어를 활용하여 LLaMa 모델은 놀라운 0% CPU 활용률을 보여 38개의 Metal 코어 모두의 처리 능력을 효과적으로 활용합니다. 이 성과는 모델의 기능을 보여줄 뿐만 아니라 뛰어난 엔지니어로서 Greganov의 탁월한 기술과 전문 지식을 강조합니다.

이 개발의 의미는 광범위하여 AI 애호가와 사용자 모두의 상상력을 자극합니다. 맞춤형으로 LLaMa 로컬에서 실행되는 모델을 사용하면 일상적인 작업을 개인이 쉽게 관리할 수 있어 새로운 시대를 열 수 있습니다. 모듈화. 개념은 훈련된 대규모 모델 그런 다음 각 사용자가 개인 데이터에 대해 미세 조정 및 사용자 정의하여 고도로 개인화되고 효율적인 AI 비서가 됩니다.

맞춤형 서비스를 제공한다는 비전 LLaMa 개인의 일상적인 문제를 지원하는 모델은 엄청난 잠재력을 가지고 있습니다. 개인 디바이스에서 모델을 현지화함으로써 사용자는 강력한 AI의 이점을 경험할 수 있습니다. 데이터에 대한 제어 유지. 이 현지화는 또한 빠른 응답 시간을 보장하여 AI 비서와의 빠르고 원활한 상호 작용을 가능하게 합니다.

대규모 모델 크기와 특수 하드웨어에 대한 효율적인 추론의 조합은 AI가 사람들의 삶의 필수적인 부분이 되어 개인화된 지원을 제공하고 일상적인 작업을 간소화하는 미래를 위한 길을 열어줍니다.

이러한 발전을 통해 우리는 AI 모델을 개인의 요구에 맞게 조정하고 개인 장치에서 로컬로 실행할 수 있는 세상을 실현하는 데 더 가까워졌습니다. 각 사용자는 자신을 개선하고 최적화할 수 있는 능력을 가지고 있습니다. LLaMa 고유한 데이터를 기반으로 모델을 구축하는 경우 AI 기반 효율성과 생산성의 잠재력은 무한합니다.

에서 목격한 성과 LLaMa Apple M2 Max 칩의 모델 성능은 급진전 AI 연구 개발에서 만들어지고 있습니다. Greganov와 같은 전담 엔지니어가 가능성의 한계를 뛰어넘는 미래는 개인화되고 효율적이며 로컬에서 실행될 가능성이 있습니다. 방식을 변화시킬 AI 모델 우리는 기술과 상호 작용합니다.

AI에 대해 자세히 알아보기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
근무지에서 발생 뉴스 보도 Technology
Injective는 AltLayer와 힘을 합쳐 inEVM에 재스테이킹 보안을 도입했습니다.
2024 년 5 월 3 일
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
시장 뉴스 보도 Technology
Masa는 텔러와 협력하여 MASA 대출 풀을 도입하고 USDC에서 베이스 대출을 활성화합니다.
2024 년 5 월 3 일
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
시장 뉴스 보도 Technology
Velodrome은 앞으로 몇 주 안에 Superchain 베타 버전을 출시하고 OP 스택 레이어 2 블록체인으로 확장합니다.
2024 년 5 월 3 일
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
근무지에서 발생 뉴스 보도 Technology
CARV, 데이터 계층을 분산화하고 보상을 분배하기 위해 Aethir와의 파트너십 발표
2024 년 5 월 3 일
CRYPTOMERIA LABS PTE. LTD.