뉴스 보도 Technology
2023 년 3 월 30 일

OpenFlamingo: Meta AI 및 LAION의 새로운 오픈 소스 이미지-텍스트 프레임워크

요컨대

OpenFlamingo는 DeepMind Flamingo 모델의 오픈 소스 버전으로 LLaMA 대형 언어 모델.

개발자는 비전 언어 문제를 처리할 수 있는 다중 모드 시스템을 만들고자 합니다. GPT-4시각적 및 텍스트 입력을 처리하는 데 있어 의 강점과 적응성.

DeepMind의 Flamingo 모델의 오픈 소스 버전, 오픈플라밍고, 방금 출시되었습니다. OpenFlamingo는 기본적으로 대규모 다중 모드 모델(LMM)의 교육 및 평가를 허용하는 프레임워크입니다. OpenFlamingo는 OpenFlamingo를 기반으로 구축되었습니다. LLaMA Meta AI가 개발한 대규모 언어 모델입니다.

OpenFlamingo: Meta AI 및 LAION의 새로운 오픈 소스 이미지-텍스트 프레임워크
더 읽기 : 이용 방법 Midjourney 영원히 무료: 간단한 5단계

이 첫 번째 릴리스에 대한 개발자의 기여는 다음과 같습니다.

  • 텍스트와 시각적 시퀀스를 결합하는 상당한 규모의 멀티모달 데이터 세트입니다.
  • 시각 및 언어를 포함한 활동에 대한 상황 내 학습 평가를 위한 벤치마크입니다.
  • 우리의 예비 버전 LLaMA기반 OpenFlamingo-9B 모델.

OpenFlamingo를 통해 개발자는 다양한 비전 언어 문제를 처리할 수 있는 다중 모드 시스템을 만들 수 있기를 희망합니다. 궁극적인 목표는 평등하다 GPT-4시각적 및 텍스트 입력을 처리하는 데 있어 의 강점과 적응성. 개발자들은 이 목표를 달성하기 위해 이미지, 비디오 및 텍스트를 처리하고 추론할 수 있는 LMM인 DeepMind Flamingo 모델의 오픈 소스 버전을 개발하고 있습니다. 개발자는 협력을 촉진하고 개발을 가속화하며 최첨단 LMM에 대한 액세스를 민주화하는 데 투명성이 중요하다고 생각하기 때문에 완전한 오픈 소스 모델 개발에 전념하고 있습니다.

동물 인식

OpenFlamingo-9B 모델의 초기 체크포인트를 제공하고 있습니다. 모델이 아직 완전히 최적화되지는 않았지만 프로젝트의 가능성을 보여줍니다. 개발자는 협력하고 커뮤니티 피드백을 받아 더 나은 LMM을 교육할 수 있습니다. 그들은 개발 프로세스에 참여하기 위해 대중을 초대하여 입력을 제공하고 저장소에 추가합니다.

물체 세기

구현은 Flamingo의 구현과 매우 유사합니다. Flamingo 모델은 인터리빙된 텍스트와 그래픽 상황에 맞는 몇 번의 학습 기술을 갖추도록 합니다. 원래 Flamingo 연구에서 제안된 것과 동일한 아키텍처(Perceiver 리샘플러, 교차 주의 계층)가 OpenFlamingo에서 구현됩니다. 그러나 Flamingo의 교육 데이터는 일반 대중이 액세스할 수 없기 때문에 개발자는 오픈 소스 데이터 세트를 사용하여 모델을 교육합니다. 새로 게시된 OpenFlamingo-9B 체크포인트는 LAION-10B의 2만 개 샘플과 새로운 Multimodal C5 데이터 세트의 4만 개 샘플에 대해 특별히 훈련되었습니다.

개발자들은 또한 다음을 기반으로 하는 미완성 LMM OpenFlamingo-9B의 체크포인트를 포함하고 있습니다. LLaMA 7B 및 CLIP ViT/L-14가 릴리스의 일부로 제공됩니다. 이 개념은 아직 개발 중이지만 커뮤니티는 이미 이로부터 큰 이익을 얻을 수 있습니다.

시작하려면 GitHub의 출처와 데모.

AI에 대해 자세히 알아보기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Nexo는 생태계 참여에 대해 사용자에게 12만 달러의 NEXO 토큰을 보상하기 위해 'The Hunt'를 시작합니다.
시장 뉴스 보도 Technology
Nexo는 생태계 참여에 대해 사용자에게 12만 달러의 NEXO 토큰을 보상하기 위해 'The Hunt'를 시작합니다.
2024 년 5 월 8 일
Revolut의 Revolut X Exchange는 제로 메이커 수수료 및 고급 분석으로 암호화폐 거래자를 우대합니다.
시장 소프트웨어 이야기와 리뷰 Technology
Revolut의 Revolut X Exchange는 제로 메이커 수수료 및 고급 분석으로 암호화폐 거래자를 우대합니다.
2024 년 5 월 8 일
암호화폐 거래 플랫폼 BitMEX, 수수료가 없고 현금 인센티브가 없는 옵션 거래 출시
근무지에서 발생 시장 뉴스 보도
암호화폐 거래 플랫폼 BitMEX, 수수료가 없고 현금 인센티브가 없는 옵션 거래 출시
2024 년 5 월 8 일
Lisk는 공식적으로 Ethereum Layer 2로 전환하고 Core v4.0.6을 공개합니다.
뉴스 보도 Technology
Lisk는 공식적으로 Ethereum Layer 2로 전환하고 Core v4.0.6을 공개합니다.
2024 년 5 월 8 일
CRYPTOMERIA LABS PTE. LTD.