Laporan Berita Teknologi
Mac 30, 2023

OpenFlamingo: Rangka Kerja Imej-ke-Teks Sumber Terbuka Baharu Daripada Meta AI dan LAION

Secara ringkas

OpenFlamingo ialah versi sumber terbuka model Flamingo DeepMind, dibina di atas LLaMA model bahasa yang besar.

Pembangun berharap untuk mencipta sistem multimodal yang boleh menangani cabaran bahasa penglihatan dan setara GPT-4kekuatan dan kebolehsuaian dalam mengendalikan input visual dan teks.

Versi sumber terbuka model Flamingo DeepMind, OpenFlamingo, baru sahaja dikeluarkan. OpenFlamingo pada asasnya ialah rangka kerja yang membenarkan latihan dan penilaian model multimodal yang besar (LMM). OpenFlamingo dibina di atas LLaMA model bahasa besar yang dibangunkan oleh Meta AI.

OpenFlamingo: Rangka kerja imej-ke-teks sumber terbuka baharu daripada Meta AI dan LAION
Baca lebih lanjut: Bagaimana untuk Menggunakan Midjourney secara Percuma Selamanya: 5 langkah mudah

Sumbangan pembangun kepada keluaran pertama ini adalah seperti berikut:

  • Set data multimodal yang besar yang menggabungkan urutan teks dan visual.
  • Penanda aras untuk penilaian pembelajaran dalam konteks untuk aktiviti termasuk penglihatan dan bahasa.
  • Versi awal kami LLaMA-model OpenFlamingo-9B berasaskan.

Melalui OpenFlamingo, pembangun berharap untuk mencipta sistem multimodal yang boleh menangani pelbagai cabaran bahasa penglihatan. Matlamat akhir adalah untuk sama rata GPT-4kekuatan dan kebolehsuaian dalam mengendalikan input visual dan teks. Pembangun sedang membangunkan versi sumber terbuka model Flamingo DeepMind, LMM yang mampu memproses dan menaakul tentang imej, video dan teks, untuk mencapai matlamat ini. Pembangun berdedikasi untuk membangunkan model sumber terbuka sepenuhnya kerana mereka berpendapat bahawa ketelusan adalah penting untuk menggalakkan kerjasama, mempercepatkan pembangunan dan mendemokrasikan akses kepada LMM yang canggih.

Pengiktirafan haiwan

Mereka menyediakan pusat pemeriksaan awal model OpenFlamingo-9B kami. Walaupun model itu belum dioptimumkan sepenuhnya, ia menunjukkan janji projek. Pembangun boleh melatih LMM yang lebih baik dengan bekerjasama dan mendapatkan maklum balas komuniti. Mereka menjemput orang ramai untuk memberi input dan menambah repositori untuk mengambil bahagian dalam proses pembangunan.

Membilang objek

Pelaksanaannya hampir sama dengan Flamingo. Model Flamingo mesti dilatih pada set data web berskala besar dengan teks bersilang dan grafik untuk melengkapkan mereka dengan kemahiran pembelajaran beberapa pukulan dalam konteks. Seni bina yang sama yang dicadangkan dalam kajian Flamingo asal (Perceiver resamplers, cross-attention layers) dilaksanakan dalam OpenFlamingo. Tetapi, memandangkan data latihan Flamingo tidak boleh diakses oleh orang awam, pembangun menggunakan set data sumber terbuka untuk melatih model. Pusat pemeriksaan OpenFlamingo-9B yang baru diterbitkan telah dilatih secara khusus pada sampel 10M daripada sampel LAION-2B dan 5M daripada dataset Multimodal C4 baharu.

Pembangun juga menyertakan pusat pemeriksaan daripada LMM OpenFlamingo-9B kami yang belum selesai, yang berasaskan LLaMA 7B dan CLIP ViT/L-14, sebagai sebahagian daripada keluaran. Walaupun konsep ini masih dibangunkan, masyarakat mungkin sudah mendapat manfaat yang besar daripadanya.

Untuk memulakan, lihat di GitHub sumber dan demo.

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Hot Stories
Sertai Surat Berita Kami.
Berita Terkini

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
Nexo Memulakan 'The Hunt' Untuk Memberi Ganjaran kepada Pengguna Dengan $12M Token NEXO Kerana Terlibat Dengan Ekosistemnya
pasaran Laporan Berita Teknologi
Nexo Memulakan 'The Hunt' Untuk Memberi Ganjaran kepada Pengguna Dengan $12M Token NEXO Kerana Terlibat Dengan Ekosistemnya
Semoga 8, 2024
Revolut X Exchange Revolut Menarik Pedagang Kripto dengan Yuran Pembuat Sifar dan Analitis Lanjutan
pasaran perisian Cerita dan Ulasan Teknologi
Revolut X Exchange Revolut Menarik Pedagang Kripto dengan Yuran Pembuat Sifar dan Analitis Lanjutan
Semoga 8, 2024
Platform Dagangan Kripto BitMEX Debut Dagangan Pilihan Dengan 0 Yuran Dan Insentif Tunai
Perniagaan pasaran Laporan Berita
Platform Dagangan Kripto BitMEX Debut Dagangan Pilihan Dengan 0 Yuran Dan Insentif Tunai
Semoga 8, 2024
Lisk Secara Rasmi Beralih Kepada Lapisan Ethereum 2 Dan Memperkenalkan Teras v4.0.6
Laporan Berita Teknologi
Lisk Secara Rasmi Beralih Kepada Lapisan Ethereum 2 Dan Memperkenalkan Teras v4.0.6
Semoga 8, 2024