گزارش خبری پیشرفته
مارس 30، 2023

OpenFlamingo: یک چارچوب تصویر به متن منبع باز جدید از متا AI و LAION

به طور خلاصه

OpenFlamingo یک نسخه منبع باز از مدل Flamingo DeepMind است که بر روی LLaMA مدل زبان بزرگ.

توسعه دهندگان امیدوارند که یک سیستم چندوجهی ایجاد کنند که بتواند چالش های زبان بینایی و برابری را مدیریت کند GPT-4قدرت و سازگاری در مدیریت ورودی بصری و متن.

نسخه منبع باز مدل Flamingo DeepMind، اپن فلامینگو، به تازگی منتشر شده است. OpenFlamingo اساساً چارچوبی است که امکان آموزش و ارزیابی مدل‌های چندوجهی قابل توجه (LMM) را می‌دهد. OpenFlamingo در بالای آن ساخته شده است LLaMA مدل زبان بزرگ توسعه یافته توسط Meta AI.

OpenFlamingo: یک چارچوب متن باز تصویر به متن جدید از Meta AI و LAION
ادامه مطلب: نحوه استفاده از Midjourney برای همیشه رایگان: 5 مرحله ساده

مشارکت های توسعه دهندگان در این نسخه اول به شرح زیر است:

  • مجموعه داده چندوجهی قابل توجهی که متن و توالی های بصری را ترکیب می کند.
  • معیاری برای ارزیابی یادگیری درون زمینه ای برای فعالیت هایی از جمله بینایی و زبان.
  • نسخه اولیه ما LLaMAمبتنی بر مدل OpenFlamingo-9B.

از طریق OpenFlamingo، توسعه دهندگان امیدوارند که یک سیستم چندوجهی ایجاد کنند که بتواند انواع چالش های زبان بینایی را مدیریت کند. هدف نهایی برابری است GPT-4قدرت و سازگاری در مدیریت ورودی بصری و متن. توسعه دهندگان در حال توسعه یک نسخه منبع باز از مدل Flamingo DeepMind هستند، یک LMM که قادر به پردازش و استدلال در مورد تصاویر، ویدیوها و متن است تا به این هدف دست یابند. توسعه‌دهندگان به توسعه مدل‌های کاملاً متن‌باز اختصاص دارند، زیرا فکر می‌کنند که شفافیت برای ارتقای همکاری، تسریع توسعه، و دموکراتیک کردن دسترسی به LMM‌های پیشرفته ضروری است.

تشخیص حیوانات

آنها در حال ارائه پست بازرسی اولیه مدل OpenFlamingo-9B ما هستند. اگرچه این مدل هنوز به طور کامل بهینه نشده است، اما وعده پروژه را نشان می دهد. توسعه دهندگان می توانند با همکاری و دریافت بازخورد جامعه، LMM های بهتری را آموزش دهند. آنها از عموم مردم دعوت می کنند که به منظور مشارکت در فرآیند توسعه، نظر بدهند و به مخزن اضافه کنند.

شمارش اشیا

پیاده سازی بسیار شبیه به فلامینگو است. مدل‌های فلامینگو باید بر روی مجموعه داده‌های وب در مقیاس بزرگ با متن‌های به هم پیوسته و گرافیک برای تجهیز آنها به مهارت های یادگیری درون زمینه ای. همان معماری که در مطالعه اصلی فلامینگو پیشنهاد شده بود (نمونه‌های مجدد ادراکی، لایه‌های توجه متقابل) در OpenFlamingo پیاده‌سازی شده است. اما، از آنجایی که داده‌های آموزشی فلامینگو برای عموم قابل دسترسی نیست، توسعه‌دهندگان از مجموعه داده‌های منبع باز برای آموزش مدل‌ها استفاده می‌کنند. پست بازرسی OpenFlamingo-9B که به تازگی منتشر شده است به طور خاص بر روی 10 میلیون نمونه از LAION-2B و 5 میلیون نمونه از مجموعه داده جدید Multimodal C4 آموزش داده شده است.

توسعه دهندگان همچنین دارای یک نقطه بازرسی از LMM OpenFlamingo-9B ناتمام ما هستند که بر اساس LLaMA 7B و CLIP ViT/L-14، به عنوان بخشی از انتشار. حتی اگر این مفهوم هنوز در حال توسعه است، ممکن است جامعه در حال حاضر از آن سود زیادی ببرد.

برای شروع، نگاهی به GitHub منبع و نسخه ی نمایشی.

درباره هوش مصنوعی بیشتر بخوانید:

سلب مسئولیت

در خط با دستورالعمل های پروژه اعتماد، لطفاً توجه داشته باشید که اطلاعات ارائه شده در این صفحه به عنوان مشاوره حقوقی، مالیاتی، سرمایه گذاری، مالی یا هر شکل دیگری در نظر گرفته نشده است و نباید تفسیر شود. مهم است که فقط در موردی سرمایه گذاری کنید که توانایی از دست دادن آن را دارید و در صورت شک و تردید به دنبال مشاوره مالی مستقل باشید. برای کسب اطلاعات بیشتر، پیشنهاد می کنیم به شرایط و ضوابط و همچنین صفحات راهنمایی و پشتیبانی ارائه شده توسط صادرکننده یا تبلیغ کننده مراجعه کنید. MetaversePost متعهد به گزارش دقیق و بی طرفانه است، اما شرایط بازار بدون اطلاع قبلی ممکن است تغییر کند.

درباره نویسنده

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

مقالات بیشتر
دامیر یالالوف
دامیر یالالوف

Damir رهبر تیم، مدیر محصول و سردبیر در است Metaverse Post، موضوعاتی مانند AI/ML، AGI، LLMs، Metaverse و Web3- زمینه های مرتبط مقالات او هر ماه مخاطبان زیادی از بیش از یک میلیون کاربر را جذب می کند. به نظر می رسد او یک متخصص با 10 سال تجربه در سئو و بازاریابی دیجیتال است. دمیر در Mashable, Wired, ذکر شده است. Cointelegraph، نیویورکر، Inside.com، Entrepreneur، BeInCrypto، و انتشارات دیگر. او بین امارات متحده عربی، ترکیه، روسیه و کشورهای مستقل مشترک المنافع به عنوان یک عشایر دیجیتال سفر می کند. دمیر مدرک لیسانس خود را در فیزیک گرفت که به اعتقاد او مهارت های تفکر انتقادی لازم برای موفقیت در چشم انداز دائماً در حال تغییر اینترنت را به او داده است. 

Hot Stories
به خبرنامه ما بپیوندید.
آخرین اخبار

در میان نوسانات، اشتهای سازمانی به سمت ETF های بیت کوین رشد می کند

افشاگری از طریق پرونده های 13F نشان می دهد که سرمایه گذاران نهادی قابل توجهی در ETF های بیت کوین مشغول هستند و بر پذیرش فزاینده ...

بیشتر بدانید

روز صدور حکم فرا می رسد: با بررسی دادگاه ایالات متحده به درخواست وزارت دادگستری، سرنوشت CZ در تعادل است

چانگ پنگ ژائو امروز در دادگاهی در سیاتل آمریکا محکوم خواهد شد.

بیشتر بدانید
به انجمن فناوری نوآورانه ما بپیوندید
ادامه مطلب
ادامه مطلب
قانون بازنگری شده اهدای کمک های مالی کره جنوبی: آیا این یک گام به جلو یا عقب برای بشردوستی رمزنگاری است؟
رمزنگاری Wiki هضم کسب و کار بازارها پیشرفته
قانون بازنگری شده اهدای کمک های مالی کره جنوبی: آیا این یک گام به جلو یا عقب برای بشردوستی رمزنگاری است؟
ممکن است 8، 2024
هوش مصنوعی مولد در سال 2024: روندهای نوظهور، پیشرفت ها و چشم انداز آینده
AI Wiki نرم افزار داستان ها و نقدها پیشرفته
هوش مصنوعی مولد در سال 2024: روندهای نوظهور، پیشرفت ها و چشم انداز آینده
ممکن است 8، 2024
DODOchain فاز اول MACH AVS Mainnet را رونمایی کرد، کمپین Launchpool را با AltLayer راه اندازی کرد تا اپراتورها را با جوایز اکوسیستم تشویق کند.
بازارها گزارش خبری پیشرفته
DODOchain فاز اول MACH AVS Mainnet را رونمایی کرد، کمپین Launchpool را با AltLayer راه اندازی کرد تا اپراتورها را با جوایز اکوسیستم تشویق کند.
ممکن است 8، 2024
zkSync برای معرفی P256Verify، Bridgehub و Valdiums از ویژگی های پیشرفته در ارتقاء بعدی خود پشتیبانی می کنند
گزارش خبری پیشرفته
zkSync برای معرفی P256Verify، Bridgehub و Valdiums از ویژگی های پیشرفته در ارتقاء بعدی خود پشتیبانی می کنند
ممکن است 8، 2024
CRYPTOMERIA LABS PTE. محدود