ニュースレポート テクノロジー
2023 年 3 月 30 日

OpenFlamingo: Meta AI と LAION による新しいオープンソースの画像からテキストへのフレームワーク

簡単に言えば

OpenFlamingo は、DeepMind の Flamingo モデルのオープンソース バージョンであり、 LLaMA 大規模な言語モデル.

開発者は、視覚言語の課題に対処できるマルチモーダル システムを作成したいと考えています。 GPT-4ビジュアル入力とテキスト入力を処理する際の の強みと適応性。

DeepMind のフラミンゴ モデルのオープン ソース バージョン、 オープンフラミンゴ、が発売されたばかりです。 OpenFlamingo は基本的に、大規模なマルチモーダル モデル (LMM) のトレーニングと評価を可能にするフレームワークです。 OpenFlamingo は、 LLaMA Meta AI によって開発された大規模な言語モデル。

OpenFlamingo: Meta AI と LAION による新しいオープンソースの画像からテキストへのフレームワーク
続きを読む: 使い方 Midjourney 永久無料: 5 つの簡単なステップ

この最初のリリースに対する開発者の貢献は次のとおりです。

  • テキストとビジュアル シーケンスを組み合わせた大規模なマルチモーダル データセット。
  • 視覚と言語を含む活動の文脈学習評価のベンチマーク。
  • 私たちの暫定版 LLaMAベースの OpenFlamingo-9B モデル。

開発者は、OpenFlamingo を通じて、視覚言語に関するさまざまな課題を処理できるマルチモーダル システムを作成したいと考えています。 最終的な目標は平等になることです GPT-4ビジュアル入力とテキスト入力を処理する際の の強みと適応性。 開発者は、この目標を達成するために、画像、ビデオ、テキストの処理と推論が可能な LMM である DeepMind の Flamingo モデルのオープンソース バージョンを開発しています。 開発者は、協力の促進、開発の加速、最先端の LMM へのアクセスの民主化には透明性が重要であると考えているため、完全なオープンソース モデルの開発に専念しています。

動物認識

OpenFlamingo-9B モデルの初期チェックポイントを提供しています。 モデルはまだ完全には最適化されていませんが、プロジェクトの将来性を示しています。 開発者は、協力してコミュニティのフィードバックを得ることで、より優れた LMM をトレーニングできます。 彼らは、開発プロセスに参加するために、一般の人々に意見を求め、リポジトリに追加するよう呼びかけています。

オブジェクトのカウント

実装は Flamingo の実装によく似ています。 Flamingo モデルは、インターリーブされたテキストを含む大規模な Web データセットでトレーニングする必要があります。 グラフィック 状況に応じた数回の学習スキルを身につけることができます。 オリジナルの Flamingo 研究で提案されたのと同じアーキテクチャ (パーシーバー リサンプラー、クロスアテンション レイヤー) が OpenFlamingo に実装されています。 ただし、Flamingo のトレーニング データは一般の人がアクセスできないため、開発者はオープンソース データセットを使用してモデルをトレーニングします。 新しく公開された OpenFlamingo-9B チェックポイントは、LAION-10B からの 2 万サンプルと新しいマルチモーダル C5 データセットからの 4 万サンプルで特別にトレーニングされました。

開発者は、未完成の LMM OpenFlamingo-9B からのチェックポイントも含めています。これは、以下に基づいています。 LLaMA 7B および CLIP ViT/L-14、リリースの一部として。 この概念はまだ開発中ですが、コミュニティはすでにそれから大きな恩恵を受けている可能性があります。

開始するには、 GitHubの ソースと デモ.

AI について詳しく読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories

Liskが正式にイーサリアムレイヤー2に移行し、コアv4.0.6を公開

by アリサ・デビッドソン
2024 年 5 月 08 日
ニュースレターにご参加ください。
最新ニュース

Liskが正式にイーサリアムレイヤー2に移行し、コアv4.0.6を公開

by アリサ・デビッドソン
2024 年 5 月 08 日

ボラティリティの中でビットコインETFへの機関投資家の意欲が高まる

13Fの提出書類による開示では、著名な機関投資家がビットコインETFに手を出していることが明らかになり、...

詳細を知りたい

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
Nexo、エコシステムに参加したユーザーに 12 万ドルの NEXO トークンを報酬として与える「ザ・ハント」を開始
マーケット ニュースレポート テクノロジー
Nexo、エコシステムに参加したユーザーに 12 万ドルの NEXO トークンを報酬として与える「ザ・ハント」を開始
2024 年 5 月 8 日
RevolutのRevolut X Exchangeはメーカー手数料ゼロと高度な分析で仮想通貨トレーダーを魅了
マーケット ソフトウェア ストーリーとレビュー テクノロジー
RevolutのRevolut X Exchangeはメーカー手数料ゼロと高度な分析で仮想通貨トレーダーを魅了
2024 年 5 月 8 日
暗号通貨取引プラットフォーム BitMEX が手数料ゼロと現金インセンティブ付きのオプション取引をデビュー
ビジネス マーケット ニュースレポート
暗号通貨取引プラットフォーム BitMEX が手数料ゼロと現金インセンティブ付きのオプション取引をデビュー
2024 年 5 月 8 日
Liskが正式にイーサリアムレイヤー2に移行し、コアv4.0.6を公開
ニュースレポート テクノロジー
Liskが正式にイーサリアムレイヤー2に移行し、コアv4.0.6を公開
2024 年 5 月 8 日
CRYPTOMERIA LABS PTE。 株式会社。