ニュースレポート テクノロジー
2023 年 9 月 12 日

FLM-101B: 主要な AI モデルと競合する超コスト効率の高い 101B スケール言語モデル

簡単に言えば

中国の LLM LM-101B は、100 万ドルの予算でトレーニングでき、次のような有名なモデルに匹敵するパフォーマンスを達成します。 GPT-3 そしてGLM-130B。

中国の研究者が新しいLLMを発表した。 FLM-101B、驚異的な 101 億パラメータを誇るデコーダ専用 LLM。 この開発は、研究と実用化の両方に費用対効果の高い代替手段を提供します。

FLM-101B: 主要な AI モデルと競合する超コスト効率の高い 101B スケール言語モデル
関連する AI モデルのトレーニング コストは、100 年までに 500 億ドルから 2030 億ドルに増加すると予測されています

FLM-101B を際立たせているのは、比較的低予算で達成できる卓越したパフォーマンスです。 LLM をゼロからトレーニングするには天文学的な投資が必要になる可能性があることはよく知られていますが、FLM-101B の作成者は、わずか 101 万ドルの予算で 100 億のパラメータを持つモデルをトレーニングできることを示しました。

実験結果は驚くべきものでした。 FLM-101B は、確立されたリソース集約型と同等のパフォーマンス レベルを実証しました。 のようなモデル GPT-3 そしてGLM-130B。 この比較は、特にトレーニング データに存在しない複雑なコンテキストを含む IQ ベンチマークにおいて、この費用対効果の高いモデルの大きな可能性を強調しています。

AI 研究開発の推進への取り組みを強調する動きとして、FLM-101B の作成者はこのモデルをオープンソースにしました。 世界中の研究者や開発者は、この 101B スケール LLM にアクセスし、中国語と英語の両方の言語にわたるさまざまなアプリケーションに活用できるようになりました。

FLM-101B モデルは、独自のトレーニング アプローチを採用しています。 トレーニングの初期段階では 16 億の小規模なパラメーター モデルから知識を迅速に蓄積し、段階的に 101 億のパラメーターまでスケールアップします。 この段階的なアプローチにより、トレーニング コストが大幅に削減され、より幅広いプロジェクトで経済的に実行可能になります。

FLM-101B の際立った機能の XNUMX つは、推論中の効率的なウィンドウ サイズ拡張のサポートです。 これは、xPos 回転位置埋め込みの使用によって実現され、モデルがより広範なコンテキストを処理できるようになり、適応性と使いやすさが向上します。

FLM-101B は、24 日以内に 800 台の DGX-A26 GPU サーバーのクラスター上でトレーニングされました。 この印象的な偉業は、モデルの拡張性と効率的なリソース利用を強調しています。 Megatron-LM から適応されたモデルのトレーニング コードベースは間もなくオープンソースとして利用可能になり、AI コミュニティに貴重な洞察を提供します。

FLM-101B の作成者は、データセットのオープンな性質により、モデルがトレーニング コーパス内の安全でない例にさらされるなど、潜在的な制限があることを認識しています。 この警告は、責任ある AI の使用と、 コンテンツ管理.

FLM-101B は目覚ましい結果を達成しましたが、開発者は改善の余地があることを認識しています。 モデルの推論プロセスは強力ですが、まだ完全には最適化されていないため、リソース使用量が増加し、速度が低下します。 ただし、この制限に対処するために、推論にフラッシュ アテンションを導入する計画が進行中です。

AI について詳しく読む:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories
ニュースレターにご参加ください。
最新ニュース

ボラティリティの中でビットコインETFへの機関投資家の意欲が高まる

13Fの提出書類による開示では、著名な機関投資家がビットコインETFに手を出していることが明らかになり、...

詳細を知りたい

量刑の日が到来:米国裁判所が司法省の申し立てを検討する中、CZの運命は均衡を保っている

Changpeng Zhao氏は本日、シアトルの米国裁判所で判決を受ける予定である。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
BLOCKCHANCE と CONF3RENCE がドイツ最大規模のために統合 Web3 ドルトムントでのカンファレンス
ビジネス マーケット ソフトウェア ストーリーとレビュー テクノロジー
BLOCKCHANCE と CONF3RENCE がドイツ最大規模のために統合 Web3 ドルトムントでのカンファレンス
2024 年 5 月 9 日
NuLink が Bybit で起動 Web3 IDOプラットフォーム。サブスクリプション期間は 13 月 XNUMX 日まで延長されます
マーケット ニュースレポート テクノロジー
NuLink が Bybit で起動 Web3 IDOプラットフォーム。サブスクリプション期間は 13 月 XNUMX 日まで延長されます
2024 年 5 月 9 日
UXLINK と Binance が新しいキャンペーンで協力し、ユーザーに 20 万 UXUY ポイントと Airdrop 報酬
マーケット ニュースレポート テクノロジー
UXLINK と Binance が新しいキャンペーンで協力し、ユーザーに 20 万 UXUY ポイントと Airdrop 報酬
2024 年 5 月 9 日
Side Protocol がインセンティブ付きテストネットを開始し、Insider Point システムを導入し、ユーザーが SIDE ポイントを獲得できるようにします
マーケット ニュースレポート テクノロジー
Side Protocol がインセンティブ付きテストネットを開始し、Insider Point システムを導入し、ユーザーが SIDE ポイントを獲得できるようにします
2024 年 5 月 9 日
CRYPTOMERIA LABS PTE。 株式会社。