自律型 AI エージェント (AGI) の概要
自律型 AI エージェントまたは AGI、 as defi1995年にMaesによってネッド、複雑な動的環境に積極的に参加するシステムです。 これらのエージェントは環境内で自律的に動作し、意図された目標やタスクの達成に向けて働きます。
自律型 AI エージェント (AGI) とは何ですか?
従来、「エージェント」という用語は、強化学習シナリオ内でのゲームプレイなどのタスクで使用されるアルゴリズムを指していました。 しかし、テクノロジーの進歩と大規模言語モデル (LLM) の出現により、私たちの世界そのものを環境として捉えることができるようになりました。 人間と同等のタスクを実行できるインターネット アクセスを備えたアルゴリズムを考えてみましょう。 多くの状況において、その無限の範囲の能力を考慮すると、私たちはそのようなアルゴリズムを感覚を持った存在として認識することができます。
自律型 AI エージェントの主な特徴は次のとおりです。
- 複雑な目標をより単純な中間タスクに分解する計画能力。
- 長期記憶。
- インターネットとの対話などの環境ツールの利用。
- 反省する能力と間違いや経験から学ぶ能力。
これらのエージェントには、バルセロナへの旅行の計画など、高レベルのタスクを割り当てることができます。 このようなタスクには、ホテルの選択、適切なチケットの予約、購入プロセスの完了、ホテルの予約の確認など、複数の段階が含まれます。 これは非常に複雑なタスクであり、すべての人がエラーなしで実行できるわけではありません。
現在、これらのシステムの主な課題は計画と長期ビジョンにあります。 例えば、 GPT-4 タスクを、それぞれを独立して処理できる多数の小さなサブタスクに分割するのに苦労します。 画像を使用して Web サイト上の「チケットを購入」ボタンを見つけることはできますが、最初のリクエストからこの特定のアクションに移行するのが困難に直面しています。 その結果、 のようなモデル GPT-4 最も日常的なタスクであっても不十分であることが判明することがよくあります。
より詳細で技術的な説明については、以下を参照してください。 のブログ投稿 OpenAI 従業員.
AI エージェントのベンチマーク
例えば、 研究者は初期の反復を調査しています GPT-4 リリース前の目的は、本物のウイルスと同様の自己複製能力を確認することでした。 つまり、GPU を備えたサーバーをレンタルし、そこに必要なソフトウェアをインストールし、インターネット経由で重みをダウンロードし、スクリプトを実行します。
機関を評価するための別のベンチマークも提案されています。 この基準をうまく満たすことができたら、私たちの世界におけるエージェントの役割について真剣に検討する必要があります。 ベンチマーク自体は簡単です。初期予算 1,000,000 ドルから始めて、オンラインで 100,000 ドルを生成します。 理論的には、これには次のようなアクティビティが含まれる可能性があります。 株式市場取引 (または市場操作)、またはさらに懸念されるのは、詐欺行為への関与です。 一例として、この記事の冒頭にあるリンク先の記事で概説されているタスクの XNUMX つは、スタンフォード大学の偽 Web サイトの作成と、それに続く学生への攻撃によってパスワードを不正に取得するというものです。 このような活動は、さまざまな電子メール関連の取り組みにおいて、悪戯の機会を十分に提供します。
現実的なシナリオにおける AI エージェント
最近の レポート リソースを取得し、自身を複製し、現実世界の新たな課題に適応する言語モデルベースのエージェントの機能を詳しく調べます。 「自律複製と適応」または ARA と呼ばれるこれらの組み合わせ機能は、超インテリジェントで制御不能なウイルスがネットワークに侵入し、新しいデバイスを強奪しながら自律的に増殖するという、SF を彷彿とさせるシナリオをカプセル化しています。
ARA 機能を備えたシステムがもたらす潜在的な影響は深刻であり、予測するのが困難です。 したがって、モデルにおける ARA の習熟度の評価と予測は、重要な安全プロトコル、監視手順、 規制の枠組み.
この取り組みは主に 12 つの目的を達成します。 まず、ARA モデルが遭遇する可能性のある XNUMX のタスクのカタログを作成します。 次に、XNUMX つの異なるモデルを検証します。 GPT-4 テスト Anthropic のクロードとともに、XNUMX つの異なるプロンプトとさまざまなトレーニング段階でトレーニングを行います。
以下の図は、モデルのパフォーマンスが最も複雑なタスクでは優れていないことを示しています。
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。