OpenAI 強力な力を解放します ChatGPT AIチャットボット
簡単に言えば
ChatGPT 最もスマートな会話型 AI モデルです
ChatGPT、とは対照的に GPT-3は、インタラクティブなチャットを継続し、談話の流れを維持するように注意深く教えられたモデルです。 トレーニングに使用したモデル ChatGPTは、2022 年の初めにトレーニングが行われました。 GPT-3.5 シリーズ。
ダイアログ形式により、 ChatGPT 追加のクエリに応答し、その誤りを認め、誤った仮定を反論し、無関係なリクエストを拒否するため。 チャットボットは非常にインテリジェントで、手紙を作成したり、面白いジョークを考え出したり、問い合わせに答えたりすることがあります。
指示するのと同じようにGPT, OpenAI は、データ収集の配置にいくつかの小さな変更を加えて、ヒューマン フィードバックからの強化学習 (RLHF) を使用してこのモデルをトレーニングしました。 OpenAI 人間の AI トレーナーがチャットでユーザーと AI アシスタントの両方として機能することで、教師あり微調整を使用して初期モデルをトレーニングします。 これにより、トレーナーは回答作成を支援するためのサンプル作成の推奨事項にアクセスできるようになりました。
会話のいくつかのサンプルが画像に示されています。
強化学習の報酬モデルを開発するためには、品質によって等級付けされた XNUMX つ以上のモデル応答からなる比較データを収集する必要がありました。 開発者は、この情報を収集するために、AI トレーナーがチャットボットで行ったディスカッションを記録しました。 作成者は、モデルによって記述されたステートメントを無作為に選択し、いくつかの潜在的な結論をサンプリングし、AI トレーナーにそれらをランク付けするよう依頼しました。 これらの報酬モデルを利用して、Proximal Policy Optimization を使用してモデルを調整できます。
このチャットボットに話しかける 右ここに. ただし、サーバーは現在いっぱいです。
もっと読む GPT-3:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。