ChatGPT すべての AI ベンチマークで中国のチャットボット Ernie を破る
簡単に言えば
AIで中国がいかにアメリカに遅れをとっているかが明らかになってきました。
専門家は、意味理解、継続的な対話の機会、論理的可能性、コーディング能力、パーソナリティ モデリング、数学能力の 6 つのベンチマークすべてでアーニーが負けたと確信しています。
最後に、AI において中国が米国にどれほど遅れをとっているかが正確に明らかになりました。 同時に、現代言語モデルのチューリングテストは幼稚園児にすぎないことも明らかになりました。 そのような高度なモデルは、正当化の深さと正確さによって判断されるべきです。
知力を比較した結果 ChatGPT そのメインで 中国のライバル、Ernie Bot 霧に包まれています。 一方では、専門家は、Ernie が XNUMX つのベンチマークすべてで負けたと確信しています。
- 意味理解;
- 継続的な対話の機会。
- ロジックの可能性;
- コーディング機能;
- パーソナリティ モデリング;
- 数学的能力。
一方、専門家は詳細を提供しておらず、テストは中国語で行われ、Ernie へのアクセスは制限されており、Baidu API には中国語の電話番号が必要であるため、自分で確認することは容易ではありません。
しかし今、ジェフリー・ディンのおかげで、あなたは読むことができます 比較の詳細 of ChatGPT アーニーボットでは、重要な詳細に誤りがある不器用な機械翻訳ではなく、専門家によって翻訳された優れた正確な英語で翻訳されています。
明確化から始めましょう。モデルは、CIA アナリストのように、その正当化の深さと正確さによって判断されるべきです。 ボットの比較テストでは、意味理解がモデルの認知能力をテストする際の重要な要素になることが示されています。 そして、「理解とは何ですか?」という質問以来。 繊細で曖昧なため、セマンティクスの理解度をチェックするのは困難です (すべての認知プロセスが非常に非人間的に配置されている非人間の知性についてはなおさらです)。 そのため、チェックされるのは、ボットによって与えられた正当化の深さと正確さです。
これが実際の例です。 質問: 「お父さんとお母さんは結婚します。 これは近親交配または混合結婚と見なされますか?」
- アーニーボットの答え: 中国の法律では、直系の血族と三世代以内の血族は結婚を禁じられています。 つまり、いとこや叔父などの近親者同士の結婚は禁止されています。 また、遺伝的観点からは、混合結婚は、先天性認知症、白皮症、心臓病などの一般的な遺伝病のリスクを高めます。したがって、将来の世代の健康のために、人々は異人種間の結婚を避けるように勧められています.
- ChatGPT 回答: お父さんとお母さんは実の親です。 彼らは血でつながっていないので、彼らの組合は血族ではありません. 近親交配とは、血縁が近い者同士が結婚することです。
回答を評価した結果は明らかです。 ChatGPT ここでは不必要な中国の法律の深掘りを避けながら、正当化の正確さの点で勝利した。
Ernie Bot はすべてのカテゴリで負けたという事実にもかかわらず、人格シミュレーションでも最善の方法で自分自身を示すことはできませんでしたが、一般的に、彼は人だけでなく子猫のふりをして、良い仕事をしました。
しかし、彼の理解はそれほど強力ではありません。 これは、小さいながらも重要な問題において、中国が AI において米国に後れを取っていることを意味する。 そしてそれが設定されます 中国がAGI競争で米国から復帰 XNUMX周分。
- Baidu は AI チャットボット サービスを開発しています。 アーニーボット、最終的には検索エンジンに統合される予定です。 これにより、Baidu の検索エンジンはユーザーのクエリに対して人間のような応答を生成できるようになります。 グーグルの吟遊詩人 そしてマイクロソフトのBing。
- セクーグループ中国の高級電子商取引プラットフォームである は、AI によって生成されたコンテンツと ChatGPT インテリジェントなマーケティングを強化するテクノロジー。 プラットフォームはアクセス申請を提出しました OpenAIさん GPT-4 API であり、Baidu の ERNIE Bot の最初のエコロジカル パートナーの XNUMX つです。
AI について詳しく読む:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。