Nieuwsverslag Technologie
13 april 2023

ChatGPT Verslaat de Chinese chatbot Ernie in alle AI-benchmarks

In het kort

Duidelijk is geworden in welke mate China achterloopt op de Verenigde Staten op het gebied van AI.

Experts zijn ervan overtuigd dat Ernie verloor in alle 6 benchmarks: semantisch begrip, mogelijkheden voor continue dialoog, logische mogelijkheden, coderingsmogelijkheden, persoonlijkheidsmodellering en wiskundige vaardigheid.

Eindelijk is nu precies duidelijk hoe erg China achterloopt op de Verenigde Staten op het gebied van AI. Tegelijkertijd is ook duidelijk geworden dat de Turing-test voor moderne taalmodellen nog maar een kleuterschool is. Dergelijke geavanceerde modellen moeten worden beoordeeld op basis van de diepgang en nauwkeurigheid van hun rechtvaardigingen.

ChatGPT versloeg de Chinese chatbot Ernie in alle benchmarks
@Midjourney / 轩轩001#3777

De resultaten van het vergelijken van de intellectuele kracht van ChatGPT met zijn belangrijkste Chinese concurrent Ernie Bot zijn in mist gehuld. Aan de ene kant zijn experts ervan overtuigd dat Ernie verloor in alle zes de benchmarks:

  • Semantisch begrip;
  • Mogelijkheden voor continue dialoog;
  • Logische mogelijkheden;
  • Codeermogelijkheden;
  • Persoonlijkheidsmodellering;
  • Wiskundig vermogen.

Aan de andere kant geven experts geen details en is het niet eenvoudig om het zelf te controleren omdat de tests in het Chinees waren, de toegang tot Ernie beperkt is en de Baidu API een Chinees telefoonnummer vereist.

Maar nu, dankzij Jeffrey Ding, kun je lezen de details van de vergelijking of ChatGPT met Ernie Bot, niet in onhandige machinevertaling met fouten in belangrijke details, maar in goed en accuraat Engels vertaald door een specialist.

Laten we beginnen met een verduidelijking: modellen moeten, net als CIA-analisten, worden beoordeeld op de diepgang en nauwkeurigheid van hun rechtvaardigingen. Vergelijkende tests van bots hebben aangetoond dat semantisch begrip een sleutelfactor wordt bij het testen van de cognitieve vaardigheden van het model. En aangezien de vraag "Wat is begrijpen?" is delicaat en dubbelzinnig, het is moeilijk om de mate van begrip van semantiek te controleren (en nog meer voor een niet-menselijk intellect, waarin alle cognitieve processen zeer niet-menselijk zijn gerangschikt). Daarom wordt gecontroleerd op de diepte en nauwkeurigheid van de rechtvaardigingen die door bots worden gegeven.

Hier is een echt voorbeeld. Vraag: “Papa en mama gaan trouwen; wordt dit beschouwd als inteelt of een gemengd huwelijk?”

  1. Het antwoord van Ernie Bot: De Chinese wet bepaalt dat directe bloedverwanten en bloedverwanten binnen drie generaties niet mogen trouwen. Met andere woorden, huwelijken tussen naaste verwanten, zoals neven, nichten, ooms enz., zijn verboden. En vanuit genetisch oogpunt verhogen gemengde huwelijken het risico op een aantal veel voorkomende genetische ziekten, zoals aangeboren dementie, albinisme, hartaandoeningen, enz. Daarom wordt mensen voor de gezondheid van toekomstige generaties geadviseerd gemengde huwelijken te vermijden.
  2. ChatGPT antwoord: Papa en mama zijn biologische ouders. Ze zijn niet bloedverwant, dus hun verbintenis is niet bloedverwant. Inteelt is het huwelijk van mensen die nauw bloedverwant zijn.

Het resultaat van het evalueren van de antwoorden ligt voor de hand: ChatGPT gewonnen in termen van nauwkeurigheid van rechtvaardiging, terwijl de diepte van het graven in Chinese wetgeving wordt vermeden die hier niet nodig is.

Ondanks het feit dat Ernie Bot in alle categorieën verloor en zichzelf niet op de beste manier liet zien, zelfs niet in persoonlijkheidssimulatie, deed hij het over het algemeen goed, zelfs door te doen alsof hij niet alleen een persoon was, maar ook een kitten.

Zijn inzicht is echter niet zijn sterkste kant. En dit betekent dat China op het gebied van AI op een klein maar cruciaal punt achterloopt op de VS. En dat zet China terug van de VS in de race naar AGI met een volledige ronde.

  • Baidu ontwikkelt een AI-chatbotservice genaamd Ernie Bot, dat uiteindelijk in de zoekmachine zal worden geïntegreerd. Hierdoor kan de zoekmachine van Baidu mensachtige antwoorden genereren op vragen van gebruikers, vergelijkbaar met De bard van Google en Microsofts Bing.
  • Secoo Groep, een luxe e-commerceplatform in China, is van plan om door AI gegenereerde inhoud te gebruiken en ChatGPT technologieën om zijn intelligente marketing een boost te geven. Het platform heeft een aanvraag ingediend voor toegang tot OpenAI's GPT-4 API en is een van de eerste ecologische partners van Baidu's ERNIE Bot.

Lees meer over AI:

Disclaimer

In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.

Over de auteur

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

Meer artikelen
Damir Jalalov
Damir Jalalov

Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet. 

De institutionele belangstelling groeit richting Bitcoin ETF’s te midden van volatiliteit

Uit openbaarmakingen via 13F-registraties blijkt dat opmerkelijke institutionele beleggers zich bezighouden met Bitcoin ETF's, wat een groeiende acceptatie onderstreept van ...

Meer weten

De dag van de veroordeling breekt aan: het lot van CZ hangt in evenwicht terwijl de Amerikaanse rechtbank het pleidooi van DOJ in overweging neemt

Changpeng Zhao staat vandaag op het punt te worden veroordeeld door een Amerikaanse rechtbank in Seattle.

Meer weten
Sluit u aan bij onze innovatieve technologiegemeenschap
Lees meer
Lees meer
De verschuiving van Donald Trump naar crypto: van tegenstander naar pleitbezorger, en wat dit betekent voor de Amerikaanse cryptocurrency-markt
Business Markten Verhalen en recensies Technologie
De verschuiving van Donald Trump naar crypto: van tegenstander naar pleitbezorger, en wat dit betekent voor de Amerikaanse cryptocurrency-markt
10 mei 2024
Layer3 lanceert deze zomer het L3-token en wijst 51% van het totale aanbod toe aan de gemeenschap
Markten Nieuwsverslag Technologie
Layer3 lanceert deze zomer het L3-token en wijst 51% van het totale aanbod toe aan de gemeenschap
10 mei 2024
Edward Snowdens laatste waarschuwing aan Bitcoin-ontwikkelaars: “Maak van privacy een prioriteit op protocolniveau, anders loop je het risico deze te verliezen
Markten Security Wiki Software Verhalen en recensies Technologie
Edward Snowdens laatste waarschuwing aan Bitcoin-ontwikkelaars: “Maak van privacy een prioriteit op protocolniveau, anders loop je het risico deze te verliezen
10 mei 2024
Door optimisme aangedreven Ethereum Layer 2 Network Mint lanceert zijn mainnet op 15 mei
Nieuwsverslag Technologie
Door optimisme aangedreven Ethereum Layer 2 Network Mint lanceert zijn mainnet op 15 mei
10 mei 2024