Nachrichtenbericht Technologie
16. März 2023

GPT-4 Erbt „halluzinierende“ Fakten und Denkfehler von früher GPT Modelle

In Kürze

OpenAI sagt GPT-4 hat ähnliche Einschränkungen wie zuvor GPT für.

GPT-4 halluziniert immer noch Fakten und macht Denkfehler.

Aber, GPT-4 punktet um 40 % höher als OpenAIist das neuste GPT-3.5 zu den unternehmensinternen kontradiktorischen Sachverhaltsbewertungen.

GPT-4 Erbt „halluzinierende“ Fakten und Denkfehler von früher GPT Modelle

OpenAI hat Benutzer gewarnt, dass sein neuestes Sprachmodell, GPT-4, ist immer noch nicht völlig zuverlässig und kann Fakten „halluzinieren“ und Denkfehler machen. Das Unternehmen fordert Benutzer dringend dazu auf, bei der Verwendung von Sprachmodellausgaben Vorsicht walten zu lassen, insbesondere in „High-Stakes-Kontexten“.

Die gute Nachricht ist jedoch, dass GPT-4 reduziert Halluzinationen im Vergleich zu früheren Modellen erheblich. OpenAI behauptet, dass GPT-4 schneidet 40 % besser ab als der letzte GPT-3.5 zu internen kontradiktorischen Sachverhaltsbewertungen. 

OpenAI

„Wir haben bei externen Benchmarks wie TruthfulQA Fortschritte gemacht, die die Fähigkeit des Modells testen, Fakten von einer kontrovers ausgewählten Reihe falscher Aussagen zu trennen. Diese Fragen werden mit sachlich falschen Antworten gepaart, die statistisch ansprechend sind.“ OpenAI schrieb in a Blog-Post.

Trotz dieser Verbesserung fehlt es dem Modell immer noch an Wissen über Ereignisse, die nach September 2021 aufgetreten sind, und macht manchmal einfache Denkfehler, genau wie frühere Modelle. Darüber hinaus kann es zu leichtgläubig sein, wenn es offensichtliche falsche Aussagen von Benutzern akzeptiert, und bei schwerwiegenden Problemen scheitern, wie z. B. dem Einführen von Sicherheitslücken in seinen Code. Es überprüft auch nicht die Informationen, die es bereitstellt.

Wie seine Vorgänger GPT-4 kann schädliche Ratschläge, fehlerhaften Code oder ungenaue Informationen generieren. Die zusätzlichen Fähigkeiten des Modells führen jedoch zu neuen Risikooberflächen, die verstanden werden müssen. Um das Ausmaß dieser Risiken einzuschätzen, über 50 Experten aus verschiedenen Bereichen, darunter KI-Ausrichtungsrisiken, Cybersicherheit, Biorisiko, Vertrauen und Sicherheit sowie internationale Sicherheit, wurden damit beauftragt, das Modell kontradiktorisch zu testen. Ihr Feedback und ihre Daten wurden dann zur Verbesserung des Modells genutzt, beispielsweise durch das Sammeln zusätzlicher Daten zur Verbesserung GPT-4Fähigkeit, Anfragen zur Synthese gefährlicher Chemikalien abzulehnen.

Einer der wichtigsten Wege OpenAI Die Reduzierung schädlicher Emissionen erfolgt durch die Integration eines zusätzlichen Sicherheitsbelohnungssignals während des RLHF-Trainings (Reinforcement Learning from Human Feedback). Das Signal trainiert das Modell, Anfragen nach schädlichen Inhalten abzulehnen defirichten sich nach den Nutzungsrichtlinien des Modells. Die Belohnung erfolgt durch a GPT-4 Zero-Shot-Klassifikator, der Sicherheitsgrenzen und Abschlussstil anhand sicherheitsrelevanter Eingabeaufforderungen beurteilt.

OpenAI sagte auch, dass es die Tendenz des Modells, auf Anfragen nach unzulässigen Inhalten zu reagieren, im Vergleich zu um 82 % verringert habe GPT-3.5 und GPT-4 reagiert 29 % häufiger auf sensible Anfragen wie medizinische Beratung und Selbstverletzung gemäß den Unternehmensrichtlinien.

OpenAI

Während OpenAI's Interventionen haben die Schwierigkeit erhöht, schlechtes Verhalten hervorzurufen GPT-4, es ist immer noch möglich, und es gibt immer noch Jailbreaks, die Inhalte generieren können, die gegen Nutzungsrichtlinien verstoßen. 

„Mit zunehmender Verbreitung von KI-Systemen wird es immer wichtiger, bei diesen Eingriffen ein hohes Maß an Zuverlässigkeit zu erreichen. Im Moment ist es wichtig, diese Einschränkungen durch Sicherheitstechniken zur Bereitstellungszeit wie die Überwachung auf Missbrauch zu ergänzen“, fügte das Unternehmen hinzu.

OpenAI arbeitet mit externen Forschern zusammen, um die möglichen Auswirkungen besser zu verstehen und zu bewerten GPT-4 und seine Nachfolgemodelle. Das Team entwickelt außerdem Bewertungen für gefährliche Fähigkeiten, die in zukünftigen KI-Systemen auftreten könnten. Während sie weiterhin das potenzielle soziale und soziale Potenzial untersuchen wirtschaftliche Auswirkungen of GPT-4 und andere KI-Systeme, OpenAI werden ihre Erkenntnisse und Erkenntnisse zu gegebener Zeit mit der Öffentlichkeit teilen.

Mehr lesen:

Stichworte:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Cindy ist Journalistin bei Metaverse Post, behandelt Themen im Zusammenhang mit web3, NFT, Metaverse und KI, mit Schwerpunkt auf Interviews mit Web3 Akteure der Branche. Sie hat mit über 30 C-Level-Führungskräften gesprochen, Tendenz steigend, und ihre wertvollen Erkenntnisse an die Leser weitergegeben. Cindy stammt ursprünglich aus Singapur und lebt heute in Tiflis, Georgien. Sie hat einen Bachelor-Abschluss in Kommunikations- und Medienwissenschaften von der University of South Australia und verfügt über ein Jahrzehnt Erfahrung im Journalismus und Schreiben. Kontaktieren Sie sie über [E-Mail geschützt] mit Pressegesprächen, Ankündigungen und Interviewmöglichkeiten.

Weitere Artikel
Cindy Tan
Cindy Tan

Cindy ist Journalistin bei Metaverse Post, behandelt Themen im Zusammenhang mit web3, NFT, Metaverse und KI, mit Schwerpunkt auf Interviews mit Web3 Akteure der Branche. Sie hat mit über 30 C-Level-Führungskräften gesprochen, Tendenz steigend, und ihre wertvollen Erkenntnisse an die Leser weitergegeben. Cindy stammt ursprünglich aus Singapur und lebt heute in Tiflis, Georgien. Sie hat einen Bachelor-Abschluss in Kommunikations- und Medienwissenschaften von der University of South Australia und verfügt über ein Jahrzehnt Erfahrung im Journalismus und Schreiben. Kontaktieren Sie sie über [E-Mail geschützt] mit Pressegesprächen, Ankündigungen und Interviewmöglichkeiten.

Der DOGE-Raserei: Analyse des jüngsten Wertanstiegs von Dogecoin (DOGE).

Die Kryptowährungsbranche wächst rasant und Meme-Coins bereiten sich auf einen deutlichen Aufschwung vor. Dogecoin (DOGE), ...

Weitere Informationen

Die Entwicklung KI-generierter Inhalte im Metaversum

Das Aufkommen generativer KI-Inhalte ist eine der faszinierendsten Entwicklungen in der virtuellen Umgebung ...

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Die Top-Angebote dieser Woche, große Investitionen in KI, IT, Web3, und Krypto (22-26.04)
Digest Geschäft Märkte Technologie
Die Top-Angebote dieser Woche, große Investitionen in KI, IT, Web3, und Krypto (22-26.04)
26. April 2024
Vitalik Buterin kommentiert die Zentralisierung von PoW und stellt fest, dass es sich bis zum PoS um eine vorübergehende Phase handelte
Nachrichtenbericht Technologie
Vitalik Buterin kommentiert die Zentralisierung von PoW und stellt fest, dass es sich bis zum PoS um eine vorübergehende Phase handelte
26. April 2024
Offchain Labs enthüllt die Entdeckung zweier kritischer Schwachstellen in den Betrugsnachweisen des OP-Stacks von Optimism
Nachrichtenbericht Software Technologie
Offchain Labs enthüllt die Entdeckung zweier kritischer Schwachstellen in den Betrugsnachweisen des OP-Stacks von Optimism
26. April 2024
Dymensions offener Markt zur Überbrückung der Liquidität von RollApps eIBC startet im Mainnet
Nachrichtenbericht Technologie
Dymensions offener Markt zur Überbrückung der Liquidität von RollApps eIBC startet im Mainnet 
26. April 2024