Nachrichtenbericht Technologie
15. März 2023

OpenAI Stellt ein Team von über 50 Experten zur Verbesserung zusammen GPT-4Sicherheit

In Kürze

OpenAI hat ein Team von über 50 Experten eingestellt, um sicherzustellen, dass es immer auf dem neuesten Stand ist Sprachmodell, GPT-4, ist sicher in der Anwendung.

Das Team besteht aus Forschern und Ingenieuren, die sich auf KI-Sicherheit, Ethik und Richtlinien spezialisiert haben.

Ziel ist die Vorbeugung GPT-4 um zu verhindern, dass schädliche oder voreingenommene Inhalte generiert werden, und um sicherzustellen, dass diese mit menschlichen Werten im Einklang stehen.

OpenAI Stellt ein Team von über 50 Experten zur Verbesserung zusammen GPT-4Sicherheit

OpenAI hat über 50 Experten aus verschiedenen Bereichen eingestellt GPT-4 sicherer. Die Experten haben mit kontradiktorischen Tests des Modells gearbeitet, um potenzielle Risiken und Schwachstellen zu identifizieren. Sie sind Experten aus verschiedenen Bereichen: langfristige KI-Ausrichtungsrisiken, Cybersicherheit, Biorisiko und internationale Sicherheit. Ihre Erkenntnisse haben geholfen OpenAI Bewerten Sie das Modellverhalten in Hochrisikobereichen, die Nischenkompetenz erfordern. 

Während das neueste Sprachmodell ähnliche Risiken birgt wie kleinere Sprachmodelle, sind die zusätzlichen Fähigkeiten von GPT-4 zu neuen Bedrohungen führen. Daher wurde die Einbeziehung von Experten durchgeführt entscheidend für die Sicherheit der Technik.

OpenAI hat einen zusätzlichen Satz sicherheitsrelevanter Verstärkungslernen aus menschlichen Präferenzen (RLHF)-Trainingsaufforderungen und regelbasierten Belohnungsmodellen (RBRMs) implementiert, um die Sicherheit des zu verbessern GPT-4 Modell. Die RBRMs sind Zero-Shot GPT-4 Klassifikatoren, die als zusätzliches Belohnungssignal für die fungieren GPT-4 Politikmodell während der RLHF-Feinabstimmung. Ihr Zweck besteht darin, Anreize für angemessenes Verhalten zu schaffen, beispielsweise die Weigerung, schädliche Inhalte zu generieren oder harmlose Anfragen nicht abzulehnen.

Um die Sicherheit zu gewährleisten GPT-4 Modelle, OpenAI begann im August 2022 mit der Rekrutierung externer Experten, um „Red-Teaming“-Übungen durchzuführen, darunter Stresstests, Grenztests und kontradiktorische Tests. Sie hatten Zugriff auf frühe Versionen des GPT-4 Modell und identifizierte erste Risiken, die weitere Sicherheitsforschung motivierten.

Das Feedback der Experten führte zu technischen Schadensbegrenzungen und Maßnahmen zur Durchsetzung von Richtlinien, um Risiken zu reduzieren. Es bleiben jedoch viele Bedrohungen bestehen, und eine weitere Bewertung ist erforderlich.

Apropos Mitarbeiter bei OpenAI, ChatGPT war anfangs entwickelt mit Hilfe von Einzelpersonen in einigen der ärmsten Regionen der Welt durch OpenAIist eine Partnerschaft mit einem Unternehmen namens Sama, das Millionen von Arbeitern aus verarmten Gegenden beschäftigt. Einige Experten für KI-Ethik haben kritisiert OpenAI's Entscheidung, die Ausbildung seiner Mitarbeiter auszulagern ChatGPT Model an Sama und beschuldigte das Unternehmen, billige Arbeitskräfte auszubeuten.

Mehr lesen:

Stichworte:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Agne ist eine Journalistin, die über die neuesten Trends und Entwicklungen im Metaversum, in der KI und anderen Bereichen berichtet Web3 Branchen für die Metaverse Post. Ihre Leidenschaft für das Geschichtenerzählen hat sie dazu geführt, zahlreiche Interviews mit Experten auf diesen Gebieten zu führen, immer auf der Suche nach spannenden und fesselnden Geschichten. Agne hat einen Bachelor-Abschluss in Literatur und verfügt über umfangreiche Erfahrung im Schreiben über ein breites Themenspektrum, darunter Reisen, Kunst und Kultur. Sie war außerdem ehrenamtlich als Redakteurin für die Tierrechtsorganisation tätig und half dabei, das Bewusstsein für Tierschutzthemen zu schärfen. Kontaktieren Sie sie unter [E-Mail geschützt] .

Weitere Artikel
Agne Cimerman
Agne Cimerman

Agne ist eine Journalistin, die über die neuesten Trends und Entwicklungen im Metaversum, in der KI und anderen Bereichen berichtet Web3 Branchen für die Metaverse Post. Ihre Leidenschaft für das Geschichtenerzählen hat sie dazu geführt, zahlreiche Interviews mit Experten auf diesen Gebieten zu führen, immer auf der Suche nach spannenden und fesselnden Geschichten. Agne hat einen Bachelor-Abschluss in Literatur und verfügt über umfangreiche Erfahrung im Schreiben über ein breites Themenspektrum, darunter Reisen, Kunst und Kultur. Sie war außerdem ehrenamtlich als Redakteurin für die Tierrechtsorganisation tätig und half dabei, das Bewusstsein für Tierschutzthemen zu schärfen. Kontaktieren Sie sie unter [E-Mail geschützt] .

Angesichts der Volatilität wächst der institutionelle Appetit auf Bitcoin-ETFs

Offenlegungen in 13F-Anmeldungen zeigen, dass namhafte institutionelle Anleger sich mit Bitcoin-ETFs beschäftigen, was die wachsende Akzeptanz von ... unterstreicht.

Weitere Informationen

Der Tag der Verurteilung steht vor der Tür: Das Schicksal von CZ bleibt ungewiss, während das US-Gericht den Plädoyer des DOJ prüft

Changpeng Zhao steht heute vor einer Verurteilung vor einem US-Gericht in Seattle.

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Injective schließt sich mit AltLayer zusammen, um inEVM erneut Sicherheit zu bieten
Geschäft Nachrichtenbericht Technologie
Injective schließt sich mit AltLayer zusammen, um inEVM erneut Sicherheit zu bieten
3. Mai 2024
Masa arbeitet mit Teller zusammen, um den MASA-Kreditpool einzuführen, der die USDC-Kreditaufnahme auf Basis ermöglicht
Märkte Nachrichtenbericht Technologie
Masa arbeitet mit Teller zusammen, um den MASA-Kreditpool einzuführen, der die USDC-Kreditaufnahme auf Basis ermöglicht
3. Mai 2024
Velodrome bringt in den kommenden Wochen die Beta-Version von Superchain auf den Markt und weitet sich auf OP-Stack-Layer-2-Blockchains aus
Märkte Nachrichtenbericht Technologie
Velodrome bringt in den kommenden Wochen die Beta-Version von Superchain auf den Markt und weitet sich auf OP-Stack-Layer-2-Blockchains aus
3. Mai 2024
CARV gibt Partnerschaft mit Aethir bekannt, um seine Datenschicht zu dezentralisieren und Belohnungen zu verteilen
Geschäft Nachrichtenbericht Technologie
CARV gibt Partnerschaft mit Aethir bekannt, um seine Datenschicht zu dezentralisieren und Belohnungen zu verteilen
3. Mai 2024