Raport aktualności Technologia
15 marca 2023 r.

OpenAI Tworzy zespół ponad 50 ekspertów w celu ulepszenia GPT-4Bezpieczeństwo

W skrócie

OpenAI zatrudnił zespół ponad 50 ekspertów, aby zapewnić jego najnowszą wersję model języka, GPT-4, jest bezpieczny w użyciu.

W skład zespołu wchodzą badacze i inżynierowie specjalizujący się w bezpieczeństwie, etyce i polityce sztucznej inteligencji.

Celem jest zapobieganie GPT-4 przed generowaniem szkodliwych lub stronniczych treści oraz do zapewnienia ich zgodności z wartościami ludzkimi.

OpenAI Tworzy zespół ponad 50 ekspertów w celu ulepszenia GPT-4Bezpieczeństwo

OpenAI do realizacji zatrudniło ponad 50 ekspertów z różnych dziedzin GPT-4 bezpieczniejsze. Eksperci przeprowadzili kontradyktoryjne testowanie modelu w celu zidentyfikowania potencjalnych zagrożeń i słabych punktów. Są ekspertami z różnych dziedzin: długoterminowych zagrożeń związanych z dostosowaniem sztucznej inteligencji, cyberbezpieczeństwa, ryzyka biologicznego i bezpieczeństwa międzynarodowego. Ich odkrycia pomogły OpenAI ocenić modelowe zachowanie w obszarach wysokiego ryzyka, które wymagają niszowej wiedzy specjalistycznej. 

Chociaż najnowszy model językowy stwarza podobne ryzyko jak mniejsze modele językowe, dodatkowe możliwości GPT-4 prowadzić do nowych zagrożeń. W ten sposób doszło do zaangażowania ekspertów ma kluczowe znaczenie dla zapewnienia bezpieczeństwa technologii.

OpenAI wdrożyło dodatkowy zestaw istotnego dla bezpieczeństwa uczenia się przez wzmacnianie na podstawie podpowiedzi szkoleniowych dotyczących preferencji ludzkich (RLHF) i modeli nagród opartych na regułach (RBRM), aby poprawić bezpieczeństwo GPT-4 Model. RBRM są typu zero-shot GPT-4 klasyfikatory, które działają jako dodatkowy sygnał nagrody dla GPT-4 model polityki podczas dostrajania RLHF. Ich celem jest zachęcanie do odpowiedniego zachowania, np. odmowy generowania szkodliwych treści lub nieodrzucania nieszkodliwych żądań.

Aby zapewnić bezpieczeństwo GPT-4 modele, OpenAI rozpoczął rekrutację ekspertów zewnętrznych w sierpniu 2022 r. w celu przeprowadzenia ćwiczeń „red teaming”, obejmujących testy warunków skrajnych, testy graniczne i testy kontradyktoryjne. Mieli dostęp do wczesnych wersji GPT-4 model i zidentyfikował wstępne zagrożenia, które stały się motywacją do dalszych badań nad bezpieczeństwem.

Informacje zwrotne od ekspertów doprowadziły do ​​technicznych środków łagodzących i środków egzekwowania polityki w celu ograniczenia ryzyka. Nadal istnieje jednak wiele zagrożeń i konieczna jest dalsza ocena.

Mowa o pracownikach w OpenAI, ChatGPT był początkowo rozwinięty przy pomocy osób z niektórych najbiedniejszych regionów świata OpenAIwspółpracuje z firmą Sama, która zatrudnia miliony pracowników z biednych obszarów. Niektórzy eksperci w dziedzinie etyki sztucznej inteligencji skrytykowali OpenAIdecyzji o outsourcingu szkolenia swoich ChatGPT wzorować się na Sama, oskarżając firmę o wykorzystywanie taniej siły roboczej.

Czytaj więcej:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Agne jest dziennikarką, która zajmuje się najnowszymi trendami i wydarzeniami w metaverse, sztucznej inteligencji i Web3 branże dla Metaverse Post. Jej pasja do opowiadania historii skłoniła ją do przeprowadzenia licznych wywiadów z ekspertami w tych dziedzinach, zawsze starając się odkryć ekscytujące i wciągające historie. Agne posiada tytuł licencjata z literatury i rozległe doświadczenie w pisaniu na różne tematy, w tym podróże, sztukę i kulturę. Zgłosiła się także jako wolontariuszka jako redaktorka do organizacji praw zwierząt, gdzie pomagała podnosić świadomość na temat kwestii związanych z dobrostanem zwierząt. Skontaktuj się z nią [email chroniony].

Więcej artykułów
Agnieszka Cimerman
Agnieszka Cimerman

Agne jest dziennikarką, która zajmuje się najnowszymi trendami i wydarzeniami w metaverse, sztucznej inteligencji i Web3 branże dla Metaverse Post. Jej pasja do opowiadania historii skłoniła ją do przeprowadzenia licznych wywiadów z ekspertami w tych dziedzinach, zawsze starając się odkryć ekscytujące i wciągające historie. Agne posiada tytuł licencjata z literatury i rozległe doświadczenie w pisaniu na różne tematy, w tym podróże, sztukę i kulturę. Zgłosiła się także jako wolontariuszka jako redaktorka do organizacji praw zwierząt, gdzie pomagała podnosić świadomość na temat kwestii związanych z dobrostanem zwierząt. Skontaktuj się z nią [email chroniony].

Apetyt instytucjonalny na ETFy Bitcoin rośnie w obliczu zmienności

Ujawnienia zawarte w zgłoszeniach 13F ujawniają, że znaczący inwestorzy instytucjonalni parają się funduszami ETF Bitcoin, co podkreśla rosnącą akceptację…

Dowiedz się więcej

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Injective łączy siły z AltLayer, aby zapewnić bezpieczeństwo ponownego stakowania w inEVM
Biznes Raport aktualności Technologia
Injective łączy siły z AltLayer, aby zapewnić bezpieczeństwo ponownego stakowania w inEVM
3 maja 2024 r.
Masa współpracuje z Tellerem, aby wprowadzić pulę pożyczek MASA, umożliwiającą zaciąganie pożyczek w USDC
rynki Raport aktualności Technologia
Masa współpracuje z Tellerem, aby wprowadzić pulę pożyczek MASA, umożliwiającą zaciąganie pożyczek w USDC
3 maja 2024 r.
Velodrome wprowadza wersję beta Superchain w nadchodzących tygodniach i rozszerza się na łańcuchy bloków warstwy 2 stosu OP
rynki Raport aktualności Technologia
Velodrome wprowadza wersję beta Superchain w nadchodzących tygodniach i rozszerza się na łańcuchy bloków warstwy 2 stosu OP
3 maja 2024 r.
CARV ogłasza partnerstwo z firmą Aethir w celu decentralizacji warstwy danych i dystrybucji nagród
Biznes Raport aktualności Technologia
CARV ogłasza partnerstwo z firmą Aethir w celu decentralizacji warstwy danych i dystrybucji nagród
3 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.