Raport aktualności Technologia
16 marca 2023 r.

GPT-4 Dziedziczy „halucynacyjne” fakty i błędy w rozumowaniu z wcześniejszych lat GPT modele

W skrócie

OpenAI mówią GPT-4 ma podobne ograniczenia jak poprzednio GPT modele.

GPT-4 nadal ma halucynacje na faktach i popełnia błędy w rozumowaniu.

Jednakże, GPT-4 osiąga wyniki o 40% wyższe niż OpenAInajnowszy GPT-3.5 na wewnętrznych, kontradyktoryjnych ocenach faktów.

GPT-4 Dziedziczy „halucynacyjne” fakty i błędy w rozumowaniu z wcześniejszych lat GPT modele

OpenAI ostrzegł użytkowników, że jego najnowszy model językowy, GPT-4, nadal nie jest w pełni wiarygodny i może „halucynować” fakty i popełniać błędy w rozumowaniu. Firma zachęca użytkowników do zachowania ostrożności podczas korzystania z wyników modelu językowego, szczególnie w „kontekstach wymagających dużej stawki”.

Jednak dobra wiadomość jest taka GPT-4 znacznie zmniejsza halucynacje w stosunku do poprzednich modeli. OpenAI twierdzi że GPT-4 osiąga wynik o 40% wyższy od najnowszego GPT-3.5 na wewnętrznych, kontradyktoryjnych ocenach faktów. 

przez OpenAI

„Poczyniliśmy postępy w zakresie zewnętrznych testów porównawczych, takich jak TruthfulQA, które testują zdolność modelu do oddzielenia faktów od zbioru błędnych stwierdzeń wyselekcjonowanych przez przeciwników. Te pytania są połączone z niepoprawnymi pod względem faktycznym odpowiedziami, które są statystycznie atrakcyjne ” OpenAI napisał w blogu.

Pomimo tego ulepszenia model nadal nie ma wiedzy o wydarzeniach, które miały miejsce po wrześniu 2021 r., a czasami popełnia proste błędy rozumowania, tak jak robią to wcześniejsze modele. Ponadto może być zbyt łatwowierny w przyjmowaniu oczywistych fałszywych oświadczeń od użytkowników i zawodzić w trudnych problemach, takich jak wprowadzanie luk w zabezpieczeniach do swojego kodu. Nie sprawdza również faktów, które podaje.

Podobnie jak jego poprzednicy, GPT-4 może generować szkodliwe porady, błędny kod lub niedokładne informacje. Jednak dodatkowe możliwości modelu prowadzą do nowych powierzchni ryzyka, które należy zrozumieć. Aby ocenić zakres tych zagrożeń, ponad 50 ekspertów z różnych dziedzin, w tym zagrożeń związanych z dostosowaniem sztucznej inteligencji, cyberbezpieczeństwa, ryzyka biologicznego, zaufania i bezpieczeństwa oraz bezpieczeństwa międzynarodowego, w celu kontradyktoryjnego przetestowania modelu. Ich opinie i dane wykorzystano następnie do ulepszenia modelu, na przykład do zebrania dodatkowych danych w celu jego ulepszenia GPT-4zdolność do odrzucania próśb o syntezę niebezpiecznych substancji chemicznych.

Jeden z głównych sposobów OpenAI ogranicza szkodliwe produkty poprzez włączenie dodatkowego sygnału nagrody za bezpieczeństwo podczas szkolenia RLHF (wzmacnianie uczenia się na podstawie informacji zwrotnej od ludzi). Sygnał uczy model odrzucania żądań dotyczących szkodliwych treści, np defizgodnie z wytycznymi użytkowania modelu. Nagrodę zapewnia A GPT-4 klasyfikator zerowego strzału, który ocenia granice bezpieczeństwa i styl ukończenia w przypadku podpowiedzi związanych z bezpieczeństwem.

OpenAI stwierdziło również, że zmniejszyło to skłonność modelki do odpowiadania na żądania dotyczące niedozwolonych treści o 82% w porównaniu do GPT-3.5, i GPT-4 29% częściej odpowiada na wrażliwe prośby, takie jak porada lekarska i samookaleczenie, zgodnie z polityką firmy.

przez OpenAI

Kompletujemy wszystkie dokumenty (wymagana jest kopia paszportu i XNUMX zdjęcia) potrzebne do OpenAIinterwencje zwiększyły trudność wywołania złego zachowania GPT-4, jest to nadal możliwe i nadal istnieją jailbreaki, które mogą generować treści naruszające wytyczne dotyczące użytkowania. 

„W miarę jak systemy sztucznej inteligencji stają się coraz bardziej rozpowszechnione, osiągnięcie wysokiego stopnia niezawodności w tych interwencjach będzie miało coraz większe znaczenie. Na razie konieczne jest uzupełnienie tych ograniczeń o techniki bezpieczeństwa na czas wdrożenia, takie jak monitorowanie pod kątem nadużyć” — dodała firma.

OpenAI współpracuje z badaczami zewnętrznymi, aby lepiej zrozumieć i ocenić potencjalne skutki GPT-4 i jego następcze modele. Zespół opracowuje także oceny niebezpiecznych możliwości, które mogą pojawić się w przyszłych systemach sztucznej inteligencji. Kontynuując badanie potencjalnego potencjału społecznego i skutki ekonomiczne of GPT-4 i inne systemy AI, OpenAI w odpowiednim czasie podzielą się swoimi odkryciami i spostrzeżeniami z opinią publiczną.

Czytaj więcej:

tagi:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Cindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.

Więcej artykułów
CindyTan
CindyTan

Cindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.

Hot Stories
Dołącz do naszego newslettera.
Najnowsze wieści

Szał DOGE: analiza niedawnego wzrostu wartości Dogecoina (DOGE).

Branża kryptowalut szybko się rozwija, a monety memowe przygotowują się na znaczny wzrost. Dogecoin (DOGE), ...

Dowiedz się więcej

Ewolucja treści generowanych przez sztuczną inteligencję w Metaverse

Pojawienie się generatywnych treści AI jest jednym z najbardziej fascynujących osiągnięć w środowisku wirtualnym…

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Scroll kończy aktualizację sieci głównej Bernoulli, przewiduje 10-krotny spadek kosztów transakcji
Raport aktualności Technologia
Scroll kończy aktualizację sieci głównej Bernoulli, przewiduje 10-krotny spadek kosztów transakcji
29 kwietnia 2024 r.
OKX Jumpstart wyświetla Runecoin, umożliwia stakowanie BTC w celu zdobycia tokenów RUNE
rynki Raport aktualności Technologia
OKX Jumpstart wyświetla Runecoin, umożliwia stakowanie BTC w celu zdobycia tokenów RUNE
29 kwietnia 2024 r.
Najlepsze oferty tego tygodnia, duże inwestycje w sztuczną inteligencję, IT, Web3i Krypto (22-26.04)
Digest Biznes rynki Technologia
Najlepsze oferty tego tygodnia, duże inwestycje w sztuczną inteligencję, IT, Web3i Krypto (22-26.04)
26 kwietnia 2024 r.
Vitalik Buterin komentuje centralizację PoW, zauważa, że ​​był to etap tymczasowy do czasu PoS
Raport aktualności Technologia
Vitalik Buterin komentuje centralizację PoW, zauważa, że ​​był to etap tymczasowy do czasu PoS
26 kwietnia 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.