GPT-4 Dziedziczy „halucynacyjne” fakty i błędy w rozumowaniu z wcześniejszych lat GPT modele
W skrócie
OpenAI mówią GPT-4 ma podobne ograniczenia jak poprzednio GPT modele.
GPT-4 nadal ma halucynacje na faktach i popełnia błędy w rozumowaniu.
Jednakże, GPT-4 osiąga wyniki o 40% wyższe niż OpenAInajnowszy GPT-3.5 na wewnętrznych, kontradyktoryjnych ocenach faktów.
OpenAI ostrzegł użytkowników, że jego najnowszy model językowy, GPT-4, nadal nie jest w pełni wiarygodny i może „halucynować” fakty i popełniać błędy w rozumowaniu. Firma zachęca użytkowników do zachowania ostrożności podczas korzystania z wyników modelu językowego, szczególnie w „kontekstach wymagających dużej stawki”.
Jednak dobra wiadomość jest taka GPT-4 znacznie zmniejsza halucynacje w stosunku do poprzednich modeli. OpenAI twierdzi że GPT-4 osiąga wynik o 40% wyższy od najnowszego GPT-3.5 na wewnętrznych, kontradyktoryjnych ocenach faktów.
„Poczyniliśmy postępy w zakresie zewnętrznych testów porównawczych, takich jak TruthfulQA, które testują zdolność modelu do oddzielenia faktów od zbioru błędnych stwierdzeń wyselekcjonowanych przez przeciwników. Te pytania są połączone z niepoprawnymi pod względem faktycznym odpowiedziami, które są statystycznie atrakcyjne ” OpenAI napisał w blogu.
Pomimo tego ulepszenia model nadal nie ma wiedzy o wydarzeniach, które miały miejsce po wrześniu 2021 r., a czasami popełnia proste błędy rozumowania, tak jak robią to wcześniejsze modele. Ponadto może być zbyt łatwowierny w przyjmowaniu oczywistych fałszywych oświadczeń od użytkowników i zawodzić w trudnych problemach, takich jak wprowadzanie luk w zabezpieczeniach do swojego kodu. Nie sprawdza również faktów, które podaje.
Podobnie jak jego poprzednicy, GPT-4 może generować szkodliwe porady, błędny kod lub niedokładne informacje. Jednak dodatkowe możliwości modelu prowadzą do nowych powierzchni ryzyka, które należy zrozumieć. Aby ocenić zakres tych zagrożeń, ponad 50 ekspertów z różnych dziedzin, w tym zagrożeń związanych z dostosowaniem sztucznej inteligencji, cyberbezpieczeństwa, ryzyka biologicznego, zaufania i bezpieczeństwa oraz bezpieczeństwa międzynarodowego, w celu kontradyktoryjnego przetestowania modelu. Ich opinie i dane wykorzystano następnie do ulepszenia modelu, na przykład do zebrania dodatkowych danych w celu jego ulepszenia GPT-4zdolność do odrzucania próśb o syntezę niebezpiecznych substancji chemicznych.
Jeden z głównych sposobów OpenAI ogranicza szkodliwe produkty poprzez włączenie dodatkowego sygnału nagrody za bezpieczeństwo podczas szkolenia RLHF (wzmacnianie uczenia się na podstawie informacji zwrotnej od ludzi). Sygnał uczy model odrzucania żądań dotyczących szkodliwych treści, np defizgodnie z wytycznymi użytkowania modelu. Nagrodę zapewnia A GPT-4 klasyfikator zerowego strzału, który ocenia granice bezpieczeństwa i styl ukończenia w przypadku podpowiedzi związanych z bezpieczeństwem.
OpenAI stwierdziło również, że zmniejszyło to skłonność modelki do odpowiadania na żądania dotyczące niedozwolonych treści o 82% w porównaniu do GPT-3.5, i GPT-4 29% częściej odpowiada na wrażliwe prośby, takie jak porada lekarska i samookaleczenie, zgodnie z polityką firmy.
Kompletujemy wszystkie dokumenty (wymagana jest kopia paszportu i XNUMX zdjęcia) potrzebne do OpenAIinterwencje zwiększyły trudność wywołania złego zachowania GPT-4, jest to nadal możliwe i nadal istnieją jailbreaki, które mogą generować treści naruszające wytyczne dotyczące użytkowania.
„W miarę jak systemy sztucznej inteligencji stają się coraz bardziej rozpowszechnione, osiągnięcie wysokiego stopnia niezawodności w tych interwencjach będzie miało coraz większe znaczenie. Na razie konieczne jest uzupełnienie tych ograniczeń o techniki bezpieczeństwa na czas wdrożenia, takie jak monitorowanie pod kątem nadużyć” — dodała firma.
OpenAI współpracuje z badaczami zewnętrznymi, aby lepiej zrozumieć i ocenić potencjalne skutki GPT-4 i jego następcze modele. Zespół opracowuje także oceny niebezpiecznych możliwości, które mogą pojawić się w przyszłych systemach sztucznej inteligencji. Kontynuując badanie potencjalnego potencjału społecznego i skutki ekonomiczne of GPT-4 i inne systemy AI, OpenAI w odpowiednim czasie podzielą się swoimi odkryciami i spostrzeżeniami z opinią publiczną.
Czytaj więcej:
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Cindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.
Więcej artykułówCindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.