Raport aktualności Technologia
16 marca 2023 r.

OpenAI Ogłasza evals, platformę oprogramowania typu open source do oceny modeli sztucznej inteligencji

W skrócie

OpenAI ma nadzieję pozyskać punkty odniesienia do oceny modeli sztucznej inteligencji, takich jak GPT-4.

Firma Stripe zajmująca się przetwarzaniem płatności wykorzystała już narzędzie Evals do pomiaru dokładności swoich płatności GPT-zasilane narzędzie do tworzenia dokumentacji.

OpenAI będzie udzielać GPT-4 dostęp przez ograniczony czas dla osób, które wnoszą wkład w ewaluacje wysokiej jakości.

OpenAI Ogłasza evals, platformę oprogramowania typu open source do oceny modeli sztucznej inteligencji

Wraz z ogłoszeniem GPT-4, OpenAI ogłosił platformę oprogramowania open source OpenAI Ewaluacje. To narzędzie służy do tworzenia i uruchamiania testów porównawczych oceniających wydajność modeli takich jak GPT-4. Z Evalsem, OpenAI ma nadzieję pozyskać punkty odniesienia do testowania modeli sztucznej inteligencji. 

„Używamy Evali do kierowania rozwojem naszych modeli (zarówno do identyfikowania niedociągnięć, jak i zapobiegania regresji), a nasi użytkownicy mogą go stosować do śledzenia wydajności w różnych wersjach modeli (które będą teraz regularnie pojawiać się) i rozwijania integracji produktów”, wyjaśnia firma w A blogu.

Stripe, popularna firma zajmująca się przetwarzaniem płatności, wykorzystała już narzędzie Evals do uzupełnienia swoich ocen dokonywanych przez ludzi i pomiaru ich dokładności GPT-zasilane narzędzie do tworzenia dokumentacji.

Deweloperzy mogą używać Evali do tworzenia i przeprowadzania ocen, które:

  • Użyj zestawów danych do generowania podpowiedzi,
  • Zmierz jakość realizacji zapewnianych przez firmę OpenAI model,
  • Porównuj wydajność różnych zestawów danych i modeli.

Dzięki kodowi typu open source programiści mogą również pisać i dodawać pliki niestandardowa ocena jak również kilka szablonów które mogą uwzględniać różne punkty odniesienia. Firma udostępniła szablony, które okazały się najbardziej przydatne wewnętrznie, w tym szablon „ocen ocenianych na podstawie modelu”, który GPT-4 może wykorzystać do sprawdzenia własnej pracy. Jako przykład do naśladowania firma stworzyła łamigłówkę logiczną zawierającą dziesięć podpowiedzi gdzie GPT-4 zawiedzie.

Evalls jest również kompatybilny z wdrażaniem istniejących testów porównawczych, w tym kilku notebooków wdrażających akademickie testy porównawcze i kilka odmian integracji małych podzbiorów CoQA.

Choć programiści nie będą otrzymywać wynagrodzenia za wnoszenie ocen, OpenAI będzie udzielać GPT-4 dostęp przez ograniczony czas osobom, które wnoszą „ewaluacje wysokiej jakości”. 

Ogłoszenie Evals następuje później OpenAI powiedział niedawno przestałby wykorzystywać dane przesłane przez klientów za pośrednictwem swojego interfejsu API do trenowania lub ulepszania swoich modeli, chyba że klienci zdecydują się na to. -artystyczne modele”. DynaBench Platforma.

Czytaj więcej:

tagi:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Cindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.

Więcej artykułów
CindyTan
CindyTan

Cindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.

Hot Stories

Rozwiązanie handlu stabilną monetą BRICS Nations Eye

by Wiktoria Palchik
01 maja 2024 r.
Dołącz do naszego newslettera.
Najnowsze wieści

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej

Założyciele portfela Samourai oskarżeni o ułatwianie transakcji o wartości 2 miliardów dolarów w Darknet

Zaniepokojenie założycieli Samourai Wallet stanowi wyraźną porażkę dla branży, podkreślając utrzymujące się...

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Ankr współpracuje z platformą AI Blockchain Talus Network, aby odblokować płynność Bitcoinów dla sztucznej inteligencji
Biznes Raport aktualności Technologia
Ankr współpracuje z platformą AI Blockchain Talus Network, aby odblokować płynność Bitcoinów dla sztucznej inteligencji
1 maja 2024 r.
Binance Labs wspiera Movement Labs, aby ułatwić integrację Facebooka Move w ramach łańcuchów bloków
Biznes Raport aktualności Technologia
Binance Labs wspiera Movement Labs, aby ułatwić integrację Facebooka Move w ramach łańcuchów bloków
1 maja 2024 r.
Rozwiązanie handlu stabilną monetą BRICS Nations Eye
Biznes rynki Historie i recenzje Technologia
Rozwiązanie handlu stabilną monetą BRICS Nations Eye
1 maja 2024 r.
Bitcoin L2 Network BOB integruje się z LayerZero w celu zwiększenia funkcjonalności
Biznes Raport aktualności Technologia
Bitcoin L2 Network BOB integruje się z LayerZero w celu zwiększenia funkcjonalności
1 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.