02 maja 2023 r.

MLCopilot: Wykorzystaj moc LLM, aby pomóc programistom w ich zadaniach ML

Opublikowano: 02 maja 2023 o 8:20 Zaktualizowano: 02 maja 2023 o 9:03

W skrócie

MLCopilot to nowy sposób wykorzystania modeli uczenia maszynowego do rozwiązywania trudnych zadań, automatyzujący proces doboru parametrów i architektur.

Działa na dwóch poziomach, offline i online, wydobywając wiedzę z setek eksperymentów uczenia maszynowego i stosując specjalny promtp do wygenerowania decyzji.

Daje wymierne korzyści w postaci szybkości realizacji i redukcji kosztów pracy.

Do rozwiązywania różnych zadań wykorzystano modele uczenia maszynowego; jednakże ich szkolenie było w większości procesem ręcznym. Wyzwaniem był wybór odpowiednich parametrów i architektur w celu uzyskania najlepszych wyników, ponieważ proces wymaga znacznej wiedzy i doświadczenia. Wraz z pojawieniem się zaawansowanych technologii i dużych modeli językowych (LLM), takich jak GPT-3.5, proces ten można teraz zautomatyzować. Otwiera to nowy sposób wykorzystania mocy modeli uczenia maszynowego w rozwiązywaniu trudnych zadań: MLCopilot.

MLCopilot: Wykorzystaj moc LLM, aby pomóc programistom w ich zadaniach ML — @Midjourney / roypolloi#4804

Czytaj więcej: 8 rzeczy, które powinieneś wiedzieć o dużych modelach językowych

MLCopilot działa na dwóch poziomach. Po stronie offline jednostki, takie jak intencja i architektura modelu, są ujednolicone, a wiedza pochodzi z setek eksperymentów uczenia maszynowego. Dane te tworzą bazę wiedzy, na której działa MLCopilot. Po stronie online MLCopilot stosuje specjalny monit, w tym odpowiednie przykłady z poprzednich eksperymentów, aby wygenerować decyzję o najlepszym podejściu do rozwiązania określonego zadania. Stwierdzono, że takie decyzje są dokładniejsze niż decyzje podejmowane przez ludzi ręcznie wybierających i stosujących sprawdzone algorytmy.

Konkretny monit jest wprowadzany dalej online GPT-3.5 — Konkretny monit jest kierowany dalej w trybie online GPT-35 (nawet nie ChatGPT, a tym bardziej GPT-4), a odpowiednie próbki z podobnych zleceń zostaną do niego automatycznie umieszczone. Następnie asystent podejmuje decyzję, jak i co zrobić. Postępując zgodnie ze wskazówkami, użytkownicy utworzyli wyszkolone modele o wyższej jakości niż zaproponowano wcześniej i specjalnie dostosowanych metodach (na przykład inteligentne wyliczanie parametrów zamiast losowego).

Oprócz podejmowania trafniejszych decyzji, MLCopilot zapewnia wymierne korzyści, takie jak szybkość realizacji i obniżenie kosztów pracy. Z drugiej strony należy pamiętać o pewnych wadach, na przykład o potrzebie posiadania danych o wysokiej dokładności w celu utworzenia bazy wiedzy oraz konieczności aktualizowania modelu o nowe eksperymenty.

Co ciekawe, szacunki eksperymentów z historii zostały przetłumaczone na względne bez liczb: „bardzo niskie”, „niskie”, „średnie”, „wysokie” i „bardzo wysokie”. Na tej podstawie model może określić, co działa, a co nie.

Model ma dostęp do setek tysięcy takich faktów za pośrednictwem pamięci zewnętrznej (Retriever) i proponuje eksperymentowanie z nowymi danymi i zadaniami w oparciu o te uogólnione wnioski. — Model ma dostęp do setek tysięcy takich faktów poprzez pamięć zewnętrzną (Retriever); proponuje eksperymentowanie z nowymi danymi i zadaniami w oparciu o te uogólnione wnioski.

Ogólnie rzecz biorąc, MLCopilot może poprawić sposób rozwiązywania zadań związanych z uczeniem maszynowym. Automatycznie dobierając odpowiednie parametry i architekturę, pozwala nam wykorzystać moc modeli uczenia maszynowego w celu zaoszczędzenia czasu i kosztów przy jednoczesnym zwiększeniu dokładności. Ostatecznie korzyści te przyniosą korzyści wszystkim: od indywidualnych badaczy po duże korporacje czy organizacje państwowe. To ogromny krok naprzód w erze sztucznej inteligencji, a po nim z pewnością nastąpią bardziej ekscytujące zmiany.

Artykuł kończy się przerażającą notatką dla niektórych i motywującą notatką dla innych: „Mamy nadzieję, że projekt naszej metody może służyć jako inspiracja dla szerszej społeczności i przyczynić się do rozwoju LLM w kierunku celu, jakim jest osiągnięcie sztucznej inteligencji ogólnej ( AGI).”

W marcu 14, OpenAI ogłosił uruchomienie GPT-4, ulepszoną wersję modelu sztucznej inteligencji GPT-3.5. Osiągnął próg wysokiej klasy, osiągając lepsze wyniki GPT-3.5 na różnych poziomach odniesienia w badaniach.

Przeczytaj więcej o sztucznej inteligencji:

tagi:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.

Więcej artykułów

Damir Jałałow