Listopad 06, 2023

Uogólnianie od łatwych do trudnych

Opublikowano: 06 listopada 2023 o 3:45 Zaktualizowano: 06 listopada 2023 o 3:45

Co to jest generalizacja od łatwej do trudnej?

Uogólnianie od łatwych do trudnych odnosi się do procesu oceny wydajności algorytmów w przypadku zadań o różnym stopniu złożoności, od prostych i łatwych do wykonania po bardziej wymagające. W kontekście rozwoju sztucznej inteligencji takie podejście pomaga zapewnić, że modele nie tylko skutecznie radzą sobie z prostymi zadaniami, ale także są w stanie skalować swoje zachowanie w obliczu bardziej złożonych wyzwań.

Zrozumienie uogólnień od łatwych do trudnych

Rozważmy na przykład scenariusz, w którym testowany jest model w celu zidentyfikowania błędów w małym fragmencie kodu.

Na przykład w uczeniu maszynowym uogólnienie od łatwego do trudnego może obejmować trenowanie modelu na zestawie danych, które zaczyna się od prostych lub dobrze oddzielonych przykładów i stopniowo wprowadza bardziej złożone lub nakładające się przykłady. Podejście to ma na celu zwiększenie zdolności modelu do radzenia sobie z trudnymi scenariuszami i poprawę jego ogólnej wydajności na niewidocznych danych.

W uczeniu się percepcyjnym uogólnianie od łatwych do trudnych może obejmować szkolenie osób w zakresie zadań percepcyjnych, które zaczynają się od łatwo rozpoznawalnych bodźców i stopniowo wprowadzają trudniejsze lub niejednoznaczne bodźce. Proces ten pomaga jednostkom rozwijać lepsze zdolności rozróżniania i uogólniać swoją naukę na szerszy zakres bodźców.

Ogólnie rzecz biorąc, generalizacja od łatwej do trudnej to strategia stosowana w celu usprawnienia uczenia się, poprawy wydajności i promowania lepszych możliwości generalizacji poprzez stopniowe zwiększanie trudności lub złożoności przykładów lub zadań.

Najnowsze wiadomości na temat Uogólnianie od łatwych do trudnych

Naukowcy z University College London przedstawiłem zbiór danych Spawrious, klasyfikacja obrazów Benchmark pakietu, aby zająć się fałszywymi korelacjami w modelach sztucznej inteligencji. Zbiór danych, składający się ze 152,000 2 obrazów wysokiej jakości, zawiera fałszywe korelacje jeden do jednego i wiele do wielu. Zespół odkrył, że zbiór danych wykazał się niesamowitą wydajnością, ujawniając słabości obecnych modeli wynikające z ich oparcia na fikcyjnym tle. Zbiór danych uwypuklił także potrzebę uchwycenia skomplikowanych relacji i współzależności w fałszywych korelacjach MXNUMXM.
Nowa sztuczna inteligencja, znana jako różnicowy komputer neuronowy (DNC), wykorzystuje zewnętrzne urządzenie pamięci o dużej przepustowości do przechowywania wcześniej poznanych modeli i generowania nowych sieci neuronowych na podstawie zarchiwizowanych modeli. Ta nowa forma uogólnionego uczenia się może utorować drogę do ery sztucznej inteligencji, która nadwyręży ludzką wyobraźnię.
Stwierdzono to w niedawnym artykule MIT GPT-4, model językowy (LLM), który uzyskał 100% punktów w programie nauczania MIT, zawierał niekompletne pytania i stronnicze metody oceny, co skutkowało znacznie niższą dokładnością. W artykule Allen Institute for AI „Faith and Fate: Limits of Transformers on Compositionality” omówiono ograniczenia modeli opartych na transformatorach, koncentrując się na problemach kompozycyjnych wymagających wieloetapowego rozumowania. Badanie wykazało, że modele transformatorów wykazują spadek wydajności wraz ze wzrostem złożoności zadania, a dostrajanie na podstawie danych specyficznych dla zadania poprawia wydajność w wyszkolonej domenie, ale nie zapewnia uogólniać na niewidziane przykłady. Autorzy sugerują, że transformatory należy wymienić ze względu na ich ograniczenia w wykonywaniu złożonego rozumowania kompozycyjnego, poleganiu na wzorcach, zapamiętywaniu i jednoetapowych operacjach.

Zaproponowano podpowiadanie od najmniejszego do największego w celu rozwiązania uogólnienia na długość lub, bardziej ogólnie, uogólnienia kompozycji i uogólnienia od łatwego do trudnego. W przypadku prostych problemów, takich jak parzystość, podpowiadanie od najmniejszej do większości może niemal idealnie rozwiązać ten problem.https://t.co/hq7gA1ulay https://t.co/vijJ3kt1Ob pic.twitter.com/Uw9mKkFK7l
— Denny Zhou (@denny_zhou) 15 lipca 2022 r.

Używamy entropii jądra osadzania, aby osiągnąć SOTA w szacowaniu niepewności generowania języka naturalnego (https://t.co/VwfwwyWBJV). Myślę, że osoby osadzające odegrają kluczową rolę w przyszłych postępach w ocenie niepewności i zachowań uogólniających modele generatywne.
— Sebastian G. Gruber (@SebGGruber) 30 października 2023 r.

Odkryliśmy, że asystent AI dokładnie dopasowuje swoje zachowanie do standardowych zasad z literatury ekonomicznej (np. samolubnych, altruistycznych). Jednak wyuczonym zasadom asystenta brakuje solidności i wykazują ograniczone uogólnienia w środowisku poza dystrybucją. pic.twitter.com/rK8junH67D
— Philipp Fränken (@jphilippfranken) 30 października 2023 r.

Najczęściej zadawane pytania

Uogólnianie od łatwego do trudnego odnosi się do procesu uczenia lub uczenia się modeli, algorytmów lub systemów poprzez stopniowe zwiększanie trudności lub złożoności przykładów lub zadań. Ideą uogólnień od łatwych do trudnych jest rozpoczęcie od prostszych lub łatwiejszych przykładów i stopniowe wprowadzanie trudniejszych lub trudniejszych przykładów, aby poprawić zdolność modelu do uogólniania i dobrego działania w szerokim zakresie danych wejściowych.

«Powrót do indeksu glosariuszy

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.

Więcej artykułów

Damir Jałałow