Raport aktualności SMW Technologia
31 maja 2023 r.

Demencja AI: wyzwania związane z treściami generowanymi przez modele i ich wpływ na systemy AI

W skrócie

Badacze odkryli zjawisko demencji modelowej, które odnosi się do nieodwracalnych defektów występujących w modelach, gdy zanikają ogony oryginalnego rozkładu treści.

Aby zachować korzyści płynące z modeli szkoleniowych na danych internetowych, należy znaleźć rozwiązania, które złagodzą potencjalną utratę oryginalnej dystrybucji treści.

Szybki postęp w technologii sztucznej inteligencji przyniósł niesamowite osiągnięcia w przetwarzaniu języka naturalnego i generowaniu obrazów. Duże modele językowe (LLM), takie jak GPT-2, GPT-3 (.5) i GPT-4 wykazały niezwykłą wydajność w różnych zadaniach językowych, podczas gdy modele takie jak ChatGPT przedstawiły te możliwości językowe ogółowi społeczeństwa. Jednak w miarę jak LLM stają się coraz bardziej rozpowszechnione i znacząco przyczyniają się do rozwoju języka znalezionego w Internecie, badacze odkryli niepokojący problem znany jako „modelowa demencja".

Demencja AI: wyzwania związane z treściami generowanymi przez modele i ich wpływ na systemy AI
Metaverse Post (mpostio)
Polecamy: OpenAI: Sztuczna inteligencja może potencjalnie wyrządzić wiele szkód ludziom, ale próba zatrzymania postępu nie wchodzi w grę

W niedawnym artykule badacze rzucili światło na zjawisko otępienia modelowego, które odnosi się do nieodwracalnych defektów pojawiających się w modelach, gdy zanikają ogony pierwotnego rozkładu treści. Z badania wynika, że ​​korzystanie z treści generowanych przez model podczas szkoleń może do tego prowadzić pogorszenie funkcji poznawczych w powstałych modelach. Efekt ten zaobserwowano w autoenkoderach wariacyjnych (VAE), modelach mieszaniny Gaussa (GMM) i LLM. Ustalenia podkreślają potrzebę zajęcia się tym problemem, aby zachować korzyści płynące z leczenia modele treningowe na danych uzyskanych na dużą skalę z Internetu.

arxiv.org/pdf/2305.17493.pdf

Naukowcy dostarczają teoretycznego zrozumienia modelowej demencji i demonstrują jej rozpowszechnienie w różnych modele generatywne. Twierdzą, że zjawisko to należy traktować poważnie, aby zapewnić ciągłą skuteczność modeli szkoleniowych na poziomie ekstensywnym dane sieciowe. Ponieważ LLM w coraz większym stopniu przyczyniają się do rozwoju języka i treści dostępnych online, wartość danych jest coraz większa zebrane z autentycznych interakcji międzyludzkich z systemami staje się jeszcze bardziej krytyczny.

Wprowadzenie stable diffusion, technika, która zrewolucjonizowała tworzenie obrazów opisowy tekst, dodatkowo ilustruje wpływ LLM na generowanie treści. Badanie sugeruje jednak, że korzystanie z treści generowanych przez model może spowodować utratę dystrybucji treści końcowych, potencjalnie zmniejszając różnorodność i bogactwo oryginalnych danych.

Podczas gdy wielkoskalowe dane zebrane z sieci dostarczają cennych informacji na temat interakcji człowieka z systemami, obecność treści generowane przez LLM wprowadzają nowe wyzwania. Naukowcy podkreślają potrzebę zajęcia się demencją modelową i znalezienia rozwiązań, które zachowają zalety modeli szkoleniowych na danych internetowych, jednocześnie łagodząc potencjalną utratę dystrybucji oryginalnej treści.

W miarę rozwoju dziedziny sztucznej inteligencji niezwykle ważne jest, aby badacze, programiści i decydenci byli świadomi ograniczeń i wyzwań związanych z modelami szkoleniowymi na podstawie treści generowanych przez modele. Rozumiejąc i rozwiązując problemy, takie jak modelowa demencja, możemy zapewnić odpowiedzialne i efektywne wykorzystanie technologii sztucznej inteligencji w przyszłości.

Przeczytaj więcej o sztucznej inteligencji:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Apetyt instytucjonalny na ETFy Bitcoin rośnie w obliczu zmienności

Ujawnienia zawarte w zgłoszeniach 13F ujawniają, że znaczący inwestorzy instytucjonalni parają się funduszami ETF Bitcoin, co podkreśla rosnącą akceptację…

Dowiedz się więcej

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Przejście Donalda Trumpa na kryptowaluty: od przeciwnika do adwokata i co to oznacza dla amerykańskiego rynku kryptowalut
Biznes rynki Historie i recenzje Technologia
Przejście Donalda Trumpa na kryptowaluty: od przeciwnika do adwokata i co to oznacza dla amerykańskiego rynku kryptowalut
10 maja 2024 r.
Warstwa 3 uruchomi token L3 tego lata, przydzielając 51% całkowitej podaży społeczności
rynki Raport aktualności Technologia
Warstwa 3 uruchomi token L3 tego lata, przydzielając 51% całkowitej podaży społeczności
10 maja 2024 r.
Ostatnie ostrzeżenie Edwarda Snowdena dla twórców Bitcoina: „Uczyń prywatność priorytetem na poziomie protokołu, w przeciwnym razie ryzykuj jej utratę
rynki Bezpieczeństwo Wiki Tworzenie Historie i recenzje Technologia
Ostatnie ostrzeżenie Edwarda Snowdena dla twórców Bitcoina: „Uczyń prywatność priorytetem na poziomie protokołu, w przeciwnym razie ryzykuj jej utratę
10 maja 2024 r.
Oparta na optymizmie sieć Ethereum Layer 2 Network Mint uruchomi swoją sieć główną 15 maja
Raport aktualności Technologia
Oparta na optymizmie sieć Ethereum Layer 2 Network Mint uruchomi swoją sieć główną 15 maja
10 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.