Opinia Technologia
27 grudnia 2023 r.

Dyrektor generalny firmy Gramener, Anand S, ostrzega przed ryzykiem związanym ze ślepym zaufaniem firmom LLM i opowiada się za modelową umiejętnością czytania i pisania

W skrócie

W rozmowie z Metaverse Post – Anand S, dyrektor generalny Gramener podkreślił potencjalne pułapki nadmiernego polegania na LLM.

Dyrektor generalny firmy Gramener, Anand S, podkreśla ryzyko ślepego ufania firmom LLM i opowiada się za modelem umiejętności czytania i pisania

Dzięki setkom narzędzi AI i ML nasycających rynek potencjał innowacyjny jest nieograniczony. Powstaje wiele start-upów, które chcą stawić czoła wyzwaniom branżowym, a ciągły napływ ulepszonych modeli wielkojęzykowych co tydzień wzmacnia transformacyjną moc generatywna sztuczna inteligencja. Ta konwergencja technologiczna zmienia branże oferując nieograniczone możliwości.

Jednakże uwolnienie i powszechne użycie potężnych modeli językowych, takich jak Bliźnięta, rodzi ważne rozważania etyczne i praktyczne i skłania nas do rozważenia pytania: Czy jako ludzie możemy ślepo ufać takim modelom?

W rozmowie z Metaverse Post — Anand S, dyrektor generalny amerykańskiej firmy B2B SaaS Gramenera podkreślił potencjalne pułapki związane z nadmiernym poleganiem na LLM, takich jak ChatGPT, ostrzegając, że tendencja ta prawdopodobnie się utrzyma w przypadku nowych modeli, takich jak Gemini.

„Nawet mając odpowiednie dane szkoleniowe, człowiek może popełnić błąd, wychodząc poza swój obszar specjalizacji. Czy zatem duży model językowy dokonuje ekstrapolacji, czy też przypomina sobie, czego się nauczył? Różnica jest ogromna i warto ją przetestować. Budujemy pewność siebie dzięki intuicji i powtarzającym się interakcjom z ludźmi” – powiedział Anand. „Wiemy, że musimy zbadać obcą osobę i prawdopodobnie w ten sposób powinniśmy również wchodzić w interakcje z dużymi modelami językowymi”.

Na przykład w sprawie Varghese przeciwko Southern Airlines spółka z ograniczoną odpowiedzialnością prawnik powołał się na fikcję ChatGPT-generowało sprawy, prowadzące do ukarania prawnika przez sędziego, podkreślając ryzyko bezkrytycznego użycia. Anand podkreśla potrzebę ostrożności i kontroli podczas korzystania z takich modeli językowych.

Co więcej, dziedzina ta wymaga solidnego mechanizmu informacji zwrotnej. ChatGPT zachęca użytkowników do wyrażania opinii za pomocą prostego przycisku „kciuk w górę/kciuk w dół” w połączeniu z wprowadzaniem tekstu. Takie podejście pozwala uzyskać cenne informacje na temat tego, co działa dobrze, a co nie. Ten system informacji zwrotnej prawdopodobnie stanie się bardziej powszechny wraz z użyciem duże modele językowe, pomagając poprawić ich wydajność.

„Monitorowanie każdego pojedynczego wyniku LLM nie jest zbyt ekonomiczne, ale możliwość wykrycia potencjalnych błędów to potężna dźwignia” – powiedział Anand Metaverse Post.

„Co ciekawe, same duże modele językowe całkiem dobrze radzą sobie z oceną innych dużych modeli językowych. Zamiast więc wykorzystywać człowieka wyłącznie do monitorowania wyników, możemy zastosować kombinację LLM i ludzi, przy czym LLM ostatecznie przejmą większość roli człowieka w miarę ewolucji” – dodał.

Model umiejętności czytania i pisania to droga naprzód

W sferze LLM wyłania się kluczowa zasada – im więcej interakcji, tym głębsze zrozumienie. Ta prosta koncepcja podkreśla związek między zaangażowaniem użytkowników a zrozumieniem możliwości LLM, ostatecznie prowadząc do zwiększonego wykorzystania.

„Chodzi także o zrozumienie, do czego konkretny LLM jest dobry. Na przykład  nie używałbym DALL-E do generowania logo, ponieważ nie generuje on zbyt dobrze tekstu. Ale świetnie sobie radzi z generowaniem pomysłów na logo i projektów logo. To jest przykład wzorowej umiejętności czytania i pisania, który powstał w wyniku wielokrotnego użycia i dlatego daje mi satysfakcję defiodkryłem obszary zaufania, w ramach których mogę skuteczniej wykorzystywać model” – powiedział Anand.

W dążeniu do zrównoważonej integracji modeli językowych, takich jak Gemini w nasz krajobraz technologiczny, Anand sugeruje kilka strategii. Po pierwsze, opowiada się za codziennymi interakcjami z dużymi modelami językowymi, co sprzyja kształtowaniu nawyku, który buduje się z czasem. Podobnie kluczowe znaczenie ma zapewnienie powszechnego dostępu do tych narzędzi, co wiąże się z wezwaniem do większego zachęcania do korzystania z nich na użytek własny. Anand zauważa istniejącą tendencję do blokowania organizacji ChatGPT na laptopach służbowych, podkreślając potrzebę wspierającej komunikacji.

Proponuje wdrożenie mechanizmów organizacyjnych zapewniających dostęp i zachęcających do eksperymentowania z modelami językowymi (LLM) w środowisku.

„Ostatecznie dopiero wtedy, gdy ludzie się zaznajomią, zrozumieją, czemu mogą zaufać, kiedy tego używać i jak tego używać. Zwiększone wykorzystanie i zachęcanie do zwiększonego użytkowania to najważniejsza strategia i inicjatywy edukacyjne, które każdy może zastosować” – powiedział Anand Metaverse Post.

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Kumar jest doświadczonym dziennikarzem technicznym ze specjalizacją w dynamicznych skrzyżowaniach AI/ML, technologii marketingowej i nowych dziedzin, takich jak kryptowaluty, blockchain i NFTS. Dzięki ponad 3-letniemu doświadczeniu w branży Kumar zdobył udokumentowane doświadczenie w tworzeniu fascynujących narracji, przeprowadzaniu wnikliwych wywiadów i dostarczaniu kompleksowych spostrzeżeń. Doświadczenie Kumara polega na tworzeniu treści o dużym wpływie, w tym artykułów, raportów i publikacji badawczych dla czołowych platform branżowych. Dzięki unikalnemu zestawowi umiejętności, który łączy wiedzę techniczną i opowiadanie historii, Kumar przoduje w przekazywaniu złożonych koncepcji technologicznych różnym odbiorcom w jasny i wciągający sposób.

Więcej artykułów
Kumara Gandharva
Kumara Gandharva

Kumar jest doświadczonym dziennikarzem technicznym ze specjalizacją w dynamicznych skrzyżowaniach AI/ML, technologii marketingowej i nowych dziedzin, takich jak kryptowaluty, blockchain i NFTS. Dzięki ponad 3-letniemu doświadczeniu w branży Kumar zdobył udokumentowane doświadczenie w tworzeniu fascynujących narracji, przeprowadzaniu wnikliwych wywiadów i dostarczaniu kompleksowych spostrzeżeń. Doświadczenie Kumara polega na tworzeniu treści o dużym wpływie, w tym artykułów, raportów i publikacji badawczych dla czołowych platform branżowych. Dzięki unikalnemu zestawowi umiejętności, który łączy wiedzę techniczną i opowiadanie historii, Kumar przoduje w przekazywaniu złożonych koncepcji technologicznych różnym odbiorcom w jasny i wciągający sposób.

Hot Stories
Dołącz do naszego newslettera.
Najnowsze wieści

Od Ripple do Big Green DAO: jak projekty kryptowalutowe przyczyniają się do działalności charytatywnej

Przyjrzyjmy się inicjatywom wykorzystującym potencjał walut cyfrowych na cele charytatywne.

Dowiedz się więcej

AlphaFold 3, Med-Gemini i inne: sposób, w jaki sztuczna inteligencja zmieni opiekę zdrowotną w 2024 r.

Sztuczna inteligencja objawia się na różne sposoby w opiece zdrowotnej, od odkrywania nowych korelacji genetycznych po wzmacnianie zrobotyzowanych systemów chirurgicznych…

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Token WLD firmy Worldcoin musi stawić czoła agresywnej presji sprzedaży dzięki większej liczbie odblokowań w nadchodzących miesiącach, ostrzega DeFi2 Bybit Trader
rynki Raport aktualności Technologia
Token WLD firmy Worldcoin musi stawić czoła agresywnej presji sprzedaży dzięki większej liczbie odblokowań w nadchodzących miesiącach, ostrzega DeFi2 Bybit Trader
14 maja 2024 r.
Crypto Exchange Coinbase doświadcza awarii systemu, fundusze użytkowników Firma Secure Wile bada problem
rynki Raport aktualności Technologia
Crypto Exchange Coinbase doświadcza awarii systemu, fundusze użytkowników Firma Secure Wile bada problem
14 maja 2024 r.
Od Ripple do Big Green DAO: jak projekty kryptowalutowe przyczyniają się do działalności charytatywnej
Analiza krypto Wiki Biznes Edukacja Styl życia rynki Tworzenie Technologia
Od Ripple do Big Green DAO: jak projekty kryptowalutowe przyczyniają się do działalności charytatywnej
13 maja 2024 r.
AlphaFold 3, Med-Gemini i inne: sposób, w jaki sztuczna inteligencja zmieni opiekę zdrowotną w 2024 r.
AI Wiki Analiza Digest Opinia Biznes rynki Raport aktualności Tworzenie Historie i recenzje Technologia
AlphaFold 3, Med-Gemini i inne: sposób, w jaki sztuczna inteligencja zmieni opiekę zdrowotną w 2024 r.
13 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.