Wywiad SMW Technologia
23 maja 2023 r.

Założyciel i dyrektor generalny Optic Andrey Doronichev omawia wpływ sztucznej inteligencji na autentyczność treści i przyszłość mediów cyfrowych

Dzięki trwającej całe życie pasji do łączenia twórców treści z ich odbiorcami, kariera Andreya Doronicheva była poświęcona odkrywaniu nowych granic. Od pierwszych dni pracy u dostawcy usług internetowych do kluczowej roli w YouTube, a teraz jako założyciel i dyrektor generalny Optic do wykrywania oszustw związanych z treściami, podróż Andreya przebiegała w duchu innowacji i przedsiębiorczości.

Przygoda Doronicheva z technologią rozpoczęła się w czasach rodzącej się sieci. Będąc świadkiem transformacyjnej mocy tej nowo odkrytej łączności, został urzeczony potencjałem internetu w wypełnianiu luki między twórcami a konsumentami. Ta motywacja doprowadziła go do założenia mobilnego startupu zajmującego się dystrybucją gier przed pojawieniem się iPhone'a, kładąc podwaliny pod jego przyszłe przedsięwzięcia.

Dostrzegając rosnące znaczenie platform mobilnych, Doronichev dołączył do YouTube, gdzie przewodził rozwojowi zespołu ds. urządzeń mobilnych. Pod jego kierownictwem YouTube's aplikacja mobilna zgromadziła ponad miliard użytkowników, co stanowi ponad 50% całkowitego ruchu na platformie. Dzięki temu sukcesowi Andrey był świadkiem ewolucji konsumpcji mediów, gdy YouTube zmienił się z witryny internetowej w dominującą aplikację w krajobrazie cyfrowym.

Później uwaga Doronicheva zwróciła się ku wyłaniającym się granicom mediów immersyjnych i metaverse. Jako członek-założyciel zespołu Google VR odegrał ważną rolę w rozwoju Google Cardboard. Ponieważ jednak dystrybucja VR okazała się wyzwaniem, Andrey zauważył powszechne przyjęcie doświadczeń podobnych do metaverse w postaci gier, platform społecznościowych i ekosystemów tworzenia treści. Zdeterminowany, aby te interaktywne doświadczenia 3D były bardziej dostępne, rozpoczął swój ostatni projekt w Google: Stadia — urządzenie do gier w chmurze, którego celem jest natychmiastowe udostępnianie gier.

Jako założyciel i dyrektor generalny Optic, Doronichev jest teraz zaangażowany w budowanie rozwiązań skoncentrowanych na autentyczności i bezpieczeństwie treści. W tym wywiadzie Doronichev i Metaverse Post współzałożyciel Siergiej Miedwiediew rozpakowuje technologię stojącą za Optic i jego systemem rozumienia treści dla blockchain.

Chcę powiedzieć, że kocham Stadia. Kiedy wypróbowałem ten produkt, kiedy istniał, był naprawdę fajny. Podobał mi się UI/UX, zwłaszcza to doświadczenie, kiedy można było z łatwością korzystać z kontrolera i pasuje to do wszystkich faktów w grze. Jest zsynchronizowany. Moim zdaniem było to najlepiej zwirtualizowane oprogramowanie do gier.

Poszło w to dużo pracy. Dziękuję.

Czy mógłbyś siebie opisać? Czym ogólnie się interesujesz i czym się pasjonujesz?

Cóż, jestem technologiem i przedsiębiorcą. Spędziłem większość życia budując rzeczy, które mnie ekscytują, a większość z nich dotyczy technologii. W szczególności zawsze pasjonowało mnie łączenie ludzi, którzy tworzą media i nowe formy mediów, z ludźmi, którzy korzystają z tych mediów. 

Byłem jednym z członków-założycieli zespołu Google VR pracującego nad produktem Google Cardboard, który prawdopodobnie pamiętasz. Przekształciliśmy to w zespół i całą inicjatywę VR z wieloma aplikacjami, oprogramowaniem i sprzętem, które Google uruchomiło w tym obszarze. Później stało się całkiem jasne, że dystrybucja immersyjnych doświadczeń VR jest naprawdę trudna — potrzebny jest dodatkowy sprzęt, aby stworzyć interaktywne 3D i immersyjne. W tym samym czasie miliony ludzi korzystało już z Metaverse; nazywamy to po prostu grami. Są tam doświadczenia społeczne i ekonomie; istnieją platformy kont twórców treści, takie jak Roblox, iz jakiegoś powodu gry nazywamy je grami. To po prostu niewłaściwa nazwa dla tych nowych światów społecznych. Niektóre z nich to coś więcej niż gry. 

Stadia miała na celu uczynienie tych interaktywnych doświadczeń 3D bardziej dostępnymi niż bardziej wciągającymi. Tak jak YouTube sprawił, że wideo jest o wiele bardziej dostępne niż kupowanie DVD lub pobieranie gigantycznego pliku wideo, po prostu przesyłamy je strumieniowo. Podobnie uważaliśmy, że gry nie były tak dostępne dla większości ludzi, ponieważ wymagały drogiego sprzętu. Potrzebujesz komputera; potrzebujesz konsoli do gier lub czegokolwiek innego. Nawet jeśli je masz, potrzebujesz wielu godzin pobierania, zanim będziesz mógł cieszyć się grą, a Stadia sprawiło, że gra jest natychmiastowa. Taka była idea platformy. Byłem Dyrektorem Produktu odpowiedzialnym za część skierowaną do konsumenta. 

Potem opuściłem Google, aby zająć się własnymi projektami. Od tego czasu wykonuję mnóstwo pracy twórczej, ale także jako twórca w mediach społecznościowych. Ostatnio, podobnie jak w zeszłym roku, wróciłem do mojego podstawowego rzemiosła, jakim jest przedsiębiorczość, i założyłem firmę o nazwie Optic, która jest firmą zajmującą się sztuczną inteligencją, która koncentruje się przede wszystkim na mediach cyfrowych, bezpieczeństwie i autentyczności.

Omówmy Optic, który początkowo był silnikiem rozpoznawania treści dla web3, specjalnie zaprojektowany do identyfikacji NFT kopie, remiksy lub nieodpowiednie treści. W tamtym czasie był to modny temat, ale wydaje się, że teraz bardziej skłaniasz się ku sztucznej inteligencji. Czy jest to punkt zwrotny w Twojej strategii, czy po prostu dywersyfikacja Twojego produktu, aby sprostać wymaganiom użytkowników i zaoferować większą funkcjonalność szerszej grupie użytkowników w porównaniu z koncentracją na NFTs?

Firma Optic powstała wokół tezy, że treści cyfrowe i autentyczność stają się coraz ważniejsze i pozostaje to prawdą do dziś. Jesteśmy zespołem, który będzie rozwiązywał kwestie autentyczności i bezpieczeństwa treści cyfrowych za pomocą sztucznej inteligencji. Konsumujemy wszelkiego rodzaju media cyfrowe. Są wiadomości, są obrazy na portalach społecznościowych, które publikują Twoi znajomi, są filmy na YouTube, jest sztuka cyfrowa i jest określony podzbiór sztuki cyfrowej, który jest NFT. Wszystkie te obszary są treściami cyfrowymi i naszym zdaniem będą coraz bardziej naciskane na inwestowanie w autentyczność i bezpieczeństwo treści, ponieważ ilość generowanych treści przyspiesza. Łatwiej jest tworzyć i rozpowszechniać, więc jest ich więcej i więcej złośliwych treści. 

Dzięki tej tezie zbudujemy sztuczną inteligencję, która pomoże ludziom zrozumieć, które treści są dobre, a które złe, i musieliśmy od czegoś zacząć, więc zaczęliśmy od bardzo małego segmentu, który od razu miał bardzo wyraźną wartość ekonomiczną: sztuki cyfrowej. To był dla nas najłatwiejszy sposób na rozpoczęcie realizacji naszej wizji, ponieważ istniał bardzo jasny sposób wyjaśnienia, dlaczego ludzie powinni płacić za autentyczność. W końcu, jeśli kupisz nieautentyczny NFT, natychmiast tracisz pieniądze. Jeśli konsumujesz nieautentyczne wiadomości, prawdopodobnie tracisz nie tylko pieniądze, ale w znacznie większym okresie czasu. Sprzedawanie jest o wiele trudniejsze, dlatego zaczęliśmy tam, gdzie zaczęliśmy. 

W ciągu roku oczyściliśmy przestrzeń z milionów nieautentycznych NFTs i zbudowaliśmy najbardziej precyzyjny, najszybszy i najbardziej skalowalny system rozumienia treści dla blockchain. Działa teraz na dziewięciu łańcuchach bloków; wykryto ponad 100 milionów fałszywych NFTS. Działa jako system czasu rzeczywistego z opóźnieniem poniżej sekundy w większości przypadków. Polega na nim główny i kilka rynków, takich jak OpenSea, który stanowi prawie większość rynku sprzedaży wtórnej, na którym pojawia się większość oszustw. Nasze wyniki można zobaczyć na stronie insights.optic.xyz, która jest publicznie dostępnym pulpitem nawigacyjnym z wieloma błędami NFTs wykrytych na kolekcję. 

Teraz, gdy generatywna sztuczna inteligencja staje się tematem wybuchowym, myślę, że istnieje inny problem o wiele większy niż podrabianie dzieł sztuki cyfrowej, a mianowicie, że wkrótce ludzie nie będą w stanie odróżnić, co jest prawdziwe, a co wyimaginowane. Na przykład te pierwsze próby wywierania wpływu politycznego ze skutymi kajdankami zdjęciami Trumpa. Wierzę, że jesteśmy w nowej erze, która będzie naprawdę przerażająca dla ludzi, ponieważ sztuczna inteligencja będzie wykorzystywana we wszelkiego rodzaju kampaniach dezinformacyjnych.

Szczerze mówiąc, kiedy zaczynaliśmy Optic, sztuczna inteligencja już wyrządzała wiele szkód z powodu rekomendacji generowanych przez sztuczną inteligencję, ponieważ tworzą komory echa w mediach społecznościowych, w których ludzie utwierdzają się w swoich przekonaniach, a tym samym powodują polaryzację społeczną. Ale teraz, dzięki generatywnej sztucznej inteligencji, jest ona zwielokrotniona, ponieważ nagle te komory echa mogą nie tylko ponownie przetłumaczyć uzyskane gdzieś dowody, ale mogą tworzyć fałszywe dowody i alternatywne rzeczywistości w tych małych grupach ludzi, którzy w coś wierzą. Coraz ważniejsze będzie posiadanie pewnych narzędzi publicznych, pozwalających każdemu sprawdzić, czy to, na co patrzy, jest prawdziwe, czy wyimaginowane. Oczywiście na poziomie instytucjonalnym i na tym polega nasza monetyzacja: udostępnianie interfejsów API. 

Chciałem zapytać jak to działa, bo o godz Mpost, mamy naszego pisarza AI, który skanuje wiele źródeł wiadomości. Nasi redaktorzy napiszą następnie lede, ale artykuł jest w rzeczywistości generowany przez kilka modeli AI, aby wyglądał jak tekst napisany przez człowieka. Czy jako platforma dostarczająca rozwiązania wykrywające fałszywe i wprowadzające w błąd treści, Optic będzie w stanie rozpoznać tekst generowany przez sztuczną inteligencję jako nieautentyczny? 

Oddzielmy tekst i media. Żeby było jasne, w tej chwili nie mamy produktu do wykrywania tekstu generowanego przez sztuczną inteligencję, ponieważ, szczerze mówiąc, jest to niezwykle trudne, ponieważ te teksty sztucznej inteligencji nie różnią się zbytnio od treści napisanych przez ludzi. Tak długo, jak jest to zgodne z faktami, nie ma znaczenia, czy zostało napisane przez sztuczną inteligencję, czy nie, chyba że jesteś nauczycielem w szkole.

Jednak ma to duże znaczenie, jeśli chodzi o zdjęcia i filmy, na przykład gdy ktoś jest przedstawiany jako fotograficzny dowód czegoś, co się nie wydarzyło, jak Trump skuty kajdankami lub papież w bufiastej kurtce. Lub kiedy ktoś bierze twój głos, twoją podobiznę lub twoją twarz i tworzy coś, o czym nie powiedziałeś, że nie zrobiłeś, ale wygląda na to, że to byłeś ty. Najnowszy utwór wygenerowany przez sztuczną inteligencję autorstwa Kaczor a The Weeknd, który nawiasem mówiąc, jest całkiem niezły, jest przykładem tego, co ma nadejść. Ale jeśli jesteś Drake'em, możesz z nim walczyć i zmusić wszystkie platformy do usunięcia go. 

Osobiście mam dość popularne konto społecznościowe, na którym jestem twórcą treści Instagrami otrzymywałem reklamy, w których moja twarz opowiada o jakimś bzdurnym produkcie, który jest ewidentnym oszustwem i reklamuje go odbiorcom, którzy we mnie wierzą, więc na świecie jest około kilkuset tysięcy ludzi, którzy znają moje imię i nazwisko moją twarz i ktoś mnie wykorzystuje, aby sprzedawać tym ludziom oszustwa. 

Myślę, że światowej sławy artyści będą mieli narzędzia do walki z tym. Możesz złożyć oświadczenie, że to nie ty, a wszyscy usłyszą to oświadczenie. Jeśli jesteś influencerem ze 100,000 XNUMX lub milionem subskrybentów i ktoś używa Twojej twarzy lub głosu, by mówić rzeczy, których nie masz na myśli, możesz nawet nie dowiedzieć się, dopóki nie będzie za późno. I to jest rzeczywistość, w której wszyscy będziemy żyć w dającej się przewidzieć przyszłości. 

Jak widać tutaj, skupiamy się przede wszystkim na:

  • Czy to zdjęcie jest prawdziwe, czy zostało wygenerowane przez sztuczną inteligencję? To jest teraz bardzo gorący temat.
  • Po drugie, czy ten film przedstawiający osobę może być głęboko fałszywym filmem? 
  • Po trzecie, czy to nagranie dźwiękowe jest prawdziwym głosem osoby, czy też jest to wygenerowana przez sztuczną inteligencję wersja głosu tej osoby? 

Powiedziawszy to, może to być całkowicie uzasadnione; Może użyję własnego głosu. Oto przykład: Jestem współzałożycielem tego startupu, który stworzył aplikację do medytacji oddechowej sterowanej głosem. Moja współzałożycielka, instruktorka oddychania, nagrywa te przewodniki swoim głosem. Teraz dzięki sztucznej inteligencji może nagle łatwiej tworzyć znacznie więcej treści, ponieważ trenuje sztuczną inteligencję, aby odtwarzała jej głos. Potrafi po prostu generować skrypty w wielu językach, a sztuczna inteligencja może tworzyć wersje utworu z jej głosem w tych językach. I jest to całkowicie uzasadniony przypadek użycia; to tylko sposób na skalowanie produkcji treści. 

Problem pojawia się, gdy nie można odróżnić prawdziwych lub generowanych przez sztuczną inteligencję mediów. Na przykład, gdy ktoś dzwoni do ciebie i mówi, że to twoi bliscy i że mają kłopoty i że musisz wysłać mu pieniądze. W mediach społecznościowych jest teraz mnóstwo doniesień o tego rodzaju oskórowanych głosach oszustwa gdzie ktoś brzmi jak ukochana osoba. Ludzie się na to nabierają i tracą pieniądze. Naszym zadaniem jest pomaganie ludziom w zachowaniu bezpieczeństwa w świecie treści generowanych przez sztuczną inteligencję. A przez bezpieczeństwo mam na myśli zapewnienie ludziom narzędzi zapewniających przejrzystość tego, co jest autentyczne, co zostało zmienione przez sztuczną inteligencję, a co wygenerowane przez sztuczną inteligencję. Tak długo, jak potrafisz różnicować, możesz podejmować własne decyzje.

W przypadku osób, które mogą nie mieć rozległej wiedzy na temat sztucznej inteligencji, w jaki sposób Optic zapewnia bezpieczeństwo ich głosu lub wykrywa, czy zdjęcie jest autentyczne, czy skopiowane? Jakie gwarancje jako zwykły człowiek może zapewnić Optic w zakresie wyświetlania wskaźników weryfikujących autentyczność fotografii?

Jesteśmy na wczesnym etapie. Uruchomiliśmy narzędzie internetowe aiornot.org. Załóżmy, że ktoś wysłał ci zdjęcie Trumpa, Hancocka lub zdjęcie, na którym robisz rzeczy, których normalnie nie robisz, a ty myślisz: „Co to do cholery jest?” Możesz przesłać to zdjęcie na aiornot.org. Mówi ci z około 80% prawdopodobieństwem, czy jest generowany przez sztuczną inteligencję. Możesz również wysłać go na nasze konto na Twitterze z hashtagiem AIornot, a my mamy bota w Telegramie, który dodaje AIornot, do którego możesz po prostu przesłać plik, a on wróci do ciebie z odpowiedzią. 

W tej chwili nie mamy produktu na żywo dla głosu i wideo, ale to są rzeczy, nad którymi pracujemy. 

Masz dwa ważne kamienie milowe na swojej mapie drogowej, a mianowicie narzędzia do wykrywania oszustw głosowych i wideo.

Tak. Badamy wszelkiego rodzaju miejsca, w których bezpieczeństwo i autentyczność mogą być zagrożone. Sztuka cyfrowa była jedną z nich i rozwiązaliśmy ten problem. Problemem są obrazy generowane przez sztuczną inteligencję; pracujemy nad rozwiązaniem. Spodziewamy się, że wideo i głos staną się problemem i będziemy je rozwiązywać. Jeśli pojawi się inny, większy problem, zamiast tego go rozwiążemy. 

Wszystko zmienia się teraz bardzo szybko dzięki sztucznej inteligencji. Na przykład mogę sobie wyobrazić, że może większym problemem będą agenci AI, którzy udają ludzi i będą rozmawiać z tobą na portalach społecznościowych lub komunikatorach, a ty nie będziesz wiedział, czy to prawda, czy nie. Więc może jeśli tak jest, skupimy się na tym. Ale wszystko łączy ten wspólny temat: Optic to firma zajmująca się sztuczną inteligencją, która rozwiązuje problemy związane z autentycznością i bezpieczeństwem treści.

Jak myślisz, jaka jest najważniejsza umiejętność, którą ludzie powinni rozwijać w dzisiejszych czasach, aby mieć lepsze perspektywy zatrudnienia w przyszłości lub zachować bezpieczeństwo zatrudnienia już teraz?

Myślę, że do tej pory prawdopodobnie możemy się zgodzić, że istnieje więcej niż jedna forma inteligencji. Do niedawna wszyscy myśleliśmy, że ludzki mózg jest tak wyjątkowy, że jest to jedyny sposób na bycie inteligentnym. Tak jak ptaki latające na trzepoczących skrzydłach przez zaledwie tysiące lat uważano za jedyny sposób latania, a ludzie próbowali produkować latające maszyny, tworząc trzepoczące skrzydła, a potem bracia Wright udowodnili, że istnieją różne sposoby latania, które w rzeczywistości , są o wiele prostsze mechanicznie, ale o wiele trudniejsze technologicznie niż to, co próbujemy zrobić. Teraz wszyscy latamy. 

Podobnie z inteligencją, mózg był jedyną znaną formą inteligencji przez wiele lat, a potem nagle, teraz, widzimy, że istnieje inna forma. Jego model transformatora jest o wiele prostszy niż twój mózg. Jednak biorąc pod uwagę znacznie więcej mocy obliczeniowej i znacznie więcej danych, w rzeczywistości może wytwarzać inteligencję porównywalną lub wkrótce przewyższającą ludzi. Więc w tym świecie, w którym konkurujemy z czymś, co potencjalnie jest znacznie mądrzejsze od nas, myślę, że istnieją dwa sposoby, dzięki którym ludzki mózg może nadal konkurować:

  1. Zwinność. Bycie zrównoważonym, elastycznym i mniej wyspecjalizowanym to prawdopodobnie najważniejsza umiejętność, którą każdy powinien teraz trenować. Ponieważ będziemy musieli dużo manewrować jako gatunek, aby wymanewrować tę nową formę życia, jeśli stworzymy AGI w ciągu najbliższych pięciu lat
  2. Doświadczenie zmysłowe. Jednej rzeczy AI nie ma. Nie może czuć, nie ma wszystkich sensorów na świecie i nie może doświadczać życia. To właśnie czyni ludzi wyjątkowymi. Kondycja człowieka jest warunkiem doświadczania życia. Czując wszystkie emocje smutku i szczęścia, miłości i nienawiści oraz wszystkie te rzeczy, które czujemy za każdym razem, gdy robimy wdech i wydech. Nikt nie może nam tego odebrać. Jeśli już, powinniśmy nauczyć się, że powinniśmy czuć więcej, ponieważ w wielu przypadkach będziemy zlecać myślenie w przyszłości.

Czytaj więcej:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Seryjny przedsiębiorca z ponad 14-letnim doświadczeniem. Przekształcony Cointelegraph od 1 mln do 19 mln MAU i uruchomił 8 oddziałów lokalnych. Teraz pomagamy korporacjom przejść na web3.

Więcej artykułów
Siergiej Miedwiediew
Siergiej Miedwiediew

Seryjny przedsiębiorca z ponad 14-letnim doświadczeniem. Przekształcony Cointelegraph od 1 mln do 19 mln MAU i uruchomił 8 oddziałów lokalnych. Teraz pomagamy korporacjom przejść na web3.

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej

Założyciele portfela Samourai oskarżeni o ułatwianie transakcji o wartości 2 miliardów dolarów w Darknet

Zaniepokojenie założycieli Samourai Wallet stanowi wyraźną porażkę dla branży, podkreślając utrzymujące się...

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
W kwietniu 2024 r. odnotowano historycznie niski poziom hacków i oszustw, CertiK raportuje 141% spadek w porównaniu z marcem
rynki Bezpieczeństwo Wiki Historie i recenzje Technologia
W kwietniu 2024 r. odnotowano historycznie niski poziom hacków i oszustw, CertiK raportuje 141% spadek w porównaniu z marcem
1 maja 2024 r.
Cena Bitcoina spada przed ogłoszeniem decyzji Rezerwy Federalnej w sprawie stóp procentowych, analitycy ostrzegają przed potencjalną zmianą rynku
rynki Raport aktualności Technologia
Cena Bitcoina spada przed ogłoszeniem decyzji Rezerwy Federalnej w sprawie stóp procentowych, analitycy ostrzegają przed potencjalną zmianą rynku
1 maja 2024 r.
PlayFi integruje MultiversX w trybie Plug-And-Play Web3 Doświadczenie w grach
Biznes Raport aktualności Technologia
PlayFi integruje MultiversX w trybie Plug-And-Play Web3 Doświadczenie w grach
1 maja 2024 r.
Galxe wprowadza usługę Passport V2 z ulepszonymi narzędziami do ochrony prywatności i weryfikacji Web3
Raport aktualności Technologia
Galxe wprowadza usługę Passport V2 z ulepszonymi narzędziami do ochrony prywatności i weryfikacji Web3
30 kwietnia 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.