Meta wprowadza Segment Anything, nowy model AI do segmentacji obrazu
W skrócie
Meta wprowadziła Segment Anything, nowy podstawowy model segmentacji obrazu.
Firma korzysta z otwartego źródła dwóch dużych zestawów danych używanych do trenowania modelu sztucznej inteligencji.
Meta mówi, że Segment Anything może stać się komponentem większych systemów AI zrozumienie zarówno treści wizualnych, jak i tekstowych strony internetowej.
Meta wprowadziła Segment Anything, nowy podstawowy model segmentacji obrazu. Proces identyfikowania, które piksele obrazu należą do obiektu, jest kluczowym zadaniem w wizji komputerowej i jest wykorzystywany w różnych zastosowaniach, od analizy obrazów naukowych po edycję zdjęć.
W swoim wstępie blogu, firma przygotowała scenę, mówiąc, że tworzenie dokładnych modeli segmentacji dla określonych zadań w dziedzinie wizji komputerowej zwykle wymagało specjalistycznej pracy ekspertów technicznych z dostępem do infrastruktury szkoleniowej AI i dużych ilości starannie opatrzonych adnotacjami danych w domenie.
Jednak wkrótce może się to zmienić wraz z projektem Segment Anything, ponieważ oczekuje się, że nowy zestaw danych i model sprawią, że dokładne modele segmentacji będą bardziej dostępne dla szerszej publiczności, eliminując potrzebę posiadania specjalistycznej wiedzy technicznej i infrastruktury. Aby to osiągnąć, naukowcy zbudowali model monitujący, który jest szkolony na różnych danych i może dostosowywać się do określonych zadań, podobnie jak monitowanie jest używane w modelach przetwarzania języka naturalnego lub chatbotach.
Aby jeszcze bardziej zdemokratyzować segmentację, Meta udostępnia ogromny zbiór danych SA-1B do celów badawczych, a model Segment Anything Model jest dostępny na wolnej otwartej licencji (Apache 2.0). Dodatkowo firma opracowała m.in próbny która pozwala użytkownikom wypróbować SAM z własnymi obrazami.
Meta widzi potencjalne przypadki użycia SAM w domenach AI, AR/VR i twórców. SAM ma potencjał, aby stać się kluczowym elementem w większych systemach sztucznej inteligencji, których celem jest osiągnięcie bardziej ogólnego multimodalnego zrozumienia świata. Na przykład może ułatwić zrozumienie treści wizualnych i tekstowych na stronie internetowej.
Dodatkowo, w domenie AR/VR, SAM mógłby umożliwiać wybór obiektów na podstawie spojrzenia użytkownika i pozwolić na „podniesienie” obiektu do 3D. Co więcej, twórcy treści mogą używać SAM do ulepszania kreatywnych aplikacji, takich jak wyodrębnianie regionów obrazu do kolaży lub edycji wideo.
Meta zwiększa wysiłki w zakresie sztucznej inteligencji w obliczu generatywnego boomu AI i malejącego zainteresowania metaverse. Pomimo tego, że firma postawiła 70 miliardów dolarów na Metaverse, jej oddział Metaverse Reality Labs odnotował w zeszłym roku stratę w wysokości 13.7 miliarda USD. Ostatnio Meta również wygaśnie NFT działania na Facebooku i Instagramie.
W rozmowie z Nikkei Asia w środę CTO Meta, Chris Bosworth, powiedział, że najwyższe kierownictwo Meta spędza większość czasu na sztucznej inteligencji. CEO Meta, Mark Zuckerberg ogłosił w lutym nowa grupa produktów skupiła się na generatywnej sztucznej inteligencji po uwalniając jego nowy model dużego języka o nazwie LLaMA (Model wielkojęzykowy Meta AI).
Oczekuje się, że firma zadebiutuje w tym roku w aplikacjach AI do tworzenia reklam, powiedział Bosworth Nikkei.
Czytaj więcej:
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Cindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.
Więcej artykułówCindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.