Raport aktualności Technologia
06 kwietnia 2023 r.

Meta wprowadza Segment Anything, nowy model AI do segmentacji obrazu

W skrócie

Meta wprowadziła Segment Anything, nowy podstawowy model segmentacji obrazu.

Firma korzysta z otwartego źródła dwóch dużych zestawów danych używanych do trenowania modelu sztucznej inteligencji.

Meta mówi, że Segment Anything może stać się komponentem większych systemów AI zrozumienie zarówno treści wizualnych, jak i tekstowych strony internetowej.

Meta wprowadziła Segment Anything, nowy podstawowy model segmentacji obrazu. Proces identyfikowania, które piksele obrazu należą do obiektu, jest kluczowym zadaniem w wizji komputerowej i jest wykorzystywany w różnych zastosowaniach, od analizy obrazów naukowych po edycję zdjęć. 

W swoim wstępie blogu, firma przygotowała scenę, mówiąc, że tworzenie dokładnych modeli segmentacji dla określonych zadań w dziedzinie wizji komputerowej zwykle wymagało specjalistycznej pracy ekspertów technicznych z dostępem do infrastruktury szkoleniowej AI i dużych ilości starannie opatrzonych adnotacjami danych w domenie. 

Jednak wkrótce może się to zmienić wraz z projektem Segment Anything, ponieważ oczekuje się, że nowy zestaw danych i model sprawią, że dokładne modele segmentacji będą bardziej dostępne dla szerszej publiczności, eliminując potrzebę posiadania specjalistycznej wiedzy technicznej i infrastruktury. Aby to osiągnąć, naukowcy zbudowali model monitujący, który jest szkolony na różnych danych i może dostosowywać się do określonych zadań, podobnie jak monitowanie jest używane w modelach przetwarzania języka naturalnego lub chatbotach.

Aby jeszcze bardziej zdemokratyzować segmentację, Meta udostępnia ogromny zbiór danych SA-1B do celów badawczych, a model Segment Anything Model jest dostępny na wolnej otwartej licencji (Apache 2.0). Dodatkowo firma opracowała m.in próbny która pozwala użytkownikom wypróbować SAM z własnymi obrazami.

Meta widzi potencjalne przypadki użycia SAM w domenach AI, AR/VR i twórców. SAM ma potencjał, aby stać się kluczowym elementem w większych systemach sztucznej inteligencji, których celem jest osiągnięcie bardziej ogólnego multimodalnego zrozumienia świata. Na przykład może ułatwić zrozumienie treści wizualnych i tekstowych na stronie internetowej. 

Dodatkowo, w domenie AR/VR, SAM mógłby umożliwiać wybór obiektów na podstawie spojrzenia użytkownika i pozwolić na „podniesienie” obiektu do 3D. Co więcej, twórcy treści mogą używać SAM do ulepszania kreatywnych aplikacji, takich jak wyodrębnianie regionów obrazu do kolaży lub edycji wideo.

Meta zwiększa wysiłki w zakresie sztucznej inteligencji w obliczu generatywnego boomu AI i malejącego zainteresowania metaverse. Pomimo tego, że firma postawiła 70 miliardów dolarów na Metaverse, jej oddział Metaverse Reality Labs odnotował w zeszłym roku stratę w wysokości 13.7 miliarda USD. Ostatnio Meta również wygaśnie NFT działania na Facebooku i Instagramie.

W rozmowie z Nikkei Asia w środę CTO Meta, Chris Bosworth, powiedział, że najwyższe kierownictwo Meta spędza większość czasu na sztucznej inteligencji. CEO Meta, Mark Zuckerberg ogłosił w lutym nowa grupa produktów skupiła się na generatywnej sztucznej inteligencji po uwalniając jego nowy model dużego języka o nazwie LLaMA (Model wielkojęzykowy Meta AI).

Oczekuje się, że firma zadebiutuje w tym roku w aplikacjach AI do tworzenia reklam, powiedział Bosworth Nikkei.

Czytaj więcej:

tagi:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Cindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.

Więcej artykułów
CindyTan
CindyTan

Cindy jest dziennikarką w Metaverse Post, obejmujące tematy związane z web3, NFT, Metaverse i AI, z naciskiem na wywiady z Web3 gracze branżowi. Rozmawiała z ponad 30 dyrektorami wyższego szczebla, a ich liczba wciąż rośnie, przekazując czytelnikom ich cenne spostrzeżenia. Pochodząca z Singapuru Cindy mieszka obecnie w Tbilisi w Gruzji. Uzyskała tytuł licencjata w dziedzinie nauk o komunikacji i mediach na Uniwersytecie Australii Południowej oraz dziesięcioletnie doświadczenie w dziennikarstwie i pisarstwie. Skontaktuj się z nią poprzez [email chroniony] z prezentacjami prasowymi, ogłoszeniami i możliwościami wywiadów.

Apetyt instytucjonalny na ETFy Bitcoin rośnie w obliczu zmienności

Ujawnienia zawarte w zgłoszeniach 13F ujawniają, że znaczący inwestorzy instytucjonalni parają się funduszami ETF Bitcoin, co podkreśla rosnącą akceptację…

Dowiedz się więcej

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Injective łączy siły z AltLayer, aby zapewnić bezpieczeństwo ponownego stakowania w inEVM
Biznes Raport aktualności Technologia
Injective łączy siły z AltLayer, aby zapewnić bezpieczeństwo ponownego stakowania w inEVM
3 maja 2024 r.
Masa współpracuje z Tellerem, aby wprowadzić pulę pożyczek MASA, umożliwiającą zaciąganie pożyczek w USDC
rynki Raport aktualności Technologia
Masa współpracuje z Tellerem, aby wprowadzić pulę pożyczek MASA, umożliwiającą zaciąganie pożyczek w USDC
3 maja 2024 r.
Velodrome wprowadza wersję beta Superchain w nadchodzących tygodniach i rozszerza się na łańcuchy bloków warstwy 2 stosu OP
rynki Raport aktualności Technologia
Velodrome wprowadza wersję beta Superchain w nadchodzących tygodniach i rozszerza się na łańcuchy bloków warstwy 2 stosu OP
3 maja 2024 r.
CARV ogłasza partnerstwo z firmą Aethir w celu decentralizacji warstwy danych i dystrybucji nagród
Biznes Raport aktualności Technologia
CARV ogłasza partnerstwo z firmą Aethir w celu decentralizacji warstwy danych i dystrybucji nagród
3 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.