Meta представляє Segment Anything, свою нову модель AI для сегментації зображень
Коротко
Meta представила Segment Anything, свою нову базову модель для сегментації зображень.
Компанія відкриває два великі набори даних, які використовуються для навчання моделі ШІ.
Meta каже, що Segment Anything може стати компонентом у більших системах ШІ для розуміння як візуального, так і текстового вмісту веб-сторінки.
Meta представила Segment Anything, свою нову базову модель для сегментації зображень. Процес визначення того, які пікселі зображення належать об’єкту, є ключовим завданням комп’ютерного зору та використовується в різноманітних програмах, від аналізу наукових зображень до редагування фотографій.
У своїй вступній блог, компанія створила сцену, заявивши, що створення точних моделей сегментації для конкретних завдань у сфері комп’ютерного зору зазвичай потребує спеціалізованої роботи технічних експертів з доступом до навчальної інфраструктури ШІ та великих обсягів ретельно анотованих даних у домені.
Однак незабаром це може змінитися з проектом Segment Anything, оскільки очікується, що його новий набір даних і модель зроблять точні моделі сегментації більш доступними для ширшої аудиторії, усуваючи потребу в спеціалізованих технічних знаннях та інфраструктурі. Щоб досягти цього, дослідники створили модель підказок, яка навчається на різноманітних даних і може адаптуватися до конкретних завдань, подібно до того, як підказки використовуються в моделях обробки природної мови або чат-ботах.
Для подальшої демократизації сегментації Meta робить доступним масивний набір даних SA-1B для дослідницьких цілей, а модель Segment Anything доступна за дозвільною відкритою ліцензією (Apache 2.0). Крім того, компанія розробила a демонстрація що дозволяє користувачам спробувати SAM зі своїми власними зображеннями.
Meta бачить потенційні варіанти використання SAM у сферах штучного інтелекту, доповненої реальності та віртуальної реальності та для авторів. SAM має потенціал стати критичним елементом у великих системах штучного інтелекту, які спрямовані на досягнення більш загального мультимодального розуміння світу. Наприклад, це може полегшити розуміння як візуального, так і текстового вмісту веб-сторінки.
Крім того, у домені AR/VR SAM міг увімкнути вибір об’єкта на основі погляду користувача та дозволити «підняти» об’єкт у 3D. Крім того, творці контенту можуть використовувати SAM для покращення творчих додатків, таких як вилучення областей зображення для колажів або редагування відео.
Meta нарощує свої зусилля зі штучного інтелекту на тлі генеративного буму штучного інтелекту та зменшення інтересу до метавсесвіту. Незважаючи на ставку компанії на метавсесвіт у розмірі 70 мільярдів доларів, минулого року її підрозділ Reality Labs втратив 13.7 мільярда доларів США. Нещодавно Мета також зайшла NFT операції у Facebook та Instagram.
В інтерв'ю Nikkei Азія У середу технічний директор Meta Кріс Босуорт сказав, що топ-менеджери Meta витрачають більшу частину свого часу на ШІ. Генеральний директор Meta Марк Цукерберг оголошений у лютому нова група продуктів, зосереджена на генеративному ШІ після випуску його нова велика мовна модель називається LLaMA (Large Language Model Meta AI).
Очікується, що цього року компанія дебютує з додатками ШІ для створення реклами, сказав Босворт Nikkei.
Детальніше:
відмова
Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.
про автора
Сінді працює журналістом у Metaverse Post, що охоплює теми, пов’язані з web3, NFT, метавсесвіт та ШІ, зосереджуючись на інтерв’ю з Web3 гравців галузі. Вона поспілкувалася з понад 30 керівниками вищого рівня та розповіла читачам про їхні цінні ідеї. Родом із Сінгапуру, Сінді тепер живе в Тбілісі, Грузія. Вона отримала ступінь бакалавра з комунікацій та медіа-досліджень в Університеті Південної Австралії та має десятирічний досвід роботи в журналістиці та письменництві. Зв'яжіться з нею через [захищено електронною поштою] з презентаціями для преси, оголошеннями та можливостями для інтерв’ю.
інші статтіСінді працює журналістом у Metaverse Post, що охоплює теми, пов’язані з web3, NFT, метавсесвіт та ШІ, зосереджуючись на інтерв’ю з Web3 гравців галузі. Вона поспілкувалася з понад 30 керівниками вищого рівня та розповіла читачам про їхні цінні ідеї. Родом із Сінгапуру, Сінді тепер живе в Тбілісі, Грузія. Вона отримала ступінь бакалавра з комунікацій та медіа-досліджень в Університеті Південної Австралії та має десятирічний досвід роботи в журналістиці та письменництві. Зв'яжіться з нею через [захищено електронною поштою] з презентаціями для преси, оголошеннями та можливостями для інтерв’ю.