Звіт про новини Технологія
Листопад 17, 2022

Google представив модель ШІ для ілюстрації новинних статей

Коротко

Google анонсує нову модель ШІ для створення високоякісних візуальних підсумків новинних статей

Google має оголошений нова модель штучного інтелекту (ШІ), яка, за її словами, може автоматично генерувати «послідовні та плавні» візуальні підсумки новинних статей. Технологічний гігант каже, що ця модель може допомогти зробити інформацію доступнішою для користувачів породжує «високоякісні» візуальні резюме довгих фрагментів тексту.

Google представив модель ШІ для ілюстрації новинних статей
Зображення, створене Stable Diffusion

Модель базується на алгоритмі глибокого навчання, відомому як трансформатор, який призначений для «розуміння» контексту речення та створення ілюстрації, яка зберігає важливу інформацію з оригінального тексту.

Google виконує набагато складніше завдання розуміння загального контексту всього тексту, на відміну від нині популярного перетворення тексту в зображення системи, в основі яких лежить «фронтальне» зображення за принципом «що бачу, те й малюю». Крім того, вибір зображень зроблений так, щоб створити «картинку в цілому», а не окремі висловлювання та фрази (як зараз роблять практично всі). Іншими словами, зображення підбираються для всієї статті з урахуванням контексту та значення.

Google каже, що модель може генерувати резюме кількох речень із новинної статті, і це було так навчався на великому наборі даних NewsStories, який містить майже 31 мільйон статей, 22 мільйони фотографій і 1 мільйон відео, захованих у кущах.

У цьому проекті ми беремося за абсолютно новий виклик: створюємо візуальні підсумки, які є довшими текстами, що супроводжуються набором зображень. Опановуючи два підзавдання MIL (багатоекземплярне навчання), мета полягає в тому, щоб максимізувати семантичну подібність між кожною статтею та вхідними фотографіями.

Перший крок полягає в тому, щоб зіставити зображення з цілою статтею після того, як воно було перекладено на належні представлення за допомогою мови та кодувальників зображень.

Другий крок передбачає поділ текстової статті на окремі речення та кодування кожного речення в інше представлення. Метою є оптимізація взаємної інформації, defiв термінах розподілу ймовірностей між послідовностями зображень і тексту. В результаті була отримана найбільша точність.

Google представив модель ШІ для ілюстрації новинних статей
Зображення, створене Stable Diffusion

Підсумовуючи, це дослідження робить різноманітні внески, від додатків, таких як автоматизована наративна ілюстрація, до складного завдання зіставлення історії та колекції ілюстрацій. Компанія каже модель також можна застосовувати до інших мов і що він працює над розширенням набору даних, щоб включити статті з інших сайтів.

Читайте більше пов’язаних статей:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Криптопрорив у травні 2024 року: тріумф монети Bitgert

by Григорій Пудовський
Травень 06, 2024

Інституційний апетит зростає до біткойн ETF на тлі волатильності

Розкриття інформації через документи 13F свідчить про те, що відомі інституційні інвестори займаються біткойн ETF, підкреслюючи зростаюче визнання ...

Дізнайтеся більше

Настав день винесення вироку: суд США розглядає прохання Міністерства юстиції щодо долі CZ.

Changpeng Zhao готовий зіткнутися з вироком у американському суді в Сіетлі сьогодні.

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Binance припиняє підтримку продуктів і послуг BIDR і рекомендує користувачам конвертувати кошти до 20 серпня
ринки Звіт про новини Технологія
Binance припиняє підтримку продуктів і послуг BIDR і рекомендує користувачам конвертувати кошти до 20 серпня
Травень 6, 2024
Порушення безпеки вразило GNUS.AI екосистеми Fantom, призвело до збитків у розмірі 1.27 млн ​​доларів
ринки Звіт про новини Технологія
Порушення безпеки вразило GNUS.AI екосистеми Fantom, призвело до збитків у розмірі 1.27 млн ​​доларів
Травень 6, 2024
Криптопрорив у травні 2024 року: тріумф монети Bitgert
Звіт про новини
Криптопрорив у травні 2024 року: тріумф монети Bitgert
Травень 6, 2024
Через 1 років після запуску мережа Bitcoin перевищила XNUMX мільярд транзакцій
ринки Звіт про новини Технологія
Через 1 років після запуску мережа Bitcoin перевищила XNUMX мільярд транзакцій
Травень 6, 2024
CRYPTOMERIA LABS PTE. LTD.