Новостной репортаж Технологии
17 ноября 2022

Google представил модель ИИ для иллюстрации новостных статей

Коротко

Google анонсирует новую модель искусственного интеллекта для создания высококачественных визуальных сводок новостных статей

Google имеет объявило новая модель искусственного интеллекта (ИИ), которая, по ее словам, может автоматически генерировать «согласованные и плавные» визуальные сводки новостных статей. Технологический гигант говорит, что модель может помочь сделать информацию более доступной для пользователей. порождающий «качественные» визуальные конспекты длинных фрагментов текста.

Google представил модель ИИ для иллюстрации новостных статей
Образ, созданный Stable Diffusion

Модель основана на алгоритме глубокого обучения, известном как преобразователь, который предназначен для «понимания» контекста предложения, а затем для создания иллюстрации, сохраняющей важную информацию из исходного текста.

Google выполняет гораздо более сложную задачу понимания общего контекста всего текста, в отличие от популярного в настоящее время текст в изображение системы, основанные на «фронтальном» изображении по принципу «что вижу, то и рисую». Кроме того, выбор изображений осуществляется для создания «картинки в целом», а не отдельных утверждений и фраз (как сейчас делают практически все). Другими словами, изображения выбираются для всей статьи с учетом контекста и значения.

Google говорит, что модель может генерировать резюме нескольких предложений из новостной статьи и что она была обучены на большом наборе данных NewsStories, который содержит почти 31 миллион статей, 22 миллиона фотографий и 1 миллион видео, спрятанных в кустах.

В этом проекте мы беремся за совершенно новую задачу: создание визуальных резюме, которые представляют собой более длинные тексты, сопровождаемые коллекцией изображений. Освоив две подзадачи MIL (Multiple Instance Learning), цель состоит в том, чтобы максимизировать семантическое сходство между каждой статьей и входными фотографиями.

Первым шагом является сопоставление изображения с полной статьей после того, как оно было переведено в надлежащее представление с использованием как языка, так и кодировщиков изображений.

Второй шаг влечет за собой разделение текстовой статьи на отдельные предложения и кодирование каждого предложения в другом представлении. Цель состоит в том, чтобы оптимизировать взаимную информацию, defiв терминах вероятностных распределений между последовательностями изображений и текстов. В результате была получена наибольшая точность.

Google представил модель ИИ для иллюстрации новостных статей
Образ, созданный Stable Diffusion

В заключение, это исследование вносит разнообразный вклад, от таких приложений, как автоматизированная повествовательная иллюстрация, до сложной задачи сопоставления истории и коллекции иллюстраций. Компания говорит, модель также может применяться к другим языкам, и что он работает над расширением набора данных, чтобы включить в него статьи с других сайтов.

Читайте больше статей по теме:

Отказ от ответственности

В соответствии с Руководство трастового проектаОбратите внимание, что информация, представленная на этой странице, не предназначена и не должна интерпретироваться как юридическая, налоговая, инвестиционная, финансовая или любая другая форма консультации. Важно инвестировать только то, что вы можете позволить себе потерять, и обращаться за независимой финансовой консультацией, если у вас есть какие-либо сомнения. Для получения дополнительной информации мы предлагаем обратиться к положениям и условиям, а также к страницам справки и поддержки, предоставленным эмитентом или рекламодателем. MetaversePost стремится предоставлять точную и объективную отчетность, однако рыночные условия могут быть изменены без предварительного уведомления.

Об авторе

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Другие статьи
Дамир Ялалов
Дамир Ялалов

Дамир — руководитель группы, менеджер по продукту и редактор в Metaverse Post, охватывающие такие темы, как AI/ML, AGI, LLM, Metaverse и Web3-связанные поля. Его статьи ежемесячно привлекают огромную аудиторию, насчитывающую более миллиона пользователей. Похоже, он эксперт с 10-летним опытом работы в области SEO и цифрового маркетинга. Дамир упоминается в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и другие издания. Он путешествует между ОАЭ, Турцией, Россией и СНГ в качестве цифрового кочевника. Дамир получил степень бакалавра в области физики, что, по его мнению, дало ему навыки критического мышления, необходимые для достижения успеха в постоянно меняющемся мире Интернета. 

Hot Stories
Подпишитесь на нашу рассылку.
Новости

Институциональный аппетит к биткойн-ETF растет на фоне волатильности

Раскрытие информации через отчеты 13F показывает, что известные институциональные инвесторы балуются биткойн-ETF, подчеркивая растущее признание...

Узнать больше

Наступил день вынесения приговора: судьба CZ висит на волоске, поскольку суд США рассматривает ходатайство Министерства юстиции

Чанпэн Чжао сегодня предстанет перед судом США в Сиэтле.

Узнать больше
Присоединяйтесь к нашему сообществу инновационных технологий
Узнать больше
Читать далее
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
Бизнес Новостной репортаж Технологии
Injective объединяет усилия с AltLayer, чтобы внести изменения в безопасность в inEVM
3 мая 2024
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
Области применения: Новостной репортаж Технологии
Masa объединяется с Teller, чтобы представить кредитный пул MASA, позволяющий заимствовать USDC на базе
3 мая 2024
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
Области применения: Новостной репортаж Технологии
Velodrome запускает бета-версию Superchain в ближайшие недели и распространяется на блокчейны второго уровня стека OP
3 мая 2024
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
Бизнес Новостной репортаж Технологии
CARV объявляет о партнерстве с Aethir для децентрализации уровня данных и распределения вознаграждений
3 мая 2024
CRYPTOMERIA LABS PTE. ООО