Новини Технологии
Ноември 17, 2022

Google представи AI модел за илюстриране на новинарски статии

Накратко

Google обявява нов AI модел за създаване на висококачествени визуални резюмета на новинарски статии

Google има оповестен нов модел на изкуствен интелект (AI), който според него може автоматично да генерира „последователни и плавни“ визуални резюмета на новинарски статии. Технологичният гигант казва, че моделът може да направи информацията по-достъпна за потребителите чрез генерираща „висококачествени“ визуални резюмета на дълги части от текст.

Google представи AI модел за илюстриране на новинарски статии
Изображението, създадено от Stable Diffusion

Моделът се основава на алгоритъм за дълбоко обучение, известен като трансформатор, който е проектиран да „разбира“ контекста на изречение и след това да генерира илюстрация, която запазва важната информация от оригиналния текст.

Google изпълнява много по-предизвикателната задача да разбере цялостния контекст на целия текст, за разлика от популярния в момента текст към изображение системи, които се базират на “фронтално” изобразяване на принципа “каквото виждам, това рисувам”. Освен това, изборът на изображения се прави, за да се създаде „картина като цяло“, а не отделни твърдения и фрази (както практически всеки прави в момента). С други думи, снимките се избират за цялата статия, като се вземат предвид контекстите и значенията.

Google казва, че моделът може да генерира резюмета на множество изречения от новинарска статия и това е така обучени на голям набор от данни NewsStories, който съдържа почти 31 милиона статии, 22 милиона снимки и 1 милион видеоклипове, скрити в храстите.

В този проект ние поемаме чисто ново предизвикателство: създаване на визуални резюмета, които са по-дълги текстове, придружени от колекция от изображения. Чрез овладяването на две подзадачи MIL (Multiple Instance Learning) целта е да се увеличи максимално семантичното сходство между всяка статия и входните снимки.

Първата стъпка е да съпоставите изображението с цялата статия, след като е преведено в правилните представяния, като използвате както езика, така и енкодерите за изображения.

Втората стъпка включва разделяне на текстова статия на отделни изречения и кодиране на всяко изречение в различно представяне. Целта е да се оптимизира взаимната информация, defiнеобходими по отношение на вероятностните разпределения, между изображения и текстови последователности. В резултат на това се получава най-голямата прецизност.

Google представи AI модел за илюстриране на новинарски статии
Изображението, създадено от Stable Diffusion

В заключение, това проучване дава различни приноси, от приложения като автоматизирана наративна илюстрация до предизвикателната задача за съпоставяне на история и колекция от илюстрации. Компанията казва, че модел може да се прилага и към други езици и че работи върху разширяването на набора от данни, за да включва статии от други сайтове.

Прочетете още свързани статии:

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Още статии
Дамир Ялалов
Дамир Ялалов

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

Институционалният апетит нараства към биткойн ETF на фона на волатилност

Оповестяванията чрез документи 13F разкриват забележителни институционални инвеститори, занимаващи се с биткойн ETF, което подчертава нарастващото приемане на...

Научете още

Пристига денят на присъдата: Съдбата на CZ виси на равновесие, докато американският съд разглежда молбата на DOJ

Changpeng Zhao е готов да бъде осъден днес в американски съд в Сиатъл.

Научете още
Присъединете се към нашата иновативна техническа общност
Вижте повече
Прочети повече
Binance спира поддръжката на BIDR продукти и услуги, съветва потребителите да конвертират средства преди 20 август
пазари Новини Технологии
Binance спира поддръжката на BIDR продукти и услуги, съветва потребителите да конвертират средства преди 20 август
Май 6, 2024
Пробив в сигурността удря GNUS.AI на Fantom Ecosystem, което води до загуба от $1.27 милиона
пазари Новини Технологии
Пробив в сигурността удря GNUS.AI на Fantom Ecosystem, което води до загуба от $1.27 милиона
Май 6, 2024
Крипто пробивът от май 2024 г.: Триумфът на Bitgert Coin
Новини
Крипто пробивът от май 2024 г.: Триумфът на Bitgert Coin
Май 6, 2024
Биткойн мрежата надминава 1 милиард транзакции, петнадесет години след стартирането си
пазари Новини Технологии
Биткойн мрежата надминава 1 милиард транзакции, петнадесет години след стартирането си
Май 6, 2024
CRYPTOMERIA LABS PTE. LTD.