Google представи AI модел за илюстриране на новинарски статии
Накратко
Google обявява нов AI модел за създаване на висококачествени визуални резюмета на новинарски статии
Google има оповестен нов модел на изкуствен интелект (AI), който според него може автоматично да генерира „последователни и плавни“ визуални резюмета на новинарски статии. Технологичният гигант казва, че моделът може да направи информацията по-достъпна за потребителите чрез генерираща „висококачествени“ визуални резюмета на дълги части от текст.
Моделът се основава на алгоритъм за дълбоко обучение, известен като трансформатор, който е проектиран да „разбира“ контекста на изречение и след това да генерира илюстрация, която запазва важната информация от оригиналния текст.
Google изпълнява много по-предизвикателната задача да разбере цялостния контекст на целия текст, за разлика от популярния в момента текст към изображение системи, които се базират на “фронтално” изобразяване на принципа “каквото виждам, това рисувам”. Освен това, изборът на изображения се прави, за да се създаде „картина като цяло“, а не отделни твърдения и фрази (както практически всеки прави в момента). С други думи, снимките се избират за цялата статия, като се вземат предвид контекстите и значенията.
Google казва, че моделът може да генерира резюмета на множество изречения от новинарска статия и това е така обучени на голям набор от данни NewsStories, който съдържа почти 31 милиона статии, 22 милиона снимки и 1 милион видеоклипове, скрити в храстите.
Първата стъпка е да съпоставите изображението с цялата статия, след като е преведено в правилните представяния, като използвате както езика, така и енкодерите за изображения.
Втората стъпка включва разделяне на текстова статия на отделни изречения и кодиране на всяко изречение в различно представяне. Целта е да се оптимизира взаимната информация, defiнеобходими по отношение на вероятностните разпределения, между изображения и текстови последователности. В резултат на това се получава най-голямата прецизност.
В заключение, това проучване дава различни приноси, от приложения като автоматизирана наративна илюстрация до предизвикателната задача за съпоставяне на история и колекция от илюстрации. Компанията казва, че модел може да се прилага и към други езици и че работи върху разширяването на набора от данни, за да включва статии от други сайтове.
Прочетете още свързани статии:
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.
Още статииДамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.