Ipinakilala ng Google ang isang modelo ng AI para sa paglalarawan ng mga artikulo ng balita
Sa madaling sabi
Inanunsyo ng Google ang bagong modelo ng AI para sa paggawa ng mataas na kalidad na mga visual na buod ng mga artikulo ng balita
Ang Google ay may anunsyado isang bagong modelo ng artificial intelligence (AI) na sinasabi nitong maaaring awtomatikong bumuo ng "magkakaugnay at matatas" na visual na buod ng mga artikulo ng balita. Sinabi ng higanteng teknolohiya na ang modelo ay maaaring makatulong na gawing mas naa-access ang impormasyon sa mga gumagamit sa pamamagitan ng generating "mataas na kalidad" na mga visual na buod ng mahabang piraso ng teksto.
Ang modelo ay batay sa isang malalim na algorithm ng pag-aaral na kilala bilang isang transpormer, na idinisenyo upang "maunawaan" ang konteksto ng isang pangungusap at pagkatapos ay bumuo ng isang paglalarawan na nagpapanatili ng mahalagang impormasyon mula sa orihinal na teksto.
Nagagawa ng Google ang mas mahirap na gawain ng pag-unawa sa pangkalahatang konteksto ng buong teksto, sa kaibahan sa kasalukuyang sikat text-to-image system, na nakabatay sa isang "frontal" na paglalarawan ng "kung ano ang nakikita ko, iginuhit ko tungkol sa" prinsipyo. Bukod pa rito, ang pagpili ng mga larawan ay ginawa upang lumikha ng isang "larawan sa kabuuan" sa halip na mga indibidwal na pahayag at parirala (tulad ng halos ginagawa ng lahat ngayon). Sa madaling salita, pinipili ang mga larawan para sa buong artikulo habang isinasaisip ang mga konteksto at kahulugan.
Sinasabi ng Google na ang modelo ay maaaring makabuo ng mga buod ng maraming pangungusap mula sa isang artikulo ng balita at ito ay nangyari na sinanay sa isang malaking dataset NewsStories, na naglalaman ng halos 31 milyong artikulo, 22 milyong larawan, at 1 milyong video na nakatago sa mga palumpong.
Ang unang hakbang ay upang itugma ang larawan sa kumpletong artikulo pagkatapos itong maisalin sa wastong mga representasyon gamit ang parehong wika at mga image encoder.
Ang ikalawang hakbang ay nangangailangan ng paghahati ng isang tekstong artikulo sa magkakahiwalay na mga pangungusap at pag-encode ng bawat pangungusap sa ibang representasyon. Ang layunin ay i-optimize ang mutual na impormasyon, defined sa mga tuntunin ng mga pamamahagi ng posibilidad, sa pagitan ng mga pagkakasunud-sunod ng larawan at teksto. Ang pinakadakilang katumpakan ay nakuha bilang isang resulta.
Sa konklusyon, ang pag-aaral na ito ay gumagawa ng iba't ibang mga kontribusyon, mula sa mga aplikasyon tulad ng awtomatikong paglalarawan ng pagsasalaysay hanggang sa mapaghamong gawain ng pagtutugma ng isang kuwento at isang koleksyon ng mga paglalarawan. Sinasabi ng kumpanya ang modelo maaari ding ilapat sa iba pang mga wika at na ito ay nagtatrabaho sa pagpapalawak ng dataset upang isama ang mga artikulo mula sa iba pang mga site.
Magbasa nang higit pa mga nauugnay na artikulo:
Pagtanggi sa pananagutan
Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.
Tungkol sa Ang May-akda
Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.
Mas marami pang artikuloSi Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet.