Ulat sa Balita Teknolohiya
Enero 24, 2023

StyleGAN-T: Ang pinakamabilis na henerasyon ng text-to-image na gumagawa ng mga resulta sa mas mababa sa 0.1 segundo

Sa madaling sabi

Ang StyleGAN-T ay isang bagong GAN para sa pagbuo ng tex2image.

Ang GAN na ito ay gumagawa ng magagandang resulta at medyo mabilis (0.1 segundo para sa isang 512×512 na larawan).

Ang bagong arkitektura ay batay sa StyleGAN-XL, ngunit sinusuri nito ang mga disenyo ng generator at discriminator.

Tiyak na napansin mo na ang mga GAN ay hindi na tinatalakay kapag ang paksa ng pagbuo ng imahe ay lumabas. Pagkatapos ng pagsasabog ng mga modelo tulad ng Stable Diffusion lumitaw, ang mga GAN kahit papaano ay umatras sa background. Ito ay dahil mahirap silang magsanay at madalas na mabaligtad. Ang tanging pakinabang ng mga GAN ay, hindi tulad ng mga modelo ng pagsasabog, gumagawa sila ng isang imahe sa isang solong pagtakbo (isang "forward pass") sa halip na maraming pagtakbo.

StyleGAN-T: Ang pinakamabilis na pagbuo ng text-to-image sa mas mababa sa 0.1 segundo

Ngunit ngayon ay isang bagong manlalaro mula sa mga GAN ang pumasok sa larangan: StyleGAN-T. Ang GAN na ito para sa pagbuo ng tex-to-image ay mabilis na gumagawa ng magagandang resulta, dahil tumatagal lamang ito ng 0.1 segundo para sa isang 512×512 na larawan. Ang bagong arkitektura ay batay sa StyleGAN-XL, ngunit muling sinusuri nito ang generator at mga disenyo ng discriminator at gumagamit ng CLIP para sa pag-align ng prompt ng teksto at mga nabuong graphics.

Kaugnay na artikulo: VToonify: Isang real-time na modelo ng AI para sa pagbuo ng mga artistikong portrait na video

Sa pangkalahatan, ang StyleGAN-T ay lumilikha na ngayon ng text-to-image nang mas mabilis at mas tumpak kaysa sa iba pang mga GAN. Gayunpaman, ang GAN ay kakila-kilabot pa rin at ang kalidad ng full-size na modelo ng SD ay malinaw na wala sa tanong. Ngunit ang lahat ay magdedepende sa kakayahang gumawa ng napakataas na kalidad ng mga larawan mula sa teksto nang wala pang isang segundo sa isang taon. Bukod pa rito, mahuhulog ito sa isang lugar sa pagitan ng GAN at ng modelo ng pagsasabog.

StyleGAN-T na arkitektura
StyleGAN-T na arkitektura

Magbasa pa tungkol sa AI:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa

Ang Mga Tagapagtatag ng Samourai Wallet ay Inakusahan na Nagpapadali ng $2B sa Darknet Deals

Ang pangamba ng mga tagapagtatag ng Samourai Wallet ay kumakatawan sa isang kapansin-pansing pag-urong para sa industriya, na binibigyang-diin ang patuloy na ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Ang Pantera Capital ay Namumuhunan Sa TON Blockchain, Nagpahayag ng Kumpiyansa Sa Potensyal ng Telegram na Palawakin ang Accessibility ng Crypto
Negosyo Ulat sa Balita Teknolohiya
Ang Pantera Capital ay Namumuhunan Sa TON Blockchain, Nagpahayag ng Kumpiyansa Sa Potensyal ng Telegram na Palawakin ang Accessibility ng Crypto
Mayo 2, 2024
Ang Mitosis ay Nagtaas ng $7M Sa Pagpopondo Mula sa Amber Group At Foresight Ventures Upang Isulong ang Modular Liquidity Protocol Nito
Negosyo Ulat sa Balita Teknolohiya
Ang Mitosis ay Nagtaas ng $7M Sa Pagpopondo Mula sa Amber Group At Foresight Ventures Upang Isulong ang Modular Liquidity Protocol Nito
Mayo 2, 2024
Nakipagtulungan ang Galxe Sa Jambo Para Palawakin ang Global Accessibility To Web3
Negosyo Ulat sa Balita Teknolohiya
Nakipagtulungan ang Galxe Sa Jambo Para Palawakin ang Global Accessibility To Web3
Mayo 2, 2024
Nakahanda ang Med-Gemini ng Google na Magsimula sa GPT-4 Sa Superior na Pagganap nito sa Pangangalagang Pangkalusugan
AI Wiki Balita software Teknolohiya
Nakahanda ang Med-Gemini ng Google na Magsimula sa GPT-4 Sa Superior na Pagganap nito sa Pangangalagang Pangkalusugan
Mayo 2, 2024
CRYPTOMERIA LABS PTE. LTD.