Raport aktualności Technologia
24 stycznia 2023 r.

StyleGAN-T: Najszybsze generowanie tekstu na obraz, które daje wyniki w czasie krótszym niż 0.1 sekundy

W skrócie

StyleGAN-T to nowy GAN do generowania tex2image.

Ten GAN daje dobre wyniki i jest nawet dość szybki (0.1 s dla obrazu 512×512).

Nowa architektura jest oparta na StyleGAN-XL, ale ponownie ocenia projekty generatora i dyskryminatora.

Z pewnością zauważyłeś, że sieci GAN nie są już omawiane, gdy pojawia się temat generowania obrazu. Modele po dyfuzji, takie jak Stable Diffusion pojawiły się, GANy jakoś zniknęły w tle. To dlatego, że są trudne do trenowania i często się potykają. Jedyną zaletą sieci GAN było to, że w przeciwieństwie do modeli dyfuzyjnych tworzą one obraz w jednym przebiegu („przebieg do przodu”) zamiast wielu przebiegów.

StyleGAN-T: Najszybsze generowanie tekstu na obraz w mniej niż 0.1 sekundy

Ale teraz nowy gracz z GAN wszedł na boisko: StylGAN-T. Ten GAN do generowania tekstu na obraz szybko daje dobre wyniki, ponieważ zajmuje tylko 0.1 sekundy dla obrazu 512×512. Nowa architektura jest oparta na StyleGAN-XL, ale ponownie ocenia projekty generatora i dyskryminatora oraz wykorzystuje CLIP do wyrównania podpowiedzi tekstowych i generowanej grafiki.

Podobne artykuły: VToonify: Model sztucznej inteligencji w czasie rzeczywistym do generowania artystycznych portretów wideo

Ogólnie rzecz biorąc, StyleGAN-T umożliwia teraz zamianę tekstu na obraz szybciej i dokładniej niż inne sieci GAN. Jednak GAN jest nadal okropny i jakość pełnowymiarowego modelu SD oczywiście nie wchodzi w rachubę. Wszystko będzie jednak zależeć od możliwości tworzenia obrazów z tekstu o niezwykle wysokiej jakości w mniej niż sekundę w ciągu roku. Dodatkowo będzie znajdować się gdzieś pomiędzy GAN a model dyfuzyjny.

Styl architektury GAN-T
Styl architektury GAN-T

Przeczytaj więcej o sztucznej inteligencji:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Hot Stories
Dołącz do naszego newslettera.
Najnowsze wieści

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej

Założyciele portfela Samourai oskarżeni o ułatwianie transakcji o wartości 2 miliardów dolarów w Darknet

Zaniepokojenie założycieli Samourai Wallet stanowi wyraźną porażkę dla branży, podkreślając utrzymujące się...

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Pantera Capital inwestuje w TON Blockchain i wyraża zaufanie w potencjał Telegramu w zakresie zwiększania dostępności kryptowalut
Biznes Raport aktualności Technologia
Pantera Capital inwestuje w TON Blockchain i wyraża zaufanie w potencjał Telegramu w zakresie zwiększania dostępności kryptowalut
2 maja 2024 r.
Mitosis pozyskuje fundusze o wartości 7 mln dolarów od Amber Group i przedsięwzięć Foresight w celu udoskonalenia swojego modułowego protokołu płynności
Biznes Raport aktualności Technologia
Mitosis pozyskuje fundusze o wartości 7 mln dolarów od Amber Group i przedsięwzięć Foresight w celu udoskonalenia swojego modułowego protokołu płynności
2 maja 2024 r.
Galxe współpracuje z Jambo, aby rozszerzyć globalną dostępność Web3
Biznes Raport aktualności Technologia
Galxe współpracuje z Jambo, aby rozszerzyć globalną dostępność Web3
2 maja 2024 r.
Med-Gemini firmy Google gotowy dać przewagę GPT-4 Dzięki doskonałej wydajności w opiece zdrowotnej
AI Wiki Aktualności Tworzenie Technologia
Med-Gemini firmy Google gotowy dać przewagę GPT-4 Dzięki doskonałej wydajności w opiece zdrowotnej
2 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.