StyleGAN-T: היצירה המהירה ביותר של טקסט לתמונה שמפיקה תוצאות בפחות מ-0.1 שניה
בקיצור
StyleGAN-T הוא GAN חדש ליצירת tex2image.
GAN זה מייצר תוצאות טובות ואפילו די מהיר (0.1 שניות לתמונה 512×512).
הארכיטקטורה החדשה מבוססת על StyleGAN-XL, אך היא מעריכה מחדש את עיצובי המחולל והאבחנה.
בוודאי שמתם לב ש-GAN כבר לא נדון כאשר הנושא של יצירת תמונות עולה. לאחר דיפוזיה מודלים כמו Stable Diffusion הגיחו, GANs איכשהו נסוגו אל הרקע. הסיבה לכך היא שהם מאתגרים להתאמן ולעתים קרובות נדדו. היתרון היחיד של GANs היה שבניגוד למודלים של דיפוזיה, הם מייצרים תמונה בריצה אחת ("מעבר קדימה") במקום ריצות רבות.
אבל עכשיו שחקן חדש מה-GANs נכנס למגרש: StyleGAN-T. GAN זה ליצירת טקסט לתמונה מייצר תוצאות טובות במהירות, מכיוון שלוקח רק 0.1 שניות לתמונה 512×512. הארכיטקטורה החדשה מבוססת על StyleGAN-XL, אך היא מעריכה מחדש את עיצובי המחולל והאבחנה ומשתמשת ב-CLIP ליישור הודעות טקסט וגרפיקה שנוצרה.
כתבות קשורות: VToonify: מודל AI בזמן אמת להפקת סרטוני דיוקן אומנותיים |
באופן כללי, StyleGAN-T יוצר כעת טקסט לתמונה מהר יותר ומדויק יותר מ-GANs אחרים. עם זאת, GAN עדיין איומה והאיכות של דגם ה-SD בגודל מלא אינה באה בחשבון. אבל הכל יהיה תלוי ביכולת להפיק תמונות באיכות גבוהה מטקסט תוך פחות משנייה בשנה. בנוסף, זה ייפול איפשהו בין GAN ל- מודל דיפוזיה.
קרא עוד על AI:
כתב ויתור
בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.
על המחבר
דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.
מאמרים נוספיםדמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.