דיווח חדשות טכנולוגיה
ינואר 08, 2023

VALL-E: מודל הטקסט-לדיבור החדש של מיקרוסופט יכול לשכפל את הקול של כולם בשלוש שניות

בקיצור

עם דגימה של שלוש שניות בלבד מכל קול, דגם ה-TTS מבוסס השנאים VALL-E יכול להפיק דיבור בכל קול.

זוהי התקדמות משמעותית בכיוון של מערכות TTS בעלות סאונד טבעי יותר.

עם זאת, מיקרוסופט סיפקה כמה דוגמאות של המודל שנמצא בשימוש, וניכר שזה מייצג התפתחות משמעותית בטכנולוגיית TTS.

מאז פרסום מודל הטקסט לדיבור (TTS) הראשון, חוקרים חיפשו דרכים לשפר את האופן שבו מערכות אלו מייצרות דיבור. הדגם האחרון מבית מיקרוסופט, עֶמֶק, מהווה צעד משמעותי קדימה בהקשר זה.

VALL-E הוא מודל TTS מבוסס שנאי שיכול ליצור דיבור בכל קול לאחר שמיעת דגימה של שלוש שניות בלבד של הקול הזה. מדובר בשיפור משמעותי לעומת דגמים קודמים, שדרשו תקופת הכשרה ארוכה בהרבה על מנת לייצר קול חדש.

VALL-E הוא הישג טכנולוגי מדהים שיש לו פוטנציאל לשנות את הדרך בה אנו מתקשרים עם מדיה דיגיטלית.
כתבות קשורות: מיקרוסופט פרסמה מודל דיפוזיה שיכול לבנות אווטאר תלת מימד מתמונה בודדת של אדם

בנוסף, האינטונציה, הכריזמה והסגנון של הקול נשמרים ללא פגע בדיבור שנוצר. זהו צעד חשוב קדימה בהפיכת מערכות TTS להישמע טבעיות יותר.

דגם זה מבוסס שנאי ובעל מראה של Dale-1. לא להתבלבל עם Dalle-2 מבוסס דיפוזיה. הקוד עדיין חסר. ולמשתמשים יש ספקנות שהם יפרסמו את זה.

כתבות קשורות: נראה כי VALL-E של מיקרוסופט היא תוכנת ההונאה המסוכנת ביותר אי פעם

עם זאת, מיקרוסופט פרסמה כמה דוגמאות של הדגם בפעולה, וברור שמדובר בהתקדמות גדולה בטכנולוגיית ה-TTS.

דוגמה # 1:

דוגמא #2:

דוגמה # 3:

קרא עוד על AI:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר

מייסדי ארנק סמוראי הואשמו בהנחיית 2 מיליארד דולר בעסקאות Darknet

החשש של מייסדי ארנק סמוראי מייצג כישלון בולט עבור התעשייה, המדגיש את ...

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קרא עוד
Galxe משתפת פעולה עם Jambo כדי להרחיב את הנגישות הגלובלית ל Web3
עסקים דיווח חדשות טכנולוגיה
Galxe משתפת פעולה עם Jambo כדי להרחיב את הנגישות הגלובלית ל Web3
מאי 2, 2024
ה-Med-Gemini של גוגל מוכנה לתת ראש בראש GPT-4 עם ביצועים מעולים בתחום הבריאות
AI Wiki חֲדָשׁוֹת תוכנה טכנולוגיה
ה-Med-Gemini של גוגל מוכנה לתת ראש בראש GPT-4 עם ביצועים מעולים בתחום הבריאות
מאי 2, 2024
חבר המועצה המחוקקת של הונג קונג Wu Jiezhuang מאותתת תביעה אזרחית נגד JPEX Crypto Exchange
עסקים דיווח חדשות טכנולוגיה
חבר המועצה המחוקקת של הונג קונג Wu Jiezhuang מאותתת תביעה אזרחית נגד JPEX Crypto Exchange
מאי 2, 2024
AltLayer נכנסת לשלב שני של יוזמת ההימור שלה, מציגה את אסימון reALT
שוקי דיווח חדשות טכנולוגיה
AltLayer נכנסת לשלב שני של יוזמת ההימור שלה, מציגה את אסימון reALT
מאי 2, 2024
CRYPTOMERIA LABS PTE. בע"מ.