דיווח חדשות טכנולוגיה
ינואר 08, 2023

VALL-E: מודל הטקסט-לדיבור החדש של מיקרוסופט יכול לשכפל את הקול של כולם בשלוש שניות

בקיצור

עם דגימה של שלוש שניות בלבד מכל קול, דגם ה-TTS מבוסס השנאים VALL-E יכול להפיק דיבור בכל קול.

זוהי התקדמות משמעותית בכיוון של מערכות TTS בעלות סאונד טבעי יותר.

עם זאת, מיקרוסופט סיפקה כמה דוגמאות של המודל שנמצא בשימוש, וניכר שזה מייצג התפתחות משמעותית בטכנולוגיית TTS.

מאז פרסום מודל הטקסט לדיבור (TTS) הראשון, חוקרים חיפשו דרכים לשפר את האופן שבו מערכות אלו מייצרות דיבור. הדגם האחרון מבית מיקרוסופט, עֶמֶק, מהווה צעד משמעותי קדימה בהקשר זה.

VALL-E הוא מודל TTS מבוסס שנאי שיכול ליצור דיבור בכל קול לאחר שמיעת דגימה של שלוש שניות בלבד של הקול הזה. מדובר בשיפור משמעותי לעומת דגמים קודמים, שדרשו תקופת הכשרה ארוכה בהרבה על מנת לייצר קול חדש.

VALL-E הוא הישג טכנולוגי מדהים שיש לו פוטנציאל לשנות את הדרך בה אנו מתקשרים עם מדיה דיגיטלית.
כתבות קשורות: מיקרוסופט פרסמה מודל דיפוזיה שיכול לבנות אווטאר תלת מימד מתמונה בודדת של אדם

בנוסף, האינטונציה, הכריזמה והסגנון של הקול נשמרים ללא פגע בדיבור שנוצר. זהו צעד חשוב קדימה בהפיכת מערכות TTS להישמע טבעיות יותר.

דגם זה מבוסס שנאי ובעל מראה של Dale-1. לא להתבלבל עם Dalle-2 מבוסס דיפוזיה. הקוד עדיין חסר. ולמשתמשים יש ספקנות שהם יפרסמו את זה.

כתבות קשורות: נראה כי VALL-E של מיקרוסופט היא תוכנת ההונאה המסוכנת ביותר אי פעם

עם זאת, מיקרוסופט פרסמה כמה דוגמאות של הדגם בפעולה, וברור שמדובר בהתקדמות גדולה בטכנולוגיית ה-TTS.

דוגמה # 1:

דוגמא #2:

דוגמה # 3:

קרא עוד על AI:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
Binance של חילופי קריפטו להשיק צמדי מסחר חדשים ולאפשר בוטים למסחר ב-8 במאי
שוקי דיווח חדשות טכנולוגיה
Binance של חילופי קריפטו להשיק צמדי מסחר חדשים ולאפשר בוטים למסחר ב-8 במאי
מאי 7, 2024
Stacks, Moonriver Network, Hedera ו-Iron Fish ישתתפו בתוכנית המגבר הבין-צ'יין של אקסלר
דיווח חדשות טכנולוגיה
Stacks, Moonriver Network, Hedera ו-Iron Fish ישתתפו בתוכנית המגבר הבין-צ'יין של אקסלר
מאי 7, 2024
טסלה מחבקת את Dogecoin: חיזוק משמעותי עבור מטבע ה-Meme כפי שהוא הופך לאפשרות תשלום בחנות המקוונת של טסלה
שוקי סיפורים וסקירות טכנולוגיה
טסלה מחבקת את Dogecoin: חיזוק משמעותי עבור מטבע ה-Meme כפי שהוא הופך לאפשרות תשלום בחנות המקוונת של טסלה
מאי 7, 2024
Morph מציגה את Holesky Testnet שלה עם שילוב zkEVM אופטימי, מנגנון גשר ותכונות רשת רצף מבוזרת
דיווח חדשות טכנולוגיה
Morph מציגה את Holesky Testnet שלה עם שילוב zkEVM אופטימי, מנגנון גשר ותכונות רשת רצף מבוזרת
מאי 6, 2024
CRYPTOMERIA LABS PTE. בע"מ.