AI Startup MyShell משחרר את אלגוריתם OpenVoice עבור שיבוט קול מדויק
בקיצור
חברת הסטארט-אפ הקנדי MyShell הודיעה על מקורות פתוחים של אלגוריתם OpenVoice לשיבוט קול מיידי.
ריספקר, Voicemod ו ElevenLabs - לכל שלושת הסטארט-אפים יש דבר אחד במשותף - כולם מספקים אלגוריתמים ותוכנת בינה מלאכותית לייצור שיבוטים קוליים. עכשיו, שחקן חדש, סטארט-אפ קנדי בינה מלאכותית MyShell הודיעה שהיא רכשה קוד פתוח אלגוריתם OpenVoice שלה לשכפול קול מיידי.
MyShell שיתפה את העדכון ב- פלטפורמת מדיה חברתית X ואמר, "שכפל קולות בדיוק שאין שני לו, עם שליטה גרעינית של הטון, מרגש ועד מבטא, קצב, הפסקות ואינטונציה, תוך שימוש בקליפ שמע קטן בלבד."
במסגרת שיתוף הפעולה, חוקרים מ-MIT, MyShell.ai ואוניברסיטת Tsinghua חשפו את OpenVoice, שיכולה לשכפל קול של דובר וליצור דיבור ב שפות מרובות, באמצעות קטע שמע קצר בלבד מהמקור המקורי. זה גם לוכד את הטון והצבע הייחודיים של קול הדובר.
לדברי החברה, האלגוריתם מוסיף אלמנטים סגנוניים מכריעים כמו רגש, מבטא, קצב, הפסקות ואינטונציה. אלמנטים אלו חיוניים להפיכת הדיבור להישמע אמיתי וליצירת שיחות מעניינות. זה עוזר למנוע את הצליל המשעמם שאתה מקבל לעתים קרובות עם טקסט לדיבור רגיל.
כיצד פועל מודל הבינה המלאכותית של שיבוט קול
ב עבודת מחקר, OpenVoice שיתפה את המתודולוגיה מאחורי ה-AI של שיבוט קולי. OpenVoice מורכבת משניים נפרדים דגמי AI: מודל טקסט לדיבור (TTS) ו"ממיר צלילים".
המודל יכול לנהל פרמטרים של סגנון ושפות, ועבר "אימון באמצעות 30,000 משפטים" מאנגלית (במבטא אמריקאי ובריטי כאחד), דוברי סינית ויפנית. האימון כלל תיוג של הדגימות על סמך הרגשות המובעים, והמודל למד אינטונציה, קצב והפוגות מקטעי אודיו אלה.
מצד שני, מודל ממיר הגוונים הוכשר על מערך נתונים עצום של למעלה מ-300,000 דגימות אודיו מיותר מ-20,000 רמקולים שונים. בשני המקרים, אודיו של דיבור אנושי הומר לפונמות - צלילים ספציפיים המבדילים בין מילים - ויוצג באמצעות הטבעות וקטוריות.
מודל ה-TTS, באמצעות "רמקול בסיס", משתלב עם הטון הנגזר מהשמע המוקלט של המשתמש בתהליך האימון. יחד, שני הדגמים הללו יכולים לשכפל את קולו של המשתמש ולשנות את צבע הטון - הביטוי הרגשי המועבר בטקסט המדובר.
הסטארט-אפ נוסד בשנת 2023. בשנה שעברה גייסה MyShell 5.6 מיליון דולר במימון ראשוני, בהובלת INCE Capital, וראתה השתתפותם של משקיעים בולטים כמו Folius Ventures, Hashkey Capital, SevenX Ventures, TSVC ו-OP Crypto, בין היתר.
לדברי החברה, המימון יסייע בקידום הקניין דגמי AI, יצירת סטודיו ליוצרים המותאם לאפליקציות מקוריות בינה מלאכותית, והקמת מערכת אקולוגית תוססת של יוצרים בתחום טכנולוגיית הבלוקצ'יין.
כתב ויתור
בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.
על המחבר
קומאר הוא עיתונאי טכנולוגי מנוסה עם התמחות בצמתים דינמיים של AI/ML, טכנולוגיית שיווק ותחומים מתפתחים כמו קריפטו, בלוקצ'יין ו NFTס. עם ניסיון של למעלה מ-3 שנים בתעשייה, קומאר ביסס רקורד מוכח ביצירת נרטיבים מרתקים, ביצוע ראיונות מעוררי תובנות ומתן תובנות מקיפות. המומחיות של קומאר טמונה בהפקת תוכן בעל השפעה גבוהה, כולל מאמרים, דוחות ופרסומי מחקר עבור פלטפורמות בולטות בתעשייה. עם מערך מיומנויות ייחודי המשלב ידע טכני וסיפור סיפורים, קומאר מצטיין בהעברת מושגים טכנולוגיים מורכבים לקהלים מגוונים בצורה ברורה ומרתקת.
מאמרים נוספיםקומאר הוא עיתונאי טכנולוגי מנוסה עם התמחות בצמתים דינמיים של AI/ML, טכנולוגיית שיווק ותחומים מתפתחים כמו קריפטו, בלוקצ'יין ו NFTס. עם ניסיון של למעלה מ-3 שנים בתעשייה, קומאר ביסס רקורד מוכח ביצירת נרטיבים מרתקים, ביצוע ראיונות מעוררי תובנות ומתן תובנות מקיפות. המומחיות של קומאר טמונה בהפקת תוכן בעל השפעה גבוהה, כולל מאמרים, דוחות ופרסומי מחקר עבור פלטפורמות בולטות בתעשייה. עם מערך מיומנויות ייחודי המשלב ידע טכני וסיפור סיפורים, קומאר מצטיין בהעברת מושגים טכנולוגיים מורכבים לקהלים מגוונים בצורה ברורה ומרתקת.