דיווח חדשות טכנולוגיה
ינואר 03, 2024

AI Startup MyShell משחרר את אלגוריתם OpenVoice עבור שיבוט קול מדויק

בקיצור

חברת הסטארט-אפ הקנדי MyShell הודיעה על מקורות פתוחים של אלגוריתם OpenVoice לשיבוט קול מיידי.

AI Startup MyShell משחרר את אלגוריתם OpenVoice עבור שיבוט קול מדויק

ריספקר, Voicemod ו ElevenLabs - לכל שלושת הסטארט-אפים יש דבר אחד במשותף - כולם מספקים אלגוריתמים ותוכנת בינה מלאכותית לייצור שיבוטים קוליים. עכשיו, שחקן חדש, סטארט-אפ קנדי ​​בינה מלאכותית MyShell הודיעה שהיא רכשה קוד פתוח אלגוריתם OpenVoice שלה לשכפול קול מיידי.

MyShell שיתפה את העדכון ב- פלטפורמת מדיה חברתית X ואמר, "שכפל קולות בדיוק שאין שני לו, עם שליטה גרעינית של הטון, מרגש ועד מבטא, קצב, הפסקות ואינטונציה, תוך שימוש בקליפ שמע קטן בלבד."

במסגרת שיתוף הפעולה, חוקרים מ-MIT, MyShell.ai ואוניברסיטת Tsinghua חשפו את OpenVoice, שיכולה לשכפל קול של דובר וליצור דיבור ב שפות מרובות, באמצעות קטע שמע קצר בלבד מהמקור המקורי. זה גם לוכד את הטון והצבע הייחודיים של קול הדובר.

לדברי החברה, האלגוריתם מוסיף אלמנטים סגנוניים מכריעים כמו רגש, מבטא, קצב, הפסקות ואינטונציה. אלמנטים אלו חיוניים להפיכת הדיבור להישמע אמיתי וליצירת שיחות מעניינות. זה עוזר למנוע את הצליל המשעמם שאתה מקבל לעתים קרובות עם טקסט לדיבור רגיל.

כיצד פועל מודל הבינה המלאכותית של שיבוט קול

ב עבודת מחקר, OpenVoice שיתפה את המתודולוגיה מאחורי ה-AI של שיבוט קולי. OpenVoice מורכבת משניים נפרדים דגמי AI: מודל טקסט לדיבור (TTS) ו"ממיר צלילים".

המודל יכול לנהל פרמטרים של סגנון ושפות, ועבר "אימון באמצעות 30,000 משפטים" מאנגלית (במבטא אמריקאי ובריטי כאחד), דוברי סינית ויפנית. האימון כלל תיוג של הדגימות על סמך הרגשות המובעים, והמודל למד אינטונציה, קצב והפוגות מקטעי אודיו אלה.

מצד שני, מודל ממיר הגוונים הוכשר על מערך נתונים עצום של למעלה מ-300,000 דגימות אודיו מיותר מ-20,000 רמקולים שונים. בשני המקרים, אודיו של דיבור אנושי הומר לפונמות - צלילים ספציפיים המבדילים בין מילים - ויוצג באמצעות הטבעות וקטוריות.

מודל ה-TTS, באמצעות "רמקול בסיס", משתלב עם הטון הנגזר מהשמע המוקלט של המשתמש בתהליך האימון. יחד, שני הדגמים הללו יכולים לשכפל את קולו של המשתמש ולשנות את צבע הטון - הביטוי הרגשי המועבר בטקסט המדובר.

הסטארט-אפ נוסד בשנת 2023. בשנה שעברה גייסה MyShell 5.6 מיליון דולר במימון ראשוני, בהובלת INCE Capital, וראתה השתתפותם של משקיעים בולטים כמו Folius Ventures, Hashkey Capital, SevenX Ventures, TSVC ו-OP Crypto, בין היתר.

לדברי החברה, המימון יסייע בקידום הקניין דגמי AI, יצירת סטודיו ליוצרים המותאם לאפליקציות מקוריות בינה מלאכותית, והקמת מערכת אקולוגית תוססת של יוצרים בתחום טכנולוגיית הבלוקצ'יין.

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

קומאר הוא עיתונאי טכנולוגי מנוסה עם התמחות בצמתים דינמיים של AI/ML, טכנולוגיית שיווק ותחומים מתפתחים כמו קריפטו, בלוקצ'יין ו NFTס. עם ניסיון של למעלה מ-3 שנים בתעשייה, קומאר ביסס רקורד מוכח ביצירת נרטיבים מרתקים, ביצוע ראיונות מעוררי תובנות ומתן תובנות מקיפות. המומחיות של קומאר טמונה בהפקת תוכן בעל השפעה גבוהה, כולל מאמרים, דוחות ופרסומי מחקר עבור פלטפורמות בולטות בתעשייה. עם מערך מיומנויות ייחודי המשלב ידע טכני וסיפור סיפורים, קומאר מצטיין בהעברת מושגים טכנולוגיים מורכבים לקהלים מגוונים בצורה ברורה ומרתקת.

מאמרים נוספים
קומאר גנדהרב
קומאר גנדהרב

קומאר הוא עיתונאי טכנולוגי מנוסה עם התמחות בצמתים דינמיים של AI/ML, טכנולוגיית שיווק ותחומים מתפתחים כמו קריפטו, בלוקצ'יין ו NFTס. עם ניסיון של למעלה מ-3 שנים בתעשייה, קומאר ביסס רקורד מוכח ביצירת נרטיבים מרתקים, ביצוע ראיונות מעוררי תובנות ומתן תובנות מקיפות. המומחיות של קומאר טמונה בהפקת תוכן בעל השפעה גבוהה, כולל מאמרים, דוחות ופרסומי מחקר עבור פלטפורמות בולטות בתעשייה. עם מערך מיומנויות ייחודי המשלב ידע טכני וסיפור סיפורים, קומאר מצטיין בהעברת מושגים טכנולוגיים מורכבים לקהלים מגוונים בצורה ברורה ומרתקת.

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
המעבר של דונלד טראמפ לקריפטו: מיריב לעורך דין, ומה זה אומר על שוק המטבעות הקריפטוגרפיים בארה"ב
עסקים שוקי סיפורים וסקירות טכנולוגיה
המעבר של דונלד טראמפ לקריפטו: מיריב לעורך דין, ומה זה אומר על שוק המטבעות הקריפטוגרפיים בארה"ב
מאי 10, 2024
Layer3 להשיק אסימון L3 בקיץ הקרוב, תוך הקצאת 51% מסך האספקה ​​לקהילה
שוקי דיווח חדשות טכנולוגיה
Layer3 להשיק אסימון L3 בקיץ הקרוב, תוך הקצאת 51% מסך האספקה ​​לקהילה
מאי 10, 2024
האזהרה האחרונה של אדוארד סנודן למפתחי ביטקוין: "הפוך את הפרטיות לעדיפות ברמת הפרוטוקול או הסיכון לאבד אותה
שוקי אבטחה Wiki תוכנה סיפורים וסקירות טכנולוגיה
האזהרה האחרונה של אדוארד סנודן למפתחי ביטקוין: "הפוך את הפרטיות לעדיפות ברמת הפרוטוקול או הסיכון לאבד אותה
מאי 10, 2024
רשת Ethereum Layer 2 מונעת אופטימיות תשיק את הרשת המרכזית שלה ב-15 במאי
דיווח חדשות טכנולוגיה
רשת Ethereum Layer 2 מונעת אופטימיות תשיק את הרשת המרכזית שלה ב-15 במאי
מאי 10, 2024
CRYPTOMERIA LABS PTE. בע"מ.