Google AI הכריזה על מחולל הטקסט למוזיקה הראשון אי פעם AudioLM
בקיצור
AudioLM יכול להפיק מוזיקה רק על ידי האזנה לצלילים
Mubert AI להמשך דיבור אנושי ומוזיקת פסנתר
עם GPT-3 ואחרים, לרעיון של AI גנרטיבי יש סיכוי טוב להתקדם. גילינו גם את המושגים של ציור וציור חוץ; בינה מלאכותית משלימה את התמונות במיומנות תוך שמירה על הנושא והסגנון. מה עם מוזיקה?
ועוד פעם! מכיוון שכל זה מבוסס על מודלים של שפות בינה מלאכותית ששומרים על משמעות, זה היה רק עניין של זמן עד שהטכנולוגיה הזו תיושם במוזיקה. ועכשיו הגיע הזמן.
על פי מחקר עדכני של גוגל, ניתן ללמד מסגרת חדשה להפקת אודיו בשם AudioLM ליצור דיבור מציאותי ומוסיקת פסנתר פשוט על ידי האזנה לצלילים. בשל העקביות ארוכת הטווח והנאמנות המצוינת שלה, AudioLM עולה על מערכות קודמות ומקדמת יצירת אודיו עם יישומים בסינתזה קולית ומוזיקה בעזרת מחשב.
AudioLM מ-Google AI יכול להרחיב מעבר אקוסטי תוך שמירה על "כוונה". נכון לעכשיו, הוא הוכשר להמשיך בדיבור אנושי ומוזיקת פסנתר, בהתבסס על מדגם מוגבל של נתוני קלט. בדוק את הדוגמה למטה.
הקריטריונים לדיבור היו פשוטים: המאזינים התבקשו להעריך אם ההמשך נשמע כמו דיבור אנושי. עם המוזיקה, התגלה כי ה"המשך" של הקטע המסופק לקלט הוא באיכות טובה בהרבה מכל מחוללי המוזיקה הנוכחיים מאפס, כגון מָקוֹל אוֹטוֹמָטִי. עם הצעה בכניסה, הבינה המלאכותית ממשיכה את המוזיקה בצורה הרבה יותר טובה.
מדרגים אנושיים האזינו לדגימות אודיו כדי לאשר את התוצאות. הם קבעו אם הם שומעים המשך אמיתי של קול אנושי שהוקלט או קול מלאכותי שהופק על ידי AudioLM. הנתונים שלהם מצביעים על שיעור הצלחה של 51.2%. כתוצאה מכך, זה יהיה מאתגר עבור המאזין הממוצע להבחין בין דיבור המופק על ידי AudioLM לבין דיבור אנושי בפועל.
האם טכנולוגיית טקסט למוזיקה משנה את עסקי המוזיקה?
מחולל טקסט למוזיקה המבוסס על Mubert API הוכרז לאחרונה על ידי דגם AI אחר, Mubert. Mubert יוצר קבוצה שונה של צלילים עבור כל בקשה שאתה שולח. הסבירות לחזרה היא ממש קלושה. מוזיקה נוצרת כאשר מתקבלת בקשה; זה לא נשלף ממסד נתונים של מנגינות גמורות. כמה באמת מחולל המוזיקה הזו היא שאלה נפוצה.
צלילים נבחרים לפני יצירתם. גם הוראת הקלט וגם תגיות ה-API של Mubert מקודדות לווקטור המרחב הסמוי של רשת עצבית שנאי. לאחר מכן נבחר וקטור התגים הקרוב ביותר עבור כל שאילתה, והתגים הנלווים מועברים ל-API שלנו כדי ליצור מוזיקה. לא נעשה שימוש ברשת עצבית לבניית אף אחד מהצלילים (לולאות נפרדות לבס, לידים וכו'); כל הצלילים הופקו על ידי מוזיקאים ומעצבי סאונד.
הצעד המשמעותי הבא של מוברט הוא לקחת פריטים מהעולם הנוכחי, כמו תמונות, סרטים, תרחישים ומצגות, וליצור את המוזיקה של העולם סביבך.
הנה מה שאתה יכול להשיג על ידי הכנסת הודעות טקסט בפזיזות לפיו של המחזמר Mubert AI:
זהו השלב הראשוני בתהליך בניית אלגוריתם ייצור מתוחכם ומדויק יותר, אך זה ייקח זמן וכסף.
עם זאת, טכנולוגיית טקסט למוזיקה כבר זמינה, כך שתוכל ליצור אלבומים בכמויות גדולות על ידי החלפת "הנחיית קלט" עבור "כתוב סקריפט הנחיה אקראי". נראה שכבר אין צורך באמנים.
קרא עוד חדשות קשורות:
כתב ויתור
בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.
על המחבר
דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.
מאמרים נוספיםדמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט.