דיווח חדשות
אוקטובר 21, 2022

Google AI הכריזה על מחולל הטקסט למוזיקה הראשון אי פעם AudioLM

בקיצור

AudioLM יכול להפיק מוזיקה רק על ידי האזנה לצלילים

Mubert AI להמשך דיבור אנושי ומוזיקת ​​פסנתר

עם GPT-3 ואחרים, לרעיון של AI גנרטיבי יש סיכוי טוב להתקדם. גילינו גם את המושגים של ציור וציור חוץ; בינה מלאכותית משלימה את התמונות במיומנות תוך שמירה על הנושא והסגנון. מה עם מוזיקה?

ועוד פעם! מכיוון שכל זה מבוסס על מודלים של שפות בינה מלאכותית ששומרים על משמעות, זה היה רק ​​עניין של זמן עד שהטכנולוגיה הזו תיושם במוזיקה. ועכשיו הגיע הזמן.

Google AI הכריזה על מחולל הטקסט למוזיקה הראשון אי פעם AudioLM

על פי מחקר עדכני של גוגל, ניתן ללמד מסגרת חדשה להפקת אודיו בשם AudioLM ליצור דיבור מציאותי ומוסיקת פסנתר פשוט על ידי האזנה לצלילים. בשל העקביות ארוכת הטווח והנאמנות המצוינת שלה, AudioLM עולה על מערכות קודמות ומקדמת יצירת אודיו עם יישומים בסינתזה קולית ומוזיקה בעזרת מחשב.

פיתחנו מערכת לזיהוי צלילים סינתטיים שהופקו על ידי AudioLM תוך שימוש באותם מושגי AI שעמדו בבסיס היצירה של הדגמים הקודמים שלנו.

AudioLM מ-Google AI יכול להרחיב מעבר אקוסטי תוך שמירה על "כוונה". נכון לעכשיו, הוא הוכשר להמשיך בדיבור אנושי ומוזיקת ​​פסנתר, בהתבסס על מדגם מוגבל של נתוני קלט. בדוק את הדוגמה למטה.

הקריטריונים לדיבור היו פשוטים: המאזינים התבקשו להעריך אם ההמשך נשמע כמו דיבור אנושי. עם המוזיקה, התגלה כי ה"המשך" של הקטע המסופק לקלט הוא באיכות טובה בהרבה מכל מחוללי המוזיקה הנוכחיים מאפס, כגון מָקוֹל אוֹטוֹמָטִי. עם הצעה בכניסה, הבינה המלאכותית ממשיכה את המוזיקה בצורה הרבה יותר טובה.

Google AI הכריזה על מחולל הטקסט למוזיקה הראשון אי פעם AudioLM

מדרגים אנושיים האזינו לדגימות אודיו כדי לאשר את התוצאות. הם קבעו אם הם שומעים המשך אמיתי של קול אנושי שהוקלט או קול מלאכותי שהופק על ידי AudioLM. הנתונים שלהם מצביעים על שיעור הצלחה של 51.2%. כתוצאה מכך, זה יהיה מאתגר עבור המאזין הממוצע להבחין בין דיבור המופק על ידי AudioLM לבין דיבור אנושי בפועל.

האם טכנולוגיית טקסט למוזיקה משנה את עסקי המוזיקה?

מחולל טקסט למוזיקה המבוסס על Mubert API הוכרז לאחרונה על ידי דגם AI אחר, Mubert. Mubert יוצר קבוצה שונה של צלילים עבור כל בקשה שאתה שולח. הסבירות לחזרה היא ממש קלושה. מוזיקה נוצרת כאשר מתקבלת בקשה; זה לא נשלף ממסד נתונים של מנגינות גמורות. כמה באמת מחולל המוזיקה הזו היא שאלה נפוצה.

האם טכנולוגיית טקסט למוזיקה משנה את עסקי המוזיקה?

צלילים נבחרים לפני יצירתם. גם הוראת הקלט וגם תגיות ה-API של Mubert מקודדות לווקטור המרחב הסמוי של רשת עצבית שנאי. לאחר מכן נבחר וקטור התגים הקרוב ביותר עבור כל שאילתה, והתגים הנלווים מועברים ל-API שלנו כדי ליצור מוזיקה. לא נעשה שימוש ברשת עצבית לבניית אף אחד מהצלילים (לולאות נפרדות לבס, לידים וכו'); כל הצלילים הופקו על ידי מוזיקאים ומעצבי סאונד.

הצעד המשמעותי הבא של מוברט הוא לקחת פריטים מהעולם הנוכחי, כמו תמונות, סרטים, תרחישים ומצגות, וליצור את המוזיקה של העולם סביבך.

הנה מה שאתה יכול להשיג על ידי הכנסת הודעות טקסט בפזיזות לפיו של המחזמר Mubert AI:

זהו השלב הראשוני בתהליך בניית אלגוריתם ייצור מתוחכם ומדויק יותר, אך זה ייקח זמן וכסף.

עם זאת, טכנולוגיית טקסט למוזיקה כבר זמינה, כך שתוכל ליצור אלבומים בכמויות גדולות על ידי החלפת "הנחיית קלט" עבור "כתוב סקריפט הנחיה אקראי". נראה שכבר אין צורך באמנים.

קרא עוד חדשות קשורות:

כתב ויתור

בקנה אחד עם הנחיות פרויקט אמון, אנא שים לב שהמידע המסופק בדף זה אינו מיועד ואין לפרש אותו כייעוץ משפטי, מס, השקעות, פיננסי או כל צורה אחרת של ייעוץ. חשוב להשקיע רק את מה שאתה יכול להרשות לעצמך להפסיד ולפנות לייעוץ פיננסי עצמאי אם יש לך ספק. למידע נוסף, אנו מציעים להתייחס לתנאים ולהגבלות וכן לדפי העזרה והתמיכה שסופקו על ידי המנפיק או המפרסם. MetaversePost מחויבת לדיווח מדויק וחסר פניות, אך תנאי השוק עשויים להשתנות ללא הודעה מוקדמת.

על המחבר

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

מאמרים נוספים
דמיר יללוב
דמיר יללוב

דמיר הוא ראש הצוות, מנהל המוצר והעורך ב Metaverse Post, המכסה נושאים כגון AI/ML, AGI, LLMs, Metaverse ו Web3-בתחומים משיקים. המאמרים שלו מושכים קהל עצום של למעלה ממיליון משתמשים מדי חודש. נראה שהוא מומחה עם ניסיון של 10 שנים בקידום אתרים ושיווק דיגיטלי. דמיר הוזכר ב-Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ופרסומים אחרים. הוא נודד בין איחוד האמירויות, טורקיה, רוסיה וחבר העמים כנווד דיגיטלי. דמיר סיים תואר ראשון בפיזיקה, שלדעתו נתן לו את כישורי החשיבה הביקורתית הדרושים כדי להצליח בנוף המשתנה ללא הרף של האינטרנט. 

Hot Stories
הצטרף לניוזלטר שלנו.
חדשות אחרונות

התיאבון המוסדי גדל לקראת תעודות סל של ביטקוין על רקע תנודתיות

גילויים באמצעות הגשת 13F חושפים משקיעים מוסדיים בולטים שמתעסקים בתעודות סל של ביטקוין, מה שמדגיש הסכמה גוברת של ...

יודע יותר

יום גזר הדין מגיע: גורלה של CZ באיזון כאשר בית המשפט האמריקני שוקל את הטענה של DOJ

צ'אנגפנג ג'או עומד היום בפני גזר דין בבית משפט אמריקאי בסיאטל.

יודע יותר
הצטרף לקהילת הטכנולוגיה החדשנית שלנו
למידע נוסף
קראו עוד
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
עסקים דיווח חדשות טכנולוגיה
Injective מאחדת כוחות עם AltLayer כדי להביא אבטחה מחדש ל-inEVM
מאי 3, 2024
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
שוקי דיווח חדשות טכנולוגיה
מאסה משתפת פעולה עם Teller כדי להציג את מאגר ההלוואות של MASA, מאפשרת הלוואות ב-USDC על בסיס
מאי 3, 2024
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
שוקי דיווח חדשות טכנולוגיה
Velodrome משיקה את גרסת הבטא של Superchain בשבועות הקרובים ומתרחבת ברחבי OP Stack Layer 2 Blockchains
מאי 3, 2024
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
עסקים דיווח חדשות טכנולוגיה
CARV מכריזה על שותפות עם Aethir לביזור שכבת הנתונים שלה ולחלוקת תגמולים
מאי 3, 2024
CRYPTOMERIA LABS PTE. בע"מ.