Raport aktualności
Listopad 04, 2022

Image-to-Music: AI generuje kompozycję muzyczną inspirowaną Twoim zdjęciem

W skrócie

Sztuczna inteligencja może generować muzykę z samego obrazu — oto jak z niej korzystać

Muzycy zawsze byli w czołówce technologii. Byli jednymi z pierwszych, którzy przyjęli syntezatory i samplery, a ostatnio szybko przyjęli nowe cyfrowe technologie audio. Teraz pojawiają się dwie nowe technologie, które mogą zmienić sposób, w jaki tworzymy muzykę: konwersja obrazu na muzykę i Muzyka wspomagana sztuczną inteligencją kompozycja.

Image-to-Music: AI generuje kompozycję muzyczną inspirowaną Twoim zdjęciem
Obraz stworzony przez Midjourney AI

Nowy system AI może automatycznie generować kompozycję muzyczną na podstawie pojedynczego obrazu, używając CLIP Interrogator i Mubert API. System wykorzystuje algorytm głębokiego uczenia się do uczenia się mapowania między funkcjami wizualnymi, tekstowymi i dźwiękowymi i może generować oryginalną muzykę w różnych stylach.

Jest dość łatwy w użyciu; wszystko, co musisz zrobić, to wysłać zdjęcie do CLIP Interrogator, który następnie generuje podpowiedź tekstową. Następnie Mubert używa zachęty tekstowej do tworzenia muzyki z obrazu wejściowego. System został przeszkolony na zbiorze danych składającym się z ogromnej liczby obrazów i plików audio i może generować muzykę w dowolnym stylu, w tym jazz, muzykę klasyczną i rock. System może być również używany do generowania muzyki do określonych celów, takich jak tworzenie podkładu muzycznego do wideo lub filmu.

Clip Interrogator generuje atrakcyjne monity do użycia Stable Diffusion or Midjourney i zapewnia lepsze dopasowanie wygenerowanego podpowiedzi tekstowej do oryginalnego obrazu. Mubert to platforma prowadzona przez twórców muzyki, która wykorzystuje sztuczną inteligencję, aby umożliwić twórcom i firmom generowanie nieograniczonej liczby utworów muzycznych bez tantiem zachęty do zamiany tekstu na muzykę.

Razem te dwie technologie mogą generować dane wyjściowe, które przekształcają obrazy w muzykę. Otwiera to zupełnie nowy świat możliwości tworzenia muzyki, ponieważ każdy obraz może być użyty jako punkt wyjścia dla utworu muzycznego. Dzięki komponowaniu muzyki wspomaganemu przez sztuczną inteligencję muzyka może być generowana automatycznie, bez udziału człowieka.

Świeżo wygenerowane przykłady Image-to-Music

Ten system może mieć szereg potencjalnych zastosowań, od pomagania ludziom w tworzeniu spersonalizowanej muzyki na ich ślub po wspomaganie kompozytorów w procesie twórczym. To fascynujący postęp w badaniach nad sztuczną inteligencją i muzyką, który w przyszłości może mieć wiele zastosowań, takich jak tworzenie niestandardowej ścieżki dźwiękowej na podstawie uchwytu do gier.

Przeczytaj więcej powiązanych artykułów:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Apetyt instytucjonalny na ETFy Bitcoin rośnie w obliczu zmienności

Ujawnienia zawarte w zgłoszeniach 13F ujawniają, że znaczący inwestorzy instytucjonalni parają się funduszami ETF Bitcoin, co podkreśla rosnącą akceptację…

Dowiedz się więcej

Nadchodzi dzień wyroku: los CZ wisi na włosku, gdy amerykański sąd rozpatruje skargę Departamentu Sprawiedliwości

Changpeng Zhao stanie dziś przed amerykańskim sądem w Seattle wyrokiem skazującym.

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Injective łączy siły z AltLayer, aby zapewnić bezpieczeństwo ponownego stakowania w inEVM
Biznes Raport aktualności Technologia
Injective łączy siły z AltLayer, aby zapewnić bezpieczeństwo ponownego stakowania w inEVM
3 maja 2024 r.
Masa współpracuje z Tellerem, aby wprowadzić pulę pożyczek MASA, umożliwiającą zaciąganie pożyczek w USDC
rynki Raport aktualności Technologia
Masa współpracuje z Tellerem, aby wprowadzić pulę pożyczek MASA, umożliwiającą zaciąganie pożyczek w USDC
3 maja 2024 r.
Velodrome wprowadza wersję beta Superchain w nadchodzących tygodniach i rozszerza się na łańcuchy bloków warstwy 2 stosu OP
rynki Raport aktualności Technologia
Velodrome wprowadza wersję beta Superchain w nadchodzących tygodniach i rozszerza się na łańcuchy bloków warstwy 2 stosu OP
3 maja 2024 r.
CARV ogłasza partnerstwo z firmą Aethir w celu decentralizacji warstwy danych i dystrybucji nagród
Biznes Raport aktualności Technologia
CARV ogłasza partnerstwo z firmą Aethir w celu decentralizacji warstwy danych i dystrybucji nagród
3 maja 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.