MiniMax onthult Hailuo Video Agent en Voice Design en breidt zijn multimodale AI-mogelijkheden uit


In het kort
MiniMax sloot de week van productaankondigingen af met de lancering van Hailuo Video Agent, een AI-gestuurde tool voor het maken van video's, en Voice Design, een meertalige tekst-naar-spraakgenerator.

Chinees AI-bedrijf MiniMax heeft aangekondigd dat het de Hailuo Video Agent in de bètafase heeft gelanceerd. Deze AI-gestuurde applicatie zet eenvoudige tekst- of beeldprompts met één klik om in korte, hoogwaardige videoclips. De applicatie maakt gebruik van geavanceerde technieken zoals frame-voor-frame fysicasimulatie, bewegingsgebaseerde prompts en multimodale parsing om creatieve videocontent in een toegankelijk formaat te leveren.
Deze bètaversie markeert het begin van de ontwikkelingsreis van het product en introduceert al vroeg creatieve mogelijkheden die ideeën moeten stimuleren en het begin moeten inluiden van een nieuw tijdperk in de generatie van AI-video.
Via het platform kunnen gebruikers een gewenste creatieve agent-stijl selecteren, hun idee in begrijpelijke taal beschrijven, zonder dat ze technische kennis nodig hebben, en vervolgens een volledig gerenderde, gepolijste video ontvangen die is gegenereerd door de Hailuo Agent.
De Hailuo Video Agent wordt in drie verschillende fasen ontwikkeld. Fase één omvat kant-en-klare videoagentsjablonen die met één opdracht hoogwaardige, creatieve video's genereren op basis van door gebruikers aangeleverde tekst of afbeeldingen.
Fase twee introduceert semi-aanpasbare videoagents, waarmee gebruikers alle aspecten van het videocreatieproces kunnen aanpassen, inclusief het script, de beelden en de voice-over. Fase drie levert een volledig autonome, end-to-end videoagent die creatieve input met minimale handmatige tussenkomst kan omzetten in een definitieve video.
MiniMax heeft aangegeven dat het van plan is om Fase Twee van de tools voor het aanmaken van agenten gedurende de zomer geleidelijk te implementeren.
Daarnaast heeft MiniMax Voice Design onthuld, een geavanceerd zero-shot tekst-naar-spraakmodel dat gebruikmaakt van een leerbare luidsprekerencoder om het stemtimbre van een referentiestem nauwkeurig te reproduceren zonder transcriptie. Deze technologie maakt hoogwaardige en expressieve spraaksynthese mogelijk, inclusief one-shot stemkloning. Het ondersteunt uitvoer in 32 talen en biedt geavanceerde functies zoals emotiemodulatie en professionele stemaanpassing, wat een aanzienlijke vooruitgang in meertalige en adaptieve stemgeneratie weerspiegelt.
MiniMax lanceert MiniMax-M1 LLM en Hailuo 02 videomodel
MiniMax is een AI-startup die wordt gezien als een van China's meest vooraanstaande opkomende AI-bedrijven. Het bedrijf is gespecialiseerd in de ontwikkeling van grootschalige multimodale AI-systemen die tekst, spraak, beeld en video genereren, waaronder het Hailuo-videomodel.
De infrastructuur ondersteunt de productie van miljarden teksttokens en miljoenen videofragmenten. MiniMax wordt gesteund door belangrijke investeerders zoals Alibaba, Tencent en IDG, en behoort tot een selecte groep snelgroeiende Chinese AI-startups, vaak aangeduid als de Little Dragons, die het afgelopen jaar gezamenlijk aanzienlijk durfkapitaal hebben aangetrokken.
Vorige week lanceerde het bedrijf verschillende nieuwe technologieën, waaronder een groot taalmodel (LLM) genaamd MiniMax-M1, dat wordt gepresenteerd als efficiënter dan andere gepatenteerde modellen in China en naar verluidt de prestaties van DeepSeeks R1-0528-model overtreft in diverse benchmarktests. Daarnaast heeft MiniMax een nieuwe versie van zijn videogeneratietool geïntroduceerd, Hailuo-02die een native 1080p-resolutie biedt, beter voldoet aan gebruikersinstructies en uitgebreide mogelijkheden biedt voor het simuleren van complexe fysieke omgevingen.
Disclaimer
In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.
Over de auteur
Alisa, een toegewijd journalist bij de MPost, is gespecialiseerd in cryptocurrency, zero-knowledge proofs, investeringen en het uitgebreide domein van Web3. Met een scherp oog voor opkomende trends en technologieën levert ze uitgebreide berichtgeving om lezers te informeren en te betrekken bij het steeds evoluerende landschap van digitale financiën.
Meer artikelen

Alisa, een toegewijd journalist bij de MPost, is gespecialiseerd in cryptocurrency, zero-knowledge proofs, investeringen en het uitgebreide domein van Web3. Met een scherp oog voor opkomende trends en technologieën levert ze uitgebreide berichtgeving om lezers te informeren en te betrekken bij het steeds evoluerende landschap van digitale financiën.