MiniMax dezvăluie agentul video și designul vocal Hailuo, extinzându-și capacitățile multimodale de inteligență artificială


Pe scurt
MiniMax și-a încheiat săptămâna de anunțuri de produse cu lansarea Hailuo Video Agent, un instrument de creare video bazat pe inteligență artificială, și Voice Design, un generator multilingv de text-vorbire.

Companie chineză de inteligență artificială MiniMax a anunțat lansarea Hailuo Video Agent în faza Beta. Această aplicație bazată pe inteligență artificială convertește mesaje text sau imagini de bază în clipuri video scurte, de înaltă calitate, cu un singur clic. Aceasta utilizează tehnici avansate, cum ar fi simularea fizicii cadru cu cadru, mesajele bazate pe mișcare și analiza multimodală, pentru a oferi conținut video creativ într-un format accesibil.
Această versiune Beta marchează începutul parcursului de dezvoltare al produsului, introducând capabilități creative timpurii concepute pentru a stimula ideația și a semnala începutul unei noi ere în generarea de videoclipuri bazate pe inteligență artificială.
Platforma permite utilizatorilor să selecteze stilul preferat de agent creativ, să își descrie ideea folosind un limbaj simplu, fără a fi nevoie de cunoștințe tehnice, iar apoi să primească un videoclip complet randat și rafinat, generat de agentul Hailuo.
Agentul video Hailuo este dezvoltat în trei etape distincte. Prima etapă include șabloane predefinite pentru agenți video care generează videoclipuri creative de înaltă calitate din text sau imagini trimise de utilizatori, cu o singură comandă.
Etapa a doua va introduce agenți video semi-personalizabili, oferind utilizatorilor opțiunea de a modifica toate aspectele procesului de creare a videoclipurilor, inclusiv scenariul, elementele vizuale și voiceover-ul. Etapa a treia va oferi un agent video complet autonom, end-to-end, capabil să transforme inputul creativ într-un videoclip final, cu o implicare manuală minimă.
MiniMax a declarat că intenționează să implementeze treptat Etapa a doua a instrumentelor de creare a agenților în timpul verii.
În plus, MiniMax a lansat Voice Design, un model avansat de text-vorbire zero-shot care utilizează un codificator de vorbitor învățabil pentru a reproduce cu acuratețe timbrul vocal al unei voci de referință fără a necesita transcriere. Această tehnologie permite sinteza vocală de înaltă calitate și expresivă, inclusiv capacități de clonare vocală one-shot. Acceptă ieșire în 32 de limbi și oferă funcții sofisticate, cum ar fi modularea emoțiilor și personalizarea vocii la nivel profesional, reflectând un progres semnificativ în generarea multilingvă și adaptivă a vocii.
MiniMax lansează MiniMax-M1 LLM și modelul video Hailuo 02
MiniMax este un startup de inteligență artificială, identificat ca una dintre firmele emergente de inteligență artificială din China. Compania este specializată în dezvoltarea de sisteme de inteligență artificială multimodale la scară largă, care includ generarea de text, voce, imagini și videoclipuri, inclusiv modelul său video Hailuo.
Infrastructura sa susține producția a miliarde de token-uri text și milioane de segmente video. MiniMax este susținută de investitori importanți precum Alibaba, Tencent și IDG și este clasificată printre un grup select de startup-uri chinezești de inteligență artificială cu creștere rapidă, adesea denumite Micii Dragoni, care au atras împreună capital de risc substanțial în ultimul an.
Săptămâna trecută, compania a lansat mai multe tehnologii noi, inclusiv un model de limbaj mare (LLM) numit MiniMax-M1, care este prezentat ca fiind mai eficient decât alte modele proprietare din China și se pare că depășește performanța modelului R1-0528 de la DeepSeek în diverse teste de performanță. În plus, MiniMax a introdus o nouă versiune a instrumentului său de generare video. Hailuo 02, care oferă o rezoluție nativă de 1080p, o conformitate îmbunătățită cu instrucțiunile utilizatorului și capacități îmbunătățite pentru simularea mediilor fizice complexe.
Declinare a responsabilităţii
În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.
Despre autor
Alisa, o jurnalistă dedicată la MPost, este specializată în criptomonede, dovezi fără cunoștințe, investiții și tărâmul expansiv al Web3. Cu un ochi aprofundat pentru tendințele și tehnologiile emergente, ea oferă o acoperire cuprinzătoare pentru a informa și a implica cititorii în peisajul în continuă evoluție al finanțelor digitale.
Mai multe articole

Alisa, o jurnalistă dedicată la MPost, este specializată în criptomonede, dovezi fără cunoștințe, investiții și tărâmul expansiv al Web3. Cu un ochi aprofundat pentru tendințele și tehnologiile emergente, ea oferă o acoperire cuprinzătoare pentru a informa și a implica cititorii în peisajul în continuă evoluție al finanțelor digitale.