Meta lança dois novos recursos de IA generativa para edição de vídeos no Facebook e Instagram
Em Breve
A Meta lançou dois recursos generativos de IA para edição de vídeo – ‘Emu Video’ e ‘Emu Edit’ – para reforçar as postagens dos usuários no Facebook e Instagram.
Gigante de mídia social de propriedade de Mark Zuckerberg Meta na quinta-feira lançou dois novos recursos baseados em IA generativa para edição de vídeo, chamados 'Emu Video' e 'Emu Edit', que permitem aos usuários postar no Facebook e Instagram.
O Emu Video permitirá que os usuários produzam vídeos de quatro segundos com a solicitação de uma legenda, foto ou imagem, combinada com uma descrição; enquanto o Emu Edit oferece aos usuários uma maneira mais simples de editar ou modificar vídeos usando prompts de texto.
Segundo a gigante das redes sociais, os desenvolvimentos fazem parte do ema (Expression Media Universe) – o primeiro modelo fundamental da empresa anunciado em setembro de 2023, que pode gerar imagens incrivelmente realistas e esteticamente agradáveis a partir de legendas de texto.
O recurso de destaque do Emu é sua técnica de “ajuste de qualidade”, que aumenta o fascínio visual das imagens geradas por modelos de texto para imagem de IA, acrescentou.
No centro da Emu IA generativa tecnologia é um conjunto de ferramentas de edição de imagens de IA para Instagram, que permite aos usuários clicar em uma foto e modificar seu estilo visual ou plano de fundo.
Durante o ano passado, empresas e empresas foram atraídas para o mercado emergente de IA generativa, em busca de capacidades aprimoradas e processos de negócios simplificados desde a estreia do OpenAI'S ChatGPT ano passado.
O principal diferencial da Emu em relação a outras ferramentas de IA generativa
A abordagem do Emu Video envolve um processo de duas etapas: primeiro, concentra-se na geração de imagens condicionadas a um determinado prompt de texto; e depois produz vídeos condicionados tanto ao texto original quanto à imagem gerada. Esta estratégia “fatorada” ou dividida na geração de vídeo aumenta a eficiência e permite o treinamento eficaz de modelos de geração de vídeo.
Emu Video pretende demonstrar que fatorado geração de vídeo pode ser implementado através de um único modelo de difusão. Ao apresentar decisões importantes de design, como o ajuste fino de cronogramas de ruído adaptados para difusão de vídeo, a Meta está tentando refinar ainda mais sua tecnologia.
Outra característica do Meta é a implementação de treinamento em vários estágios, que permite a geração direta de vídeos de maior resolução, mostrando o potencial do Emu Video para elevar a qualidade do conteúdo de vídeo.
De acordo com Meta, o Emu Edit aborda um desafio comum – muitas abordagens tendem a modificar excessivamente ou a ter um desempenho inferior em várias tarefas de edição, levando a resultados abaixo do ideal. O objetivo principal da edição de imagens não deve girar apenas em torno da produção de uma imagem “crível”, em vez disso, o foco deve estar na alteração precisa apenas dos pixels relevantes para a solicitação de edição específica.
Ao contrário de outros modelos de IA generativos, Emu Edit segue as instruções para garantir que os pixels na imagem de entrada não relacionados às edições especificadas permaneçam intactos.
Com tais anúncios e refinamentos tecnológicos, a Meta está se posicionando como um importante ponto focal no cenário competitivo ao lado de gigantes como Microsoft, Google da Alphabet e Amazon.
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Kumar é um jornalista de tecnologia experiente com especialização nas interseções dinâmicas de IA/ML, tecnologia de marketing e campos emergentes como criptografia, blockchain e NFTs. Com mais de 3 anos de experiência no setor, Kumar estabeleceu um histórico comprovado na elaboração de narrativas convincentes, conduzindo entrevistas perspicazes e fornecendo insights abrangentes. A expertise de Kumar está na produção de conteúdo de alto impacto, incluindo artigos, relatórios e publicações de pesquisa para plataformas proeminentes do setor. Com um conjunto de habilidades único que combina conhecimento técnico e narrativa, Kumar se destaca na comunicação de conceitos tecnológicos complexos para públicos diversos de forma clara e envolvente.
Mais artigos
Kumar é um jornalista de tecnologia experiente com especialização nas interseções dinâmicas de IA/ML, tecnologia de marketing e campos emergentes como criptografia, blockchain e NFTs. Com mais de 3 anos de experiência no setor, Kumar estabeleceu um histórico comprovado na elaboração de narrativas convincentes, conduzindo entrevistas perspicazes e fornecendo insights abrangentes. A expertise de Kumar está na produção de conteúdo de alto impacto, incluindo artigos, relatórios e publicações de pesquisa para plataformas proeminentes do setor. Com um conjunto de habilidades único que combina conhecimento técnico e narrativa, Kumar se destaca na comunicação de conceitos tecnológicos complexos para públicos diversos de forma clara e envolvente.
