Meta da un golpe sobre la mesa y presenta su propio modelo de generación de vídeos con sonido: así es MovieGen
Meta ha anunciado una familia de modelos de inteligencia artificial (IA) denominada MovieGen. Estamos frente a una tecnología que permite generar vídeos realistas con sonido a partir de indicaciones de texto. Como podemos ver, compite directamente con alternativas como Sora de OpenAI y Gen-3 Alpha de Gen-3 Alpha.
Por un lado tenemos a MovieGen Video, un modelo del tipo transformador de 30.000 millones de parámetros cuyos clips pueden durar hasta 16 segundos a 16 fotogramas por segundo o hasta 10 segundos a 25 fotogramas por segundo. El modelo genera vídeos de 768p, pero se encarga de escalarlos a 1080p automáticamente.
Por otro lado tenemos a MovieGen Audio, un modelo transformador de 13.000 millones de parámetros que genera audio de hasta 45 segundos para vídeos. Los usuarios tienen la posibilidad de utilizar prompts para obtener mejores resultados, por ejemplo, especificar que quieren sonido ambiental o música de fondo.
Dos potentes herramientas que se complementan para crear contenido
Estos modelos prometen ofrecer una variedad de posibilidades para los usuarios. A nivel de vídeo, podrán empezar a generar directamente con una indicación textual, aunque también podrán utilizar clips existentes. Meta ha querido abordar una de las grandes dificultades de la IA generativa, que es la de editar sus salidas.
Los usuarios podrán pedir cambios determinados. Por ejemplo, cambiar el color de la chaqueta de una persona o modificar la orientación en la que está caminando. La IA de Meta tratará de hacer el cambio sin alterar el resto del contenido del clip, algo importante para aquellos que buscan realizar un trabajo más profesional.
Meta ha compartido una serie de clips que tienen un aspecto estupendo. Desde un koala surfeando hasta una persona haciendo malabares con fuego en una playa. El problema es que, al menos de momento, no podremos tener acceso a MovieGen. La razón es que Meta no ha lanzado su nueva familia de modelos.
La compañía asegura que se trata de un concepto de investigación que seguirá evolucionando en su laboratorio de IA. No obstante, muchas innovaciones que antes pasaron por su laboratorio han llegado al público, como Meta AI en forma de chatbot que permite conversar y generar respuestas en Facebook, Instagram y Messenger.
Uno de los modelos de generación de vídeo que más han llamado la atención es Sora de OpenAI. La firma liderada por Sam Altman ha prometido que llegará al público, pero todavía estamos esperando que eso suceda. Mira Murati, antes de abandonar la compañía, dijo que Sora llegaría este año. Pronto sabremos si eso sucederá.
Imágenes | Meta
En Xataka | OpenAI’s Eleven: qué ha sido de sus once fundadores ahora que casi todos se han ido de la empresa