Microsoft acaba de desarrollar un nuevo sistema que puede tomar una imagen y texto y convertirlo en un video. El sistema se llama NUWA-Infinity y es una IA similar a Brain y DALL-E, pero capaz de ampliar lo que otras Inteligencias Artificiales pueden hacer con imágenes y videos. El sistema toma información de imágenes, videos o texto y crea imágenes y videos de alta calidad.
Microsoft lo describe como “un modelo generativo multimodal diseñado para generar imágenes y videos de alta calidad a partir de la entrada de texto, imagen o video”. Por lo tanto, no es muy diferente de DALL-E, OpenAI o incluso de Brain detrás de Google.
NUWA-Infinity se diferencia de otros sistemas similares porque puede producir videos largos e imágenes de cualquier tamaño y con alta resolución. Su función principal, cuando se trata de imágenes, es poder extender cualquier imagen, como lo muestra en su sitio web Microsoft usando La noche estrellada de Vincent Van Gogh como ejemplo de cómo el sistema puede continuar la imagen sin perder el diseño original, y con detalles muy exactos.
Las empresas están prestando más atención al desarrollo de imágenes generadas por IA porque el campo se ha vuelto muy popular en la actualidad. Dentro de la muestra de página, hay otros ejemplos, como un video generado a partir de una fotografía, o una foto de paisaje de Windows, en la que el espectador imagina qué otros elementos podrían estar rodeándolo.
Con respecto a Brain, Google compartió que son temas importantes porque, además de crear nuevas imágenes, la idea de estas herramientas es fortalecer los sistemas de Inteligencia Artificial a partir de datos, hacerlos más complejos y tratar de reducir los sesgos. Estas técnicas se pueden replicar.
“Las auditorías de conjuntos de datos han revelado que estos tienden a reflejar estereotipos sociales, puntos de vista opresivos y asociaciones despectivas, o dañinas, con grupos de identidad marginados” señala la investigación de Google.
DALL-E anunció recientemente que abrirán su versión beta a un millón de usuarios; sin embargo, desde el anuncio, la lista de espera se llenó, lo que demuestra que los usuarios están interesados en utilizar la herramienta para hacer realidad sus sueños en una obra de arte.
OpenAI actualmente está cobrando por su herramienta, ya que aquellos usuarios que obtengan acceso recibirán 50 créditos gratis durante su primer mes. Los usuarios posteriores recibirán 15 créditos por mes y, si no es suficiente, deberán pagar 15 dólares por 115 créditos.
La compañía dijo que quería frenar el abuso de sus herramientas antes de un lanzamiento más amplio. Por eso, están tomando medidas para bloquear contenido con caras reales para evitar crear contenido “violento, para adultos o político”.
Sin embargo, en relación con DALL-E, los usuarios también obtendrán el derecho de usar la imagen, incluso con fines comerciales, para que puedan monetizarla de la forma que decidan.