IA verás nº3: Gen-1, 3D y Julie Wieland
IA VERÁS, tu newsletter de inteligencia artificial y creatividad [número 3]
Pausa dramática
Después de dos semanas saturadas de anuncios en el mundo de la inteligencia artificial, por fin, desde el pasado sábado, ha disminuido la cantidad de información que procesar a diario, y eso es de agradecer.
Un descanso como el que buscan Elon Musk (Tesla, financiador de OpenAI en sus orígenes), Emad Mostaque (CEO de Stability AI), Yuval Noah Harari (autor del libro Sapiens) y otros 1900 firmantes en su carta abierta para detener el entrenamiento de sistemas de inteligencia artificial superiores a GPT-4 al menos durante 6 meses. ¿El motivo aducido? La ausencia de marcos de regulación estatales y, principalmente, la falta de entendimiento y control de estos sistemas (“incluso por parte de sus propios creadores”), que, muy lejos aún de ser inteligencias artificiales generales (AGI), pueden presentar severas amenazas. En la lista hay tanto empresarios (como el mismísimo Steve Wozniak, cofundador de Apple) como investigadores y trabajadores de Google, Meta, Microsoft, Amazon... No se ven firmas de OpenAI (los que, sin duda, están liderando el sector) ni de Baidu, ni Tencent (las tecnológicas de China). Curioso, ¿no?
Aunque es muy difícil predecir si esa hipotética pausa sería algo realmente positivo para nuestra sociedad, en mi visión personal y limitada de este momento, no me importaría en absoluto que pudiésemos dedicar 180 días a estudiar lo que ya tenemos y a encontrar aplicaciones al exhuberante potencial que han demostrado poseer estos modelos. La comunidad Open-Source también tendría tiempo de ponerse las pilas, y se crearía un mercado más diverso entre las tecnológicas.
Por otro lado, pienso en los avances en sanidad, educación e ingenierías que podríamos estar retrasando… ¿Algún philosopher en la sala? ¿Qué sería mejor para la humanidad?
Lo más relevante
Vamos a echarle un vistazo a las informaciones más importantes de esta semana.
Gen-1 🎥👌🏻
Por fin puedes probar Gen-1, el modelo de generación de vídeo de Runway (realmente necesita un input de imagen, así que podríamos decir que es un modelo de transferencia de estilo). Te he hecho un vídeo para que aprendas cómo en 1 minuto. Gen-2 en camino.
Spline
Abierta la waitlist para este sistema de generación de texto a 3D. Un ejemplo de cómo puede que acaben funcionando todos los softwares dentro de poco. Caja de texto para introducir peticiones y… hala, a funcionar. Es interesante cómo tiene todo el estilito de Runway la música y el ritmo del tráiler.
Genmo Chat
Se trata de un chat con el que se podrá generar texto, imágenes y vídeos. De momento nada sólido y comprobable, pero en sus vídeos de demostración promenten ser una solución para desarrollo de películas integral, con frases como “escribe un guión, después genera un tráiler”. Aquí la waitlist. Mientras tanto te darán a probar la versión anterior, que como verás, es similar a Kaiber AI.
Escenarios gigantescos con Radiance Fields
Este proyecto me ha parecido de lo más interesante, ya que permite obtener una escena de gran tamaño a partir de un vídeo capturado de forma casual. Una de las aplicaciones más interesantes es la de conseguir estabilizados y movimientos de cámara súper fluidos.
HuggingGPT
Este paper propone una metodología para conectar ChatGPT con todos los modelos de inteligencia artificial disponibles de Huggingface, lo cual podría dotar a la aplicación de una versatilidad sin precedentes. En este hilo de Twitter comento el tipo de cosas que se podría hacer con algo precisamente como esto.
La artista de la semana: Julie Wieland
Julie Wieland es una diseñadora gráfica radicada en Alemania que el pasado año comenzó a integrar herramientas de generación de imagen en su proceso de trabajo (empezando con Wombo AI) y que ha ido refinando su técnica durante estos meses a la par que iban saliendo modelos más potentes para el público general. Comparte prompts y hace tutoriales en sus redes sociales.
Puedes ver su última serie ‘Temporary’ junto a la obra de otros artistas en Fellowship (colección curada por Roope Rainisto).
Lo que viene…
Lo más importante de lo que se avecina esta semana.
Encuentro Open-Source de Huggingface
Esta noche se desarrollará el evento Open Source AI Meetup de Huggingface en el Exploratorium del muelle 15 de San Francisco. Uno de los asistentes será el mítico Ashen Khaliq, ingeniero de machine learning y uno de los miembros más activos de la comunidad IA en internet, que es famoso en Twitter por reseñar y separar el grano de la paja de los incontables papers que se publican estos días. Podemos esperar cosas interesantes.
Comunidad
Tenemos un grupo de Discord y estás invitad@ a unirte para interactuar con otras personas creativas interesadas en la inteligencia artificial e intercambiar conocimientos, proyectos e ideas. También es la mejor forma de comunicarte en este momento si quieres dejarme un mensaje. Acaba de arrancar, pásate y deja un saludo. :)
Para ver cómo va la comunidad en redes sociales y otros enlaces de interés tienes esta página.
Y eso es todo, muchas gracias y…
Gracias por leer este segundo ejemplar de la newsletter, espero que te haya sido de provecho y estaré pendiente de tu feedback por el grupo de Discord o en redes sociales.
¡IA nos veremos!
Hilario
Suscríbete para recibir en tu correo los nuevos ejemplares de la newsletter y apoyar mi trabajo.