Llevamos tiempo leyendo y oyendo el impacto que tienen en el procesamiento de imagen, la automatización y múltiples ámbitos de nuestras vidas la tecnología Deep learning y las redes neuronales convolucionales CNN.
En control de calidad, por ejemplo, han permitido abordar aplicaciones que antes no se abordaban por su complejidad o alta variabilidad, abriendo así un gran número de aplicaciones.
En esta entrada sin embargo se describen usos más "artísticos" o de ocio de estas mismas redes. En concreto de la aplicación FaceApp. Desde hace un tiempo está haciendo furor, ya que permite de manera realista cambiar tu aspecto: mostrar tu imagen envejecida o cambiar de género, entre otros efectos sorprendentes. Esta aplicación fue creada en 2017 por Wireless Lab.
¿Cómo lo hace?
Se emplean las llamadas redes GAN o Generative Adversarial Networks. La imagen de un rostro se procesa en dos etapas:
- Inicialmente una de las redes Deep learning, previamente entrenada con múltiples caras reales, obtiene en sus primeras capas datos característicos de la cara en cuestión (dimensiones, forma y tamaño de ojos, nariz boca, pose etc.) mediante sucesivas convoluciones, genera diferentes caras aleatorias, pero manteniendo rasgos comunes con la inicial.
- La segunda red "discriminator" funciona como juez de dichas imágenes relacionándolas con una base de datos de gente con la característica deseada (edad, género, rasgo etc.)
Con tiempo y capacidad de cálculo suficiente se generan caras creíbles, que no son distinguibles en realismo de caras reales, y se seleccionan las de mejor puntuación, que son las que ofrece el sistema.
Evidentemente es una cara inventada, no predice cómo vas a ser de mayor o si cambíaras de look o género, pero los resultados no dejan de ser sorprendentes.
El lado oscuro de la aplicación
Compartimos fotos y otros datos a terceros. Aunque el fundador de la compañía Yaroslav Goncharov lo ha desmentido, se ha acusado de que los datos se estaban compartiendo en servidores rusos. Y toda la parte de DeepFake, en las que se pueden generar fotos o vídeos falsos.
- Aplicaciones más artísticas y que abren otros campos, que incluso siendo un proyecto universitario de hace algún tiempo, obtiene resultados espectaculares empleando la pose y el movimiento del cuerpo de un bailarín profesional: hace que un sujeto objetivo del que se toman una imágenes ejecute el mismo baile de manera realista.
- Otras se están empleando en la generación de modelos 3D a partir de datos 2D para videojuegos o realidad aumentada.
En el grupo de ComputerVision de TECNALIA estamos empleando tecnologías similares para generar nuevos defectos de entramiento cuando los casos reales no son muy numerosos o, para aprender nuevos escenarios realistas en 3D; aplicaciones de autoguiado o conducción. Y cada dia surgen nuevas ideas y posibilidades que se están sondeando para su posible aplicación.