Blog

FaceApp: app de consumo a partir de las redes de procesamiento de imagen deep learning

2 de Julio de 2020
Tabla de contenido0

Llevamos tiempo leyendo y oyendo el impacto que tienen en el procesamiento de imagen, la automatización y múltiples ámbitos de nuestras vidas la tecnología Deep learning y las redes neuronales convolucionales CNN.

En control de calidad, por ejemplo, han permitido abordar aplicaciones que antes no se abordaban por su complejidad o alta variabilidad, abriendo así un gran número de aplicaciones.

En esta entrada sin embargo se describen usos más "artísticos" o de ocio de estas mismas redes. En concreto de la aplicación FaceApp. Desde hace un tiempo está haciendo furor, ya que permite de manera realista cambiar tu aspecto: mostrar tu imagen envejecida o cambiar de género, entre otros efectos sorprendentes. Esta aplicación fue creada en 2017 por Wireless Lab.

¿Cómo lo hace?

Se emplean las llamadas redes GAN o Generative Adversarial Networks. La imagen de un rostro se procesa en dos etapas:

  • Inicialmente una de las redes Deep learning, previamente entrenada con múltiples caras reales, obtiene en sus primeras capas datos característicos de la cara en cuestión (dimensiones, forma y tamaño de ojos, nariz boca, pose etc.) mediante sucesivas convoluciones, genera diferentes caras aleatorias, pero manteniendo rasgos comunes con la inicial.
  • La segunda red "discriminator" funciona como juez de dichas imágenes relacionándolas con una base de datos de gente con la característica deseada (edad, género, rasgo etc.)

Con tiempo y capacidad de cálculo suficiente se generan caras creíbles, que no son distinguibles en realismo de caras reales, y se seleccionan las de mejor puntuación, que son las que ofrece el sistema.

Evidentemente es una cara inventada, no predice cómo vas a ser de mayor o si cambíaras de look o género, pero los resultados no dejan de ser sorprendentes.

El lado oscuro de la aplicación

Compartimos fotos y otros datos a terceros. Aunque el fundador de la compañía Yaroslav Goncharov lo ha desmentido, se ha acusado de que los datos se estaban compartiendo en servidores rusos. Y toda la parte de DeepFake, en las que se pueden generar fotos o vídeos falsos.

  • Aplicaciones más artísticas y que abren otros campos, que incluso siendo un proyecto universitario de hace algún tiempo, obtiene resultados espectaculares empleando la pose y el movimiento del cuerpo de un bailarín profesional: hace que un sujeto objetivo del que se toman una imágenes ejecute el mismo baile de manera realista.
  • Otras se están empleando en la generación de modelos 3D a partir de datos 2D para videojuegos o realidad aumentada.

En el grupo de ComputerVision de TECNALIA estamos empleando tecnologías similares para generar nuevos defectos de entramiento cuando los casos reales no son muy numerosos o, para aprender nuevos escenarios realistas en 3D; aplicaciones de autoguiado o conducción. Y cada dia surgen nuevas ideas y posibilidades que se están sondeando para su posible aplicación.

Jose Ángel Gutiérrez Olabarria

SOBRE EL AUTOR

Jose Ángel Gutiérrez Olabarria

Licenciado en Informática por la Universidad de Deusto 1991 con un Máster en Robótica y Automatización por la ETSII/IT 1992 y un Doctorando por la ETSII/IT de Bilbao. Trabaja desde 1.992 en TECNALIA. Es Ingeniero Principal especialista en Visión artificial y sensores en el Área de Negocio de Maquinas Especiales.

Leer más +

Autor:Jose Ángel Gutiérrez Olabarria
Suscríbete a nuestras comunicaciones
CUÉNTANOS TU OPINIÓN
0 comentarios
CUÉNTANOS TU OPINIÓN
*campos obligatorios