Un grupo de desarrolladores del Instituto Tecnológico de Massachusetts, MIT por sus siglas en inglés, ha logrado crear un algoritmo capaz de reconstruir una cara con tan solo escuchar un fragmento de voz.
La herramienta tiene como nombre Speech2Face y es capaz de saber la etnia, edad y género de la persona que está hablando. El algoritmo puede funcionar gracias a una red neuronal creada por los mismos desarrolladores para poder aprender de una base de datos llamada AVSpeech. Esta base de datos está compuesta por 100,000 videos y audios de personas hablando en fragmentos de 6 segundos.
Durante la fase de entrenamiento la herramienta analizó durante varias horas los videos de la base de datos antes mencionada y gracias a esto, logró establecer una relación entre el rostro de las personas centrándose en los atributos físicos tales como edad, género, grupo étnico y medidas craneofaciales con el tono de voz. Con este entrenamiento la IA puede adivinar cómo es la cara de la persona con escuchar la voz.
Para poder demostrar la efectividad de esta nueva herramienta, los científicos utilizaron otra base de datos llamada VoxCeleb, en la cual se pueden encontrar audios de miles de entrevistas realizadas a personas famosas. La imagen que se generó a partir de este estudio fue la de una persona con la cara mirando al frente y con un gesto neutro. Posteriormente los resultados fueron comparados con una imágen real de la persona famosa en cuestión.
Aunque los resultados no fueron una réplica exacta hubo un gran parecido entre la imágen real y la creada, además de que, a la hora de establecer el género, hubo una precisión de 94%. Cabe resaltar que en los rasgos donde hubo un mayor parecido fue en la boca y la nariz, resultados que indican que la estructura de la nariz determina la forma en que una persona habla.
Los responsables de este estudio aseguran que aún falta perfeccionar la herramienta para resultados más acertados, pero están a la espera de ver cómo pueden aplicar estos descubrimientos, ¿tú qué opinas de esta nueva tecnología?
Referencias
La inteligencia artificial ya es capaz de reconstruir rostros de personas solo a través de su voz. (20 de junio de 2019). ABC. Recuperado de https://www.abc.es/tecnologia/informatica/software/abci-inteligencia-artificial-capaz-reconstruir-rostros-personas-solo-traves-201906191209_noticia.html
Speech2Face: Learning the Face Behind a Voice. (s.f). Recuperado de https://speech2face.github.io/
Comentarios