Auriculares con IA que filtran el ruido y destacan una sola voz

Los auriculares con cancelación de ruido utilizan IA para dejar pasar una sola voz
Podrían ayudar a los usuarios a concentrarse en voces concretas en entornos ruidosos, como la de un amigo entre la multitud o la de un guía turístico en medio del bullicio urbano.

Un nuevo prototipo de auriculares con cancelación de ruido utiliza inteligencia artificial para permitir a los usuarios seleccionar una voz específica para escuchar en entornos ruidosos. Denominado Target Speech Hearing, este sistema permite que una voz elegida siga siendo audible mientras se anulan los demás sonidos. Esta tecnología, aún en fase de prueba, podría incorporarse a marcas populares de auriculares y audífonos en el futuro.

Desarrollado por un equipo de la Universidad de Washington, el sistema utiliza una técnica de compresión de IA llamada destilación de conocimiento. Esto consiste en entrenar un modelo de IA pequeño para que imite el comportamiento de un modelo grande entrenado con millones de voces. Así, el modelo pequeño puede extraer patrones vocales específicos del ruido ambiental captado por los micrófonos de los auriculares.

Para activar el sistema, el usuario mantiene pulsado un botón mientras mira a la persona cuya voz quiere escuchar. El sistema captura una muestra de audio y extrae las características vocales del hablante, reproduciéndola continuamente al oyente mientras filtra otros sonidos. Actualmente, el sistema solo puede registrar una voz que sea la más fuerte en el entorno, pero los desarrolladores trabajan para mejorar esta limitación.

El investigador principal de Microsoft, Sefik Emre Eskimez, y el investigador de Carnegie Mellon, Samuele Cornell, afirman que esta tecnología tiene aplicaciones prácticas significativas y representa un avance en la dirección correcta. La capacidad de aislar una sola voz en entornos ruidosos podría revolucionar el uso de auriculares en diversas situaciones, como reuniones y eventos públicos.

Noticia elaborada a partir del artículo original publicado en MIT Technology Review. MIT Technology Review

Scroll al inicio