Cómo se le pone voz a la tecnología con inteligencia artificial

  • Las voces sintéticas, generadas con inteligencia artificial, emplean redes neuronales para estudiar la voz humana y aprender a “hablar” de forma natural
  • Existen diferentes tipos: las voces clonadas, que imitan a una persona en concreto, y las voces artificiales, que generan una nueva voz a partir de otras ya existentes
  • Para ello son necesarias diferentes muestras de audio en buena calidad y adaptarlas a un formato que la máquina sea capaz de procesar
Recursos utilizados
EXPERTOS
FUENTES OFICIALES (COMUNICADOS, BASES DE DATOS, BOE)

Es probable que en alguna ocasión hayas utilizado algún asistente de voz como Alexa, Siri o Cortana para que te diga cómo llegar a una calle, ponga una alarma o te responda a alguna que otra pregunta. Al otro lado nos contesta una voz que suena casi como si fuera una persona.

El resultado de los programas que permiten crear estas voces y que parezcan cada vez más naturales se conoce como voz sintética, y gracias a la inteligencia artificial han conseguido pasar de tener un sonido “robótico” a ser recreaciones muy creíbles, hasta el punto de que también se puede clonar el habla o el canto de otra persona. Esto hace que estas voces ya no se usen solo en estos asistentes conversacionales, sino que también tengan aplicaciones sociales y médicas, como devolver la voz a quien no la tiene porque la ha perdido por una enfermedad o una discapacidad.

A un clic, ¿de qué hablamos en este tema? Pincha para ampliar

¿Qué son las voces sintéticas? ¿Cómo han evolucionado los sistemas conversacionales?

¿Te acuerdas de Loquendo? Si no te suena, se trata de un programa que se popularizó a principios de los 2000 y que todavía hoy funciona: permite darle un texto y que la máquina lo lea en voz alta. Los resultados eran bastante artificiales y era evidente que quien estaba hablando era una máquina, no un ser humano. Pero en estas dos décadas, este tipo de programas ha mejorado notablemente.

Estas aplicaciones existen gracias a las voces sintéticas: voces generadas por software, y que son capaces de imitar nuestra forma de hablar. Nos lo explicó en la Twitchería de Maldita Tecnología Nieves Ábalos, fundadora de Monocero Labs, que detalló cómo las voces sintéticas surgen a partir de programas que son capaces de recibir texto y generar como salida “un audio con las características de una voz”….

SIGUE LEYENDO EL ORIGINAL DE ESTA NOTICIA PUBLICADA EN : MALDITA.ES

BARCELONADOT no se hace responsable de la información
que contiene este mensaje y no asume responsabilidad alguna
frente a terceros sobre su íntegro contenido, quedando igualmente
exonerada de la responsabilidad de la entidad autora del mismo.

Escucha aquí RADIO60 Una experiencia musical y vivencial a través de más un siglo de ritmos, melodías e historias

.

.

Facebook
Twitter
LinkedIn
Scroll al inicio