Los usos más impactantes de la tecnología de texto a voz

La tecnología de texto a voz es uno de los aportes fundamentales del campo de las ciencias de la computación. La interacción entre el desarrollo de tecnología, y las llamadas funciones cognitivas del ser humano atraviesa uno de los mejores períodos de su historia. Gracias al estudio de este conjunto, logramos desarrollar productos que solucionen problemas en ambas áreas.

Hoy combinadas con el poder del Aprendizaje Automático, Inteligencia Artifcial y más específcamente del área del Procesamiento del Lenguaje Natural está llegando a niveles realmente impresionantes. De modo ilustrativo, vemos como Steve Kovach interactúa con Sophia, el robot que quiere mejorar el mundo.

No sólo ya son muchos los problemas resueltos estudiando la mente, sino que en buena medida también sus soluciones se han vuelto sumamente accesibles. Hoy conseguimos software gratuito como Panopreter para que nos lea texto en un tono natural, con acentos, cadencias, con diferentes voces y en diversos idiomas.

Al día de la fecha, el espectro de los problemas que hemos logrado resolver obviamente no sólo tiene que ver con la síntesis de voz artifcial. Este es muy amplío, las computadoras pueden realizar tareas que varían en un espectro de complejidad. Parten desde de las tareas más simples como realizar una operación aritmética sencilla a comprender y producir lenguaje de manera muy similar a como lo hacemos nosotros.

Ejemplos de esto último, son encontrados en las tecnologías de texto a voz, de voz a texto, y hasta la famosa Inteligencia Artifcial GPT-3. Para los que anden perdidos con GPT-3, esta Inteligencia Artifcial crea texto de gran complejidad como lo hacen los humanos y podemos conversar con ella acerca del sentido de la vida. Si quieres saber más, aquí te dejo otro video interesante. Ahora veamos más de lo que nos compete hoy…

La tecnología de texto a voz: A hombros de gigantes

La tecnología de texto a voz tiene características muy interesantes. Por supuesto que sus atributos van a variar en función del software que estemos utilizando, pero por lo general reúnen una serie de estándares. Estos pueden hacer una síntesis de voz realista y personalizable, que lee con un ritmo y va acentuando las palabras, y permiten extraer el texto a mp3 y otros formatos.

Como dato de color, siguiendo los resultados de estudios de neuroimagen las voces que escuchamos en la tecnología de texto a voz suelen ser grabadas por otros humanos. Esto se debe a que los humanos al escuchar conversar entre nosotros, nos sincronizamos y conectamos a un nivel más profundo.

Las aplicaciones de la tecnología de texto a voz son también muy amplias. Es ampliamente usada en los servicios de atención al cliente, e inclusive como método de seguridad. Existen métodos de autenticación basados en el reconocimiento de voz. Por supuesto en este área también debemos mencionar a nuestros asistentes virtuales, y a todas las plataformas de e-Learning que se valen de ello.

En este artículo hicimos un breve recorrido por la tecnología de texto a voz, y exploramos alguno de sus usos más impactantes. ¿Pensás que faltó alguno?

FV

Diseñador gráfico y web, con ganas de trabajar y aprender todo lo posible de este campo tan variado. Creativo tanto en la vida laboral como personal. Diseñar es el arte de transmitir gráficamente lo que uno imagina. Imagina, crea, diseña.

Deja una respuesta