¿Qué es Text To Speech?

Publicado por

La tecnología Text to Speech o por sus siglas en inglés TTS, es un desarrollo de software basado en inteligencia artificial que viene avanzando en los últimos tiempos a pasos agigantados.

En sí, es un tipo de tecnología de asistencia que lee texto en formato digital y lo transforma en voz, también se lo conoce como la tecnología de leer en voz alta.

Este tipo de softwares nacieron con el objeto de dar asistencia a personas con necesidades especiales a nivel de la visión. Pero poco tiempo después se comenzó a aplicar a la industria de la publicidad y del entretenimiento. Generando la voz de personajes, cortos publicitarios, spots, etc.

Con las mejoras en los procesadores y el advenimiento de las tecnologías Cloud, todo el mundo hoy en día puede disponer de un software que transforme el texto digital o lea la pantalla a voz humana.

Cómo funciona el texto a voz

Hoy en día en TTS está incorporado en la mayoría de los dispositivos móviles usando la tecnología de Google Wavenet, pero se puede encontrar para todo tipo de dispositivos.

Incluso hoy en día Word tiene incorporado un software de reconocimiento y emulación de voz con la idea de ayuda a gente con discapacidades visuales.

Sin entrar en detalles técnicos la mayoría del software cuentan con un editor de texto en donde se introduce lo que se desea escuchar y el programa lee en voz alta lo que está escrito.

Al principio estos softwares de emulación de voz eran muy rudimentarios con voces de tipo robótica, pero eso ha quedado atrás. Hoy en día existe una tecnología tal que los dejará boquiabierto, ingrese en esta revisión: Synthesys Review, para ver, lo que estos softwares son capaces de emular la voz humana.

Estas herramientas permiten ajustar el tono de voz, ralentizar o aumentar la velocidad de lectura entre otras muchas cosas.

También muchos de estos programas tienen la capacidad de reconocimiento de caracteres (OCR), lo que permite además poder leer una imagen y pasar a voz el texto encontrado.

Esto es un gran avance para toda aquella persona con disminución visual y con los nuevos programas de voces realmente humanas, la posibilidad de creación de spot radiales, videos y podcasts. Realmente el límite lo pone la imaginación.

Usos comerciales del TTS

La llegada de estos softwares a la industria del entretenimiento generó al principio una acalorada discusión con actores de doblaje y generadores de contenido. Pero a medida que pasa el tiempo es claro que han venido para quedarse. Tecnología de TTS como Synthesys, hoy considerado como uno de los mejores y más realistas softwares de text to speech de mercado lo demuestra con millones de descargas está demostrando que no solo se adquieren estos programas para asistencia a personas, sino también para generar contenidos audiovisuales.

Miles de YouTubers, agencias de publicidad y personas comunes llegan a estos programas para poder tener el sueño de generar un contenido profesional, cosa que antes era difícil por los altos costos de una audición de un locutor profesional.

El text to speech ha llegado para cambiarle la vida a las personas con necesidades especiales y también al público que quiere tener un locutor profesional para sus posteos de internet.