Descripción

El imagotipo representa un Smartphone con piernas y brazos, caminando, con una lupa en una mano y con gafas de sol.
La pantalla del Smartphone incluye cuadrados dentro que representan la distribución habitual del menú de apps.
Debajo de este icono o personaje, se incluye el nombre del proyecto 'BuscaApps', seguido de un pequeño subtitulo que dice: 'Encuentra apps accesibles para todos'

Ocultar

voicebox (Windows)

datos de la aplicación:

Notas de la aplicación

Para descargar la aplicación, debemos entrar en:
http://voicebox.sh
Una vez en la página, buscamos, casi al final de la página, bajo un encabezado de nivel 2, download voicebox, y bajo este encabezamiento los diferentes tipos de descargas según las plataformas.

Esta aplicación está disponible para Windows, Mac y Linux, aunque solo ha sido probada en Windows.

Es importante que, aunque su interfaz es un entorno web, utilicemos el modo foco, pues llegaremos a opciones que no se alcanzan con el modo exploración. Los más expertos pueden combinar ambos modos del lector de pantalla para hacer más ágil la navegación.

creando una voz.

Lo primero que tenemos que hacer es crear un modelo de voz, por ejemplo, la nuestra, o la de cualquier otra persona.

Es importante, llegado a este punto, tener en cuenta factores como la privacidad y la ética, ya que no debemos usar una voz sin permiso de la persona, ni con fines destructivos.

Ahora pulsaremos el botón Voices

como no tenemos aún ninguna creada, obtendremos una tabla vacía y un botón para nueva voz (new voice), el cual pulsaremos.

En la ventana que aparece, tenemos tres opciones en forma de pestañas, para proporcionarle la muestra de voz:

Mi recomendación es elegir la primera pestaña (upload) y subir un archivo de audio con una muestra de entre 10 y 30 segundos, con la voz que queramos clonar y en la mejor calidad posible.

Es muy importante, elegir en el desplegable que encontraremos más abajo, el idioma español y revisar que ha quedado seleccionado.

subiremos el archivo de audio, una vez seleccionada la primera pestaña y en el cuadro de texto escribimos lo que dice dicho audio exactamente o pulsamos el botón transcribe para que el propio programa nos transcriba el texto del audio subido.

Damos un nombre, por ejemplo, el nombre de la persona cuya voz estamos usando como muestra y una descripción opcional a esta muestra de voz y pulsamos el botón (create).

Nos dirá que se ha creado y ya tenemos el primer modelo de voz, para crear habla a partir de un texto.

Encontraremos una tabla donde aparecerán las voces, en nuestro caso solo una.

Para seguir este minitutorial, deberíamos crear otro modelo con la voz de otra persona.

Una vez tengamos dos voces, tendremos en la tabla dichas voces y, seleccionando una de ellas con la barra espaciadora, por ejemplo, podremos editarla, exportarla, o borrarla, entre otros.

generando texto a voz

Ya tenemos dos voces diferentes creadas, con las cuales vamos a crear muestras de estas, con el texto deseado.

para ello pulsamos el enlace generate.
bajo encabezado de nivel 2, encontramos el título Voicebox.

a partir de él, buscamos botones etiquetados como: create, import, y botones con los nombres de las voces que ya hemos creado.

Nos dirá cuál de las voces está seleccionada y, por consiguiente, con cual se va a hacer la conversión del texto a dicha voz.
Esto lo podemos cambiar pulsando en otra voz deseada.

También encontraremos, si ya hubiésemos hecho alguna conversión o ejemplo, botones con dichos ejemplos.
Más abajo encontraremos un cuadro de edición para convertir el texto introducido con la voz seleccionada, el idioma de la conversión, el cual habremos de seleccionar, el modelo a usar, el cual, normalmente será 1.7 y no modificaremos y un cuadro combinado por si queremos usar algún efecto.

Todo esto está bajo el botón generate, que es el que genera el audio a partir del texto introducido y que está encima de los cuadros combinados, ya mencionados, los cuales tendremos que revisar antes de pulsar dicho botón.

En resumen:

Cuadro para introducir el texto, botón generate para convertir el texto, y los cuadros combinados de lenguaje y demás ya comentados.

Una vez introducido el texto y pulsado el botón generate, esperaremos un tiempo hasta escuchar la conversión, lo cual nos indicará que ya está realizada. Esto puede llevar bastante tiempo, salvo que tengamos una máquina muy rápida o una tarjeta gráfica.

Ahora haremos otra conversión con la otra voz que teníamos como muestra.

Ya tenemos dos voces, las cuales serán botones que podremos navegar usando el tabulador.

en cada botón o ejemplo creado, tenemos varias opciones en orden de tabulación como son:
el nombre de la voz, el texto que hemos usado para dicho ejemplo, agregar el ejemplo a favorito y un botón de acción con opciones como:
reproducir, exportar audio, exportar paquete, (que significa la voz y su conversión), aplicarle efectos, volver a generar y eliminar.

La opción más interesante es la segunda, exportar y con un editor de audio tratarla como queramos o unirla con otros ejemplos que hayamos realizado.

consejo importante:

Existen opciones, o apartados del programa, como stories y efects.
en la primera podemos, con varios ejemplos de voz que hayamos hecho, encadenarlas unas con otras para hacer una historia o conversación. En la segunda podemos manejar los efectos. Todo esto es mucho más sencillo, una vez exportemos las voces, como se explicó antes, importarlas en un editor de audio y manejarlas desde allí.

otras opciones

Por citar las demás opciones del programa, tenemos audio, con la que podemos dirigir cada modelo de voz a una tarjeta de sonido y settings, para configurar algunos parámetros avanzados del programa y buscar actualizaciones.


Actualizado a 21/04/2026

Compartir:

CorreoWhatsAppFacebook

Aporta más información

Si conoces recursos útiles para esta app, o alguno de sus enlaces no están operativos, puedes aportar información actualizada.