datos de la aplicación:
Notas de la aplicación
Esta aplicación está en desarrollo y puede ser inestable.
Aplicación OCR (reconocedor óptico de caracteres) que emplea la inteligencia artificial (AI) y que puede funcionar de forma independiente o en combinación con la app Voice Dream Reader. Nos permite reconocer texto impreso en papel (como libros, carteles, menús de restaurantes, tickets…), Así como el texto Que aparece en la pantalla del ordenador cuando éste se cuelga. Incluso permite reconocer el texto que haya en fotografías, importándolas desde la propia aplicación o desde otras por medio de una extensión que se añade al menú “Compartir”. En cuanto al tema de reconocer Archivos PDF inaccesibles por ser una imagen, esto último tan sólo se puede hacer desde Voice dream Reader y sin necesidad de tener instalado este OCR.
La aplicación sorprende por su rapidez, sencillez y efectividad. No requiere de conexión a Internet (el reconocimiento se realiza en el propio dispositivo, por lo que la privacidad está garantizada), integra un reproductor "texto a voz" que emplea las voces del sistema o compradas en Voice dream Reader, proporciona una ayuda sonora que nos indica la cantidad de texto reconocido en el campo de visión de la cámara, permite guardar/compartir el texto escaneado, y aunque es de pago, el precio es muy asequible y es de un solo pago (sin suscripciones mensuales). En el momento de la redacción de esta entrada el coste es de unos 6.49 € Como ya he adelantado anteriormente, puede funcionar de forma independiente o en combinación con Voice Dream Reader, reconociendo los documentos directamente desde esta otra aplicación (desde el botón "Añadir") así como guardar los documentos escaneados en su biblioteca. Y en cuanto a reconocer los archivos PDF inaccesibles, esto se tiene que hacer desde Voice Dream Reader (no se puede hacer de forma independiente desde Voice Dream Scanner, sino que precisa de esta otra aplicación), y lo curioso es que se pueden reconocer desde el Reader sin necesidad de instalar ni emplear Voice Dream Scanner.
Características adicionales:
- Detección automática de bordes de documentos para estiramiento y recorte.
- Detección automática de orientación de documentos y auto rotación.
- Detección automática de idioma.
- Mejora automática de la imagen.
- Modo por lotes para escanear varias páginas rápidamente.
- Las palabras se resaltan en el texto o la imagen mientras son verbalizadas.
- Se puede seleccionar la voz del sintetizador y cambiar su velocidad.
- Se pueden utilizar las voces del sistema o las premium compradas en Voice Dream Reader.
Limitaciones: Solo funciona con idiomas con alfabetos latinos. No funciona con arabe, búlgaro, chino, griego, hebreo, japonés, coreano o ruso.
Descripción del interfaz
Su apariencia es sencilla y funcional. En la pantalla principal encontramos los siguientes botones:
- “Menú”. Aquí es donde podemos acceder entre otras cosas, a la configuración de la aplicación para modificar algunos parámetros como por ejemplo el idioma, la ayuda sonora a la hora de enfocar los documentos, la mejora de las imágenes, la lectura automática del texto escaneado tras ser reconocido, o que se muestre sin formato el texto resultante de la captura.
- "Importar foto". Desde aquí podemos acceder a la fototeca de nuestro iPhone para reconocer el texto que aparezca en las fotografías.
- “Detección de límites”. Función que detecta automáticamente los bordes de la página del documento en el caso de que deseemos recortar el texto.
- “Linterna”. Para activar/desactivar la luz del flash si hay poca iluminación.
- “Modo por lotes”. Función que se puede activar en caso de que queramos reconocer de forma rápida un documento con muchas páginas y deseemos que el resultado sea un único archivo.
- “Capturar imagen”. Este botón se encuentra en la parte central inferior de la pantalla y es el que dispara la cámara para realizar el reconocimiento (siempre y cuando no tengamos activado la captura automática). Como ayuda al enfoque del documento a escanear, la aplicación emite un tono que nos indica cuando está bien enfocado y se detectan adecuadamente sus bordes (cuanto más fuerte es este tono, mejor).
- “Captura automática”. Una función que dispara la captura de forma automática cuando el texto está correctamente enfocado y la cámara permanece estable.
Funcionamiento
Es muy sencillo. La aplicación se puede iniciar desde su propio icono o desde la pantalla principal de Voice Dream Reader, desde el botón "Añadir".
- Una vez abierta la app, enfocamos el documento con la cámara trasera del móvil a una distancia de unos 20 cm (dependiendo del tamaño de la página del documento esta distancia puede ser mayor o inferior). Se emite un tono acústico para indicar que se detectan correctamente los bordes del documento y el texto. Si hemos colocado un documento por la cara en la que no hay letras, no escucharemos el tono, lo cual es genial, ya que así no desperdiciamos nuestro tiempo escaneando folios en blanco. Cuando el tono sea más intenso, podemos pulsar el botón que realiza la captura y que se encuentra en la parte inferior central de la pantalla (en el caso de que tengamos activada la captura automática, la propia aplicación dispara la cámara).
- Tras realizarse el reconocimiento del texto, pasamos automáticamente a la pantalla de reproducción. Si hemos activado la auto reproducción, la app empezará a leernos automáticamente el texto. Si no, podemos realizar una doble pulsación con dos dedos en medio de la pantalla para escucharlo, o pulsar el botón “Reproducir” (si el texto se lee en un idioma distinto al español o deseamos cambiar la voz seleccionada, debemos ir al botón “Configurar voz” y seleccionar el idioma y la voz deseados). Este mismo botón de reproducción es un ajustable que nos permite avanzar/retroceder por el texto reconocido realizando flicks arriba y abajo. Para pausar la reproducción, podemos realizar una doble pulsación con dos dedos en medio de la pantalla, o presionar el botón “Pausar”.
- Si deseamos explorar el texto por medio de VoiceOver, debemos ir al botón “Ver texto o imagen” y pulsarlo de forma que quede en “Mostrando texto”. Luego nos desplazamos al cuadro donde se muestra el texto, y a través del rotor, podemos navegar por líneas, palabras o caracteres.
- Si no queremos guardar la imagen o ésta no ha sido bien reconocida, debemos pulsar el botón “Descartar”. En el caso de que deseemos guardar la imagen, debemos pulsar el botón “Mantener”.
- Al pulsar el botón “Mantener”, vamos a una nueva pantalla en la que aparte de la vista de la página o páginas reconocidas, aparecen varios botones interesantes:
- “Limpiar”. Para borrar la página o páginas escaneadas y volver a la pantalla inicial.
- “Guardar”. Para guardar el texto en la aplicación Voice Dream Reader, guardarlo/compartirlo como PDF o archivo de texto sin formato, o copiarlo. Si seleccionamos la opción de guardarlo como archivo PDF o texto, aparece una pantalla para ponerle un título, y tras presionar el botón “Aceptar” nos aparece la típica pantalla para guardar/compartir. Si seleccionamos la opción de copiar, esto nos copia el documento en el portapapeles para poder pegarlo directamente donde queramos.
- “Capturar imagen”. Este botón nos permite realizar otra captura para añadir una nueva página al documento actual. Tras presionarlo, o esperar a que se dispare la captura automática, nos lleva a la pantalla de reproducción, y si pulsamos el botón de “Mantener”, volvemos a esta misma página donde en la vista previa aparecerá la página anterior y esta nueva. Esta acción la podemos realizar tantas veces como deseemos antes de guardar/compartir el documento que incluirá todas las páginas reconocidas. La diferencia entre esto o activar el modo “Modo por lotes” en la página principal, es que de esta forma podemos escuchar la reproducción de cada página antes de escanear la siguiente, mientras que en el modo por lotes podemos ir pulsando el botón de capturar la imagen repetidamente ante cada página nueva, sin necesidad de pasar por la pantalla de reproducción.
Cómo capturar varias páginas de forma seguida en el “Modo por lotes”
Esta función nos puede resultar útil en el caso de que deseemos reconocer varias páginas seguidas de un mismo documento extenso o de un libro, todo ello de forma rápida y que el resultado sea un solo archivo.
Tal y como hemos visto antes, esto no nos permite reproducir el texto de cada una de las páginas (para ello hay que emplear el sistema que hemos visto antes, en la opción “Capturar imagen” que aparece tras presionar “Mantener”), pero sí que podemos previsualizarlas/escucharlas con VoiceOver.
Con este modo la aplicación irá capturando de forma continua las páginas que le pongamos delante de la cámara. Esto es muy práctico y rápido sobre todo si tenemos activada la opción de captura automática, pues basta con ir sustituyendo y colocando encima de la mesa una página tras otra para que la aplicación las vaya capturando. Eso sí, al momento de cambiar una por otra, tenemos que tener la precaución de tapar el objetivo de la cámara para que no continúe capturando sin querer. Yo lo que hago, es que mientras coloco la siguiente página a escanear, me acerco el objetivo de la cámara al pecho para taparlo. Y si se trata de un libro, lo que hago es que voy tapando con un folio en blanco la página contraria a la que deseo escanear. Luego, pasó el folio a la página capturada y muevo el móvil a la otra hoja.
Todas las páginas que se van capturando con esta función, se pueden previsualizar de forma individual en esta misma pantalla. Cuando guardemos el resultado, se creará un único documento con todas ellas juntas.
Cómo reconocer con Voice dream Reader un documento PDF inaccesible
Esto es algo que tan sólo podréis hacer los que tengáis instalada la aplicación Voice dream Reader en vuestros iPhone, pero ya que he hecho referencia varias veces en este artículo a esta app y a esta función, os pongo a continuación como se hace.
En ocasiones recibimos documentos PDF por mail o WhatsApp que son inaccesibles ya que son un escaneado guardado como imagen. El lector de pantalla VoiceOver no es capaz de leer estos archivos por sí mismo, pero Voice Dream Reader sí (y sin necesidad de tener instalada Voice Dream Scanner). Los pasos para realizar este proceso son los siguientes:
- Hay que abrir primero el documento PDF en Voice Dream Reader desde la aplicación en la que tengamos ese archivo (a través del menú “Compartir”).
- Una vez importado el documento, lo seleccionamos en la biblioteca y lo abrimos realizando una doble pulsación con un dedo. En ese momento la propia aplicación reconoce que se trata de un PDF inaccesible y nos pregunta que si deseamos realizar OCR en él. Decimos que sí para iniciar el proceso de reconocimiento, el cual se lleva a cabo en segundo plano.
- Una vez finalizado el reconocimiento ya tendremos disponible en pantalla el documento totalmente accesible para ser reproducido desde el propio Voice Dream Reader, o para exportarlo a cualquier otra ubicación/aplicación.
Ahora, si volvemos atrás, a la biblioteca, observaremos que aparentemente tenemos dos documentos: el PDF inaccesible original y el PDF reconocido. Se trata del mismo archivo, de hecho, si entramos en el inaccesible se abre el reconocido, y si eliminamos éste, se eliminan ambos.
Nota: Si al empezar a reproducir el documento en Voice Dream Reader, éste se lee con la voz en inglés, tenéis que pulsar el botón “configuración de audio” y seleccionar de nuevo el idioma español y la voz deseada.
Notas: este texto corresponde a la versión de la app para iOS que realizó Jaime Franco. No se ha probado la versión de Android, aunque por lo leído en la Google Play el funcionamiento debe ser similar.