Cómo extraer texto de una imagen

0

Muchas veces nos hemos hallado con algún tipo de información en forma de texto que necesitamos copiar pero se encuentra contenida en una imagen, y ante esto hay varias opciones, pero en general todas requieren que tipeemos manualmente el texto de la imagen para poder tenerlo libre. Sin embargo, la herramienta Ground Truth Text nos enseña cómo extraer texto de una imagen sin hacer más que señalar el mismo y copiarlo.

En una época donde los faxes y los escaneos de imágenes siguen estando vigentes, además de los documentos en PDF, las oportunidades en las que podamos llegar a necesitar una aplicación para extraer texto de imágenes pueden ser muchas. Es que no es lo mismo tipear un párrafo o dos del texto de una imagen para reproducirlo, que traspasarlo automáticamente y sin esfuerzo a un bloc de notas. Ground Truth Text o Gttext es una aplicación de código abierto que te guía en el proceso de cómo extraer texto de una imagen y copiarlo en el portapapeles para que lo pegues en donde lo necesites. 

Para comenzar el proceso de traducción de imagen a texto puedes seleccionar la imagen que lo contenga y luego de ello ir a Nuevo Archivo (new file), donde la aplicación te dará una lista de extensiones disponibles. Elige la que corresponde a tu imagen. A continuación, si quieres extraer texto de una imagen completa, debes ir al panel de herramientas ubicado en Tools y luego clic en Copy Text > Full Image. A su vez también puedes utilizar el atajo de teclado Ctrl + F para capturar todo el texto de una imagen. Si en cambio quieres hacer un trabajo más fino y escoger únicamente determinados bloques de textos, oraciones o palabras, ve a Tools > Area Text OCR y selecciona aquellos pixeles que quieres convertir a texto plano haciendo un rectángulo.

 Cómo extraer texto de una imagen

Si quieres darle otro intento cuando reconoce poco, Try Again.

El algoritmo tiene un funcionamiento bastanteaceptable, y salvo en imágenes con fuentes extrañas o con muy mala calidad cuyos resultados  son nulos, la aplicación suele reconocer algunas palabras escritas fundamentalmente en imprenta mayúscula, pues otros formatos crean complicaciones. Sin embargo, y como Gttext es falible, tiene un botón llamado Try Again (intentar nuevamente), con el cual podrás pedirle a la aplicación que haga una relectura de la imagen y consiga un mejor resultado como para no tener que estar sobreeditándolo más tarde.  Además de varios filtros para diferentes imágenes, la aplicación para extraer texto de una imagen puede realizar zooms o alejar el documento para una mejor lectura y análisis. Gratuito y de código abierto, pero para Windows.

 

Acerca de Don Stroke

Opina

*