Tecnoconocimiento Accesible

TCA ConvertDoc 1.4, hazle OCR a PDF de gran tamañño!


Listen Later

Muy atentos. Hoy les comparto la actualización de mi programa para convertir entre formatos de documentos: TCA ConvertDoc, que llega a la versión 1.4, restructurado y muy mejorado sobre todo en OCR. ,

Antes, para quienes no lo conozcan:

¿Qué es TCA ConvertDoc?

es una pequeña utilidad (Windows) portable, gratuito, desarrollada en el lenguaje de programación: Python

Cuenta con una interfaz 100% accesible, con atajos de teclado.

Nos permite convertir entre formatos de documentos: doc, docx, RTF, epub, pdf, HTML, odt, txt, markdown, PNG, JPG (OCR), Y: PPTx. De una forma sencilla, directa y accesible.

También: TCA ConvertDoc puede reconocer imágenes en formato png, archivos PDF jpg y pasarlas al formato TXT (haciéndoles un Reconocimiento óptico de Caracteres u OCR).

Convertir documentos, nunca fue más sencillo, no solo de forma individual lo vamos a poder realizar;

TCA ConvertDoc también nos permite convertir por lotes, es decir, vamos a poder agregar toda una carpeta, y en segundos tendremos todos los archivos convertidos al formato escogido, todos de una sola vez.

Novedades en: TCA ConvertDoc 1.4:

• Selección de motor OCR:

En TCA ConvertDoc 1.4 podremos seleccionar ahora en la interfaz principal, desde un cómodo cuadro combinado el motor OCR que deseamos utilizar;

Podemos optar por:

Tesseract: es el motor OCR por defecto.

LTSM: es otro motor OCR que viene incorporado en el paquete Tesseract, que puede dar mejores resultados. En su contra, se dice que puede ser un tanto más lento.

• Selección de idioma del OCR:

También ahora podremos escoger el idioma En el que deseamos realizar el reconocimiento óptico de caracteres (OCR). Por ahora solo contamos con 3 idiomas:

Español: es el idioma seleccionado por defecto.

Inglés.

Italiano.

Los podemos escoger desde el cuadro combinado: “Lenguaje del OCR” que se encuentra en la interfaz principal.

• TCA ConvertDoc 1.4 puede hacer OCR a PDFs de gran tamaño:

Se optimizó el reconocimiento óptico de caracteres, para archivos PDF de gran tamaño (con muchas páginas). Ahora la conversión se realiza sin problemas, y lo hace más rápido que la versión anterior.

• TCA ConvertDoc 1.4 informará de errores:

Ahora si el programa detecta que sucede o encuentra cualquier error, lo informará en una ventana de diálogo, con lo que se facilita saber el porqué del error.

• Se añadió la traducción a los  idiomas inglés y turco:

Ahora TCA ConvertDoc, soporta el idioma inglés y el turco, aparte del italiano y español de la versión anterior.

• Atajos de teclado en la interfaz principal:

Ahora contamos con atajos de teclado para llegar rápidamente a los controles de la interfaz principal:

Escoja (Alt+E).

Lenguaje del OCR (Alt+L)

Motor OCR (Alt+M).

Y el que ya teníamos: Convertir (Alt+C).

• Se actualizó Tesseract.

El motor OCR Tesseract, se actualizó a su última versión. También la librería: Pytesseract.

• Restructurado todo el código de TCA ConvertDoc:

Todo el código ha sido restructurado, optimizado, corregido y mejorado. Algunas conversiones no funcionaban de forma correcta.

Aparte ahora está basado en Python 3.11 con lo que se potencia el programa.

...more
View all episodesView all episodes
Download on the App Store

Tecnoconocimiento AccesibleBy Tecnoconocimiento Accesible


More shows like Tecnoconocimiento Accesible

View all
Applelianos by Applelianos

Applelianos

56 Listeners

Tiflo Audio by tifloaudio.com

Tiflo Audio

7 Listeners

Actualidad Accesible by Actualidad accesible, Alfonzo Villalobos, José Almagro y Gerardo mani

Actualidad Accesible

1 Listeners

Canal TifloAcosta by Tony Acosta

Canal TifloAcosta

0 Listeners

Gafotas, Cegatos y sus Aparatos - Podcast by Arturo Fernández / Ricardo Abad

Gafotas, Cegatos y sus Aparatos - Podcast

0 Listeners