ocr (roc - reconocimiento optico de caracteres)
El Módulo ocr (ROC - Reconocimiento Óptico de Caracteres)
🇺🇸 English version of this document
El módulo ocr (ROC - Reconocimiento Óptico de Caracteres) toma como entrada un archivo de imagen y devuelve todo texto encontrado dentro de esa imagen en un archivo JSON.
Esta introducción al módulo ocr se divide en las siguientes secciones:
- Entradas y Salidas del Módulo
ocr - Modelos Disponibles en el Módulo
ocr - Parámetros de los Modelos en el Módulo
ocr - Un Pipeline de Módulo Único para el Módulo
ocr - Más Información sobre el Módulo
ocr: IO y Conectabilidad
Entradas y Salidas del Modulo ocr
El módulo ocr (ROC - Reconocimiento Óptico de Caracteres) recibe entradas de archivos de imagen. Los siguientes formatos de archivo son aceptables:
-
JPG
-
JPEG
-
PNG
El módulo ocr devuelve un archivo JSON. El archivo JSON incluye todo el texto identificado en la imagen. También incluye las coordenadas (en pixeles) de cada trozo de texto identificado.
Modelos Disponibles en el Modulo ocr
Puedes activar cualquiera de los siguientes modelos al usar el módulo ocr:
-
tesseract-en - (predeterminado) inglés
-
tesseract-es - español
Usa el argumento modules en el método process para determinar qué modelo quieres activo al procesar archivos a través del módulo ocr.
Parametros de los Modelos en el Modulo ocr
Ninguno de los modelos en el módulo ocr es parametrizable. Por ende, al elegir qué modelo usarás a través del argumento modules del método process, params siempre será un diccionario vacío. Por ejemplo:
# ejemplo de selección de modelo para el módulo ocr en el método process
modules={'ocr': {'model':'tesseract-es',
'params': {}}}
Un Pipeline de Modulo Unico para el Modulo ocr
Haz clic aquí para detallar un ejemplo de un pipeline de módulo único con un módulo ocr.
Mas Informacion sobre el Modulo ocr: IO y Conectabilidad
Haz clic aquí para visitar documentación Krixik titulada Métodos de Conveniencia (¡y Más!). Allí encontrarás dos herramientas con las que puedes aprender más sobre el módulo ocr: