Skip to content

ocr (roc - reconocimiento optico de caracteres)

El Módulo ocr (ROC - Reconocimiento Óptico de Caracteres)

🇺🇸 English version of this document

El módulo ocr (ROC - Reconocimiento Óptico de Caracteres) toma como entrada un archivo de imagen y devuelve todo texto encontrado dentro de esa imagen en un archivo JSON.

Esta introducción al módulo ocr se divide en las siguientes secciones:

Entradas y Salidas del Modulo ocr

El módulo ocr (ROC - Reconocimiento Óptico de Caracteres) recibe entradas de archivos de imagen. Los siguientes formatos de archivo son aceptables:

  • JPG

  • JPEG

  • PNG

El módulo ocr devuelve un archivo JSON. El archivo JSON incluye todo el texto identificado en la imagen. También incluye las coordenadas (en pixeles) de cada trozo de texto identificado.

Modelos Disponibles en el Modulo ocr

Puedes activar cualquiera de los siguientes modelos al usar el módulo ocr:

Usa el argumento modules en el método process para determinar qué modelo quieres activo al procesar archivos a través del módulo ocr.

Parametros de los Modelos en el Modulo ocr

Ninguno de los modelos en el módulo ocr es parametrizable. Por ende, al elegir qué modelo usarás a través del argumento modules del método process, params siempre será un diccionario vacío. Por ejemplo:

# ejemplo de selección de modelo para el módulo ocr en el método process
modules={'ocr': {'model':'tesseract-es',
                 'params': {}}}

Un Pipeline de Modulo Unico para el Modulo ocr

Haz clic aquí para detallar un ejemplo de un pipeline de módulo único con un módulo ocr.

Mas Informacion sobre el Modulo ocr: IO y Conectabilidad

Haz clic aquí para visitar documentación Krixik titulada Métodos de Conveniencia (¡y Más!). Allí encontrarás dos herramientas con las que puedes aprender más sobre el módulo ocr: