Skip to content

summarization (resumen)

El Módulo summarize (Resumen)

🇺🇸 English version of this document

El módulo summarize (resumen) toma un documento textual como entrada y devuelve una versión resumida del mismo.

Esta introducción al módulo summarize se divide en las siguientes secciones:

Entradas y Salidas del Modulo summarize

El módulo summarize (resumen) recibe entradas de documentos textuales. Los siguientes formatos de archivo son aceptables:

  • TXT

  • PDF (se convierte automáticamente en TXT antes de procesar)

  • DOCX (se convierte automáticamente en TXT antes de procesar)

  • PPTX (se convierte automáticamente en TXT antes de procesar)

El módulo summarize devuelve un archivo TXT que contiene un resumen del archivo de entrada.

Modelos Disponibles en el Modulo summarize

Puedes activar cualquiera de los siguientes modelos al usar el módulo summarize:

Usa el argumento modules en el método process para determinar qué modelo quieres activo al procesar archivos a través del módulo summarize.

Parametros de los Modelos en el Modulo summarize

Ninguno de los modelos en el módulo summarize es parametrizable. Por ende, al elegir qué modelo usarás a través del argumento modules del método process, params siempre será un diccionario vacío. Por ejemplo:

# ejemplo de selección de modelo para el módulo summarize en el método process
modules={'summarize': {'model':'bart-large-cnn',
                       'params': {}}}

Un Pipeline de Modulo Unico para el Modulo summarize

Haz clic aquí para detallar un ejemplo de un pipeline de módulo único con un módulo summarize.

Resumen Recursivo

Si el resultado de resumir una vez no es lo suficientemente conciso, hay un elegante truco que puedes usar.

Una de las formas más prácticas para lograr resúmenes más cortos (tal vez más abstractos, pero igual representativos) es resumir recursivamente. En otras palabras, le alimentas un resumen antes creado al módulo summarize una vez más, así produciendo un resumen más breve. Haz clic aquí para detallar un pipeline que hace justamente eso.

Mas Informacion sobre el Modulo summarize: IO y Conectabilidad

Haz clic aquí para visitar documentación Krixik titulada Métodos de Conveniencia (¡y Más!). Allí encontrarás dos herramientas con las que puedes aprender más sobre el módulo summarize: