summarization (resumen)
El Módulo summarize (Resumen)
🇺🇸 English version of this document
El módulo summarize (resumen) toma un documento textual como entrada y devuelve una versión resumida del mismo.
Esta introducción al módulo summarize se divide en las siguientes secciones:
- Entradas y Salidas del Módulo
summarize - Modelos Disponibles en el Módulo
summarize - Parámetros de los Modelos en el Módulo
summarize - Un Pipeline de Módulo Único para el Módulo
summarize - Resumen Recursivo
- Más Información sobre el Módulo
summarize: IO y Conectabilidad
Entradas y Salidas del Modulo summarize
El módulo summarize (resumen) recibe entradas de documentos textuales. Los siguientes formatos de archivo son aceptables:
-
TXT
-
PDF (se convierte automáticamente en TXT antes de procesar)
-
DOCX (se convierte automáticamente en TXT antes de procesar)
-
PPTX (se convierte automáticamente en TXT antes de procesar)
El módulo summarize devuelve un archivo TXT que contiene un resumen del archivo de entrada.
Modelos Disponibles en el Modulo summarize
Puedes activar cualquiera de los siguientes modelos al usar el módulo summarize:
-
bart-large-cnn (predeterminado)
Usa el argumento modules en el método process para determinar qué modelo quieres activo al procesar archivos a través del módulo summarize.
Parametros de los Modelos en el Modulo summarize
Ninguno de los modelos en el módulo summarize es parametrizable. Por ende, al elegir qué modelo usarás a través del argumento modules del método process, params siempre será un diccionario vacío. Por ejemplo:
# ejemplo de selección de modelo para el módulo summarize en el método process
modules={'summarize': {'model':'bart-large-cnn',
'params': {}}}
Un Pipeline de Modulo Unico para el Modulo summarize
Haz clic aquí para detallar un ejemplo de un pipeline de módulo único con un módulo summarize.
Resumen Recursivo
Si el resultado de resumir una vez no es lo suficientemente conciso, hay un elegante truco que puedes usar.
Una de las formas más prácticas para lograr resúmenes más cortos (tal vez más abstractos, pero igual representativos) es resumir recursivamente. En otras palabras, le alimentas un resumen antes creado al módulo summarize una vez más, así produciendo un resumen más breve. Haz clic aquí para detallar un pipeline que hace justamente eso.
Mas Informacion sobre el Modulo summarize: IO y Conectabilidad
Haz clic aquí para visitar documentación Krixik titulada Métodos de Conveniencia (¡y Más!). Allí encontrarás dos herramientas con las que puedes aprender más sobre el módulo summarize: