introducción
Pipelines de Búsqueda Krixik
🇺🇸 English version of this document
Introducción a Pipelines de Búsqueda
Los pipelines de búsqueda son aquellos que habilitan funciones de búsqueda sobre documentos textuales.
Dos tipos de búsqueda pueden actualmente ser habilitados en Krixik: búsqueda semántica y búsqueda por palabras clave. Dependiendo de cuál de estos quieras usar, el último módulo del pipeline debe respectivamente ser vector-db (base de datos vectorial) o keyword-db (base de datos de palabras clave).
Los pipelines de búsqueda son más complejos que otros pipelines porque usarlos requiere un paso adicional.
-
Primero se deben "cargar" archivos en el pipeline con el método
process. -
Los métodos
keyword_search(búsqueda por palabras clave) ysemantic_search(búsqueda semántica) pueden ser invocados sobre un pipeline de búsqueda una vez uno o más archivos se han procesado a través de él. Ten en cuenta que el métodokeyword_searchsolamente se puede invocar sobre un pipeline que termina con el módulokeyword-dby el métodosemantic_searchsolo puede ser invocado sobre un pipeline que termina con el módulotext-embedderseguido del módulovector-db.
Ejemplos de Pipelines de Búsqueda
-
Búsqueda Semántica Básica: Habilita
búsqueda semánticasobre entradas que son archivos de texto. -
Búsqueda Semántica Sobre Fragmentos: Habilita
búsqueda semánticasobre fragmentos de texto en entradas JSON. -
Búsqueda por Palabras Clave Básica: Habilita
búsqueda por palabras clavesobre entradas que son archivos de texto. -
Búsqueda Semántica Sobre Transcripción:
Transcribeentradas que son archivos audio y luego habilitabúsqueda semánticasobre la transcripción. -
Búsqueda por Palabras Clave Sobre Transcripción:
Transcribeentradas que son archivos audio y luego habilitabúsqueda por palabras clavesobre la transcripción. -
Búsqueda Semántica Sobre Traducción:
Traduceentradas que son archivos de texto y luego habilitabúsqueda semánticasobre la traducción. -
Búsqueda Semántica Sobre Transcripción Traducida:
Transcribeentradas que son archivos audio,traducela transcripción a otro idioma y luego habilitabúsqueda semánticasobre la traducción. -
Búsqueda Semántica Sobre ROC (OCR):
Extrae textode entradas que son imágenes y luego habilitabúsqueda semánticasobre el texto extraído. -
Búsqueda por Palabras Clave Sobre Leyendas de Imagen: Genera
leyendasde entradas que son imágenes y luego habilitabúsqueda por palabras clavesobre las leyendas.