A newer version of this model is available: openthaigpt/openthaigpt-1.0.0-13b-chat

LiciCariola: Modelo de Extracción y Procesamiento de Documentos para Licitaciones

Descripción

LiciCariola es un modelo especializado para la extracción y procesamiento de información en documentos relacionados con licitaciones públicas y privadas. Diseñado específicamente para manejar documentos escaneados y formularios complejos, LiciCariola ofrece capacidades avanzadas en:

  • Reconocimiento óptico de caracteres (OCR).
  • Clasificación de estructuras clave como tablas, etiquetas y campos rellenables.
  • Extracción de datos relevantes para propuestas legales y administrativas.

Características Principales

  • Procesamiento de OCR avanzado: Compatible con documentos en español, incluso en calidad baja o escaneados.
  • Extracción estructurada de datos: Automatización en la identificación de títulos, ítems, subítems y valores clave.
  • Compatibilidad: Integración directa con herramientas como Google Cloud SQL, Overleaf, y plataformas de licitación.
  • Tolerancia a ruidos: Manejo robusto de imágenes escaneadas con distorsiones.

Ejemplo de Entrada y Salida

Entrada: Un documento escaneado de una licitación pública, en formato PDF o imagen.

Salida: Estructura JSON o Word:

{
  "licitación": {
    "título": "MUNICIPALIDAD DE EJEMPLO - LICITACIÓN",
    "objetivo": "Adquisición de materiales de construcción",
    "cronograma": {
      "consulta": "2023-01-15",
      "entrega": "2023-02-01"
    },
    "criterios": {
      "precio": "50%",
      "calidad": "30%",
      "plazos": "20%"
    }
  }
}
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.
The model cannot be deployed to the HF Inference API: The model has no pipeline_tag.

Model tree for AndresIgnacio/LiciCariola

Finetuned
(100)
this model

Datasets used to train AndresIgnacio/LiciCariola