LiciCariola / README.md
AndresIgnacio's picture
Update README.md with project description and usage instructions
48a1c0b verified
metadata
license: mit
datasets:
  - RIPS-Goog-23/RVL-CDIP
  - sailor2/sea-commoncrawl
  - tejasvaidhya/FUNSD
  - satviksh09/hf_legal_dataset_legal_analysis
language:
  - es
metrics:
  - recall
  - precision
  - f1
new_version: openthaigpt/openthaigpt-1.0.0-13b-chat
library_name: transformers
tags:
  - ocr
  - documentAi
  - spanish
  - legal
  - document
  - document ai
  - ai
  - licitation
base_model:
  - microsoft/layoutlmv3-base
  - dccuchile/bert-base-spanish-wwm-cased

LiciCariola: Modelo de Extracci贸n y Procesamiento de Documentos para Licitaciones

Descripci贸n

LiciCariola es un modelo especializado para la extracci贸n y procesamiento de informaci贸n en documentos relacionados con licitaciones p煤blicas y privadas. Dise帽ado espec铆ficamente para manejar documentos escaneados y formularios complejos, LiciCariola ofrece capacidades avanzadas en:

  • Reconocimiento 贸ptico de caracteres (OCR).
  • Clasificaci贸n de estructuras clave como tablas, etiquetas y campos rellenables.
  • Extracci贸n de datos relevantes para propuestas legales y administrativas.

Caracter铆sticas Principales

  • Procesamiento de OCR avanzado: Compatible con documentos en espa帽ol, incluso en calidad baja o escaneados.
  • Extracci贸n estructurada de datos: Automatizaci贸n en la identificaci贸n de t铆tulos, 铆tems, sub铆tems y valores clave.
  • Compatibilidad: Integraci贸n directa con herramientas como Google Cloud SQL, Overleaf, y plataformas de licitaci贸n.
  • Tolerancia a ruidos: Manejo robusto de im谩genes escaneadas con distorsiones.

Ejemplo de Entrada y Salida

Entrada: Un documento escaneado de una licitaci贸n p煤blica, en formato PDF o imagen.

Salida: Estructura JSON o Word:

{
  "licitaci贸n": {
    "t铆tulo": "MUNICIPALIDAD DE EJEMPLO - LICITACI脫N",
    "objetivo": "Adquisici贸n de materiales de construcci贸n",
    "cronograma": {
      "consulta": "2023-01-15",
      "entrega": "2023-02-01"
    },
    "criterios": {
      "precio": "50%",
      "calidad": "30%",
      "plazos": "20%"
    }
  }
}