metadata
license: mit
datasets:
- RIPS-Goog-23/RVL-CDIP
- sailor2/sea-commoncrawl
- tejasvaidhya/FUNSD
- satviksh09/hf_legal_dataset_legal_analysis
language:
- es
metrics:
- recall
- precision
- f1
new_version: openthaigpt/openthaigpt-1.0.0-13b-chat
library_name: transformers
tags:
- ocr
- documentAi
- spanish
- legal
- document
- document ai
- ai
- licitation
base_model:
- microsoft/layoutlmv3-base
- dccuchile/bert-base-spanish-wwm-cased
LiciCariola: Modelo de Extracci贸n y Procesamiento de Documentos para Licitaciones
Descripci贸n
LiciCariola es un modelo especializado para la extracci贸n y procesamiento de informaci贸n en documentos relacionados con licitaciones p煤blicas y privadas. Dise帽ado espec铆ficamente para manejar documentos escaneados y formularios complejos, LiciCariola ofrece capacidades avanzadas en:
- Reconocimiento 贸ptico de caracteres (OCR).
- Clasificaci贸n de estructuras clave como tablas, etiquetas y campos rellenables.
- Extracci贸n de datos relevantes para propuestas legales y administrativas.
Caracter铆sticas Principales
- Procesamiento de OCR avanzado: Compatible con documentos en espa帽ol, incluso en calidad baja o escaneados.
- Extracci贸n estructurada de datos: Automatizaci贸n en la identificaci贸n de t铆tulos, 铆tems, sub铆tems y valores clave.
- Compatibilidad: Integraci贸n directa con herramientas como Google Cloud SQL, Overleaf, y plataformas de licitaci贸n.
- Tolerancia a ruidos: Manejo robusto de im谩genes escaneadas con distorsiones.
Ejemplo de Entrada y Salida
Entrada: Un documento escaneado de una licitaci贸n p煤blica, en formato PDF o imagen.
Salida: Estructura JSON o Word:
{
"licitaci贸n": {
"t铆tulo": "MUNICIPALIDAD DE EJEMPLO - LICITACI脫N",
"objetivo": "Adquisici贸n de materiales de construcci贸n",
"cronograma": {
"consulta": "2023-01-15",
"entrega": "2023-02-01"
},
"criterios": {
"precio": "50%",
"calidad": "30%",
"plazos": "20%"
}
}
}