LeonSaia commited on
Commit
e284276
·
verified ·
1 Parent(s): a37a79f

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +37 -0
README.md ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: mit
3
+ tags:
4
+ - mistral
5
+ - gguf
6
+ - quantized
7
+ - minerva
8
+ - ollama
9
+ - runpod
10
+ - fine-tuning
11
+ ---
12
+
13
+ # 🧠 Minerva - Modelo afinado a partir de Mistral-7B
14
+
15
+ `minerva` es un modelo de lenguaje entrenado con fine-tuning sobre la base de `mistral-7b`, orientado a mejorar la comprensión contextual y respuestas personalizadas en flujos conversacionales. Entrenado con un dataset de ~480 ejemplos, representa un modelo compacto, eficiente y apto para correr en entornos con recursos limitados (como GPUs de 4GB).
16
+
17
+ ---
18
+
19
+ ## 📦 Detalles Técnicos
20
+
21
+ - **Base Model:** [`mistral-7b`](https://huggingface.co/mistralai/Mistral-7B-v0.1)
22
+ - **Técnica:** Fine-tuning con LoRA
23
+ - **Epochs:** 3
24
+ - **Tamaño del modelo (quantized):** 7.2GB (`q8_0`)
25
+ - **Formato:** GGUF
26
+ - **Conversión:** `llama.cpp` - `convert_hf_to_gguf.py`
27
+ - **Deployment:** [Ollama](https://ollama.com/) + WebUI
28
+ - **Framework de entrenamiento:** [Axolotl](https://github.com/OpenAccess-AI-Collective/axolotl)
29
+ - **Infraestructura:** RunPod + servidor local Ubuntu (4GB VRAM, 16GB RAM)
30
+
31
+ ---
32
+
33
+ ## 🛠️ Instrucciones para usarlo con Ollama
34
+
35
+ ```bash
36
+ ollama pull <usuario>/minerva
37
+ ollama run minerva