alvarobartt HF staff commited on
Commit
ec8d6bb
1 Parent(s): 25d60b2

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +17 -7
README.md CHANGED
@@ -1,19 +1,29 @@
1
  ---
2
- title: Argilla Space Template
 
3
  emoji: 🏷️
4
  colorFrom: purple
5
  colorTo: red
6
  sdk: docker
7
  app_port: 6900
8
  fullWidth: true
9
- #suggested_storage: small
10
  tags:
11
- - argilla
 
12
  ---
13
 
14
- This is the Argilla Space Template you can use to deploy and run your own instance of Argilla on the Hugging Face Hub, for labeling, fun, and active learning loops!
15
 
16
- Login with:
17
 
18
- user: argilla
19
- password: 12345678
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ title: Spanish LLM Benchmark Annotation with Argilla
3
+ pin: true
4
  emoji: 🏷️
5
  colorFrom: purple
6
  colorTo: red
7
  sdk: docker
8
  app_port: 6900
9
  fullWidth: true
 
10
  tags:
11
+ - argilla
12
+ short_description: Collaborative effort on Spanish ARC-C, HellaSwag, and MMLU
13
  ---
14
 
15
+ ## Español
16
 
17
+ Este Space de Argilla se ha creado para realizar un esfuerzo colaborativo para anotar o mejorar algunos conjuntos de datos sintéticamente traducidos al Español, utilizados para evaluar LLMs (HellaSwag, ARC-C y MMLU, creados originalmente en Inglés).
18
 
19
+ Los conjuntos de datos utilizados surgen de la combinación de los originales en Inglés, con sus respectivas alternativas traducidas al Español por medio de ChatGPT, gracias al esfuerzo del grupo de Procesamiento Natural de la Universidad de Oregón.
20
+
21
+ Para obtener más información sobre los conjuntos de datos, consultad las guías de anotación para cada uno de ellos en Argilla.
22
+
23
+ ## English
24
+
25
+ This Argilla Space has been created to start a collaborative effort to annotate / curate some existing synthetically generated Spanish translations from existing LLM benchmarks (HellaSwag, ARC-C, and MMLU) orginally written in English.
26
+
27
+ The datasets used are ports from a combination of the original datasets (English ones) with their counterparts translated to Spanish using ChatGPT by the Natural Language Processing group of the University of Oregon.
28
+
29
+ Read more about the datasets within their respective guidelines.