Update(README) : Ajout d'informations
Browse files
README.md
CHANGED
@@ -45,11 +45,12 @@ Les utilisateurs peuvent utiliser directement le modèle pour des tâches de cla
|
|
45 |
Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
|
46 |
|
47 |
## How to Get Started with the Model
|
48 |
-
|
49 |
-
|
50 |
-
2) Télécharger
|
51 |
-
3) Télécharger le fichier
|
52 |
-
4) Télécharger le fichier
|
|
|
53 |
|
54 |
## Training Details
|
55 |
|
@@ -130,8 +131,20 @@ Ce désequilibre induit un certains biais entre les classes.
|
|
130 |
|
131 |
### Model Architecture and Objective
|
132 |
|
133 |
-
|
134 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
135 |
|
136 |
## Model Card Authors
|
137 |
|
|
|
45 |
Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
|
46 |
|
47 |
## How to Get Started with the Model
|
48 |
+
1) Télécharger et installer le fichier requirements.txt pour les dépendances.
|
49 |
+
```pip install -r requirements.txt```
|
50 |
+
2) Télécharger les fichiers de poids contenu dans les dossiers .zip du modèle pré-entraîné pour la classification des commentaires.
|
51 |
+
3) Télécharger et installer le fichier requirements.txt pour les dépendances
|
52 |
+
4) Télécharger le fichier inference_script.py pour effectuer des prédictions avec le modèle pré-entraîné.
|
53 |
+
5) Télécharger le fichier avec les données d'entrées à prédire
|
54 |
|
55 |
## Training Details
|
56 |
|
|
|
131 |
|
132 |
### Model Architecture and Objective
|
133 |
|
134 |
+
Le notebook .ipynb a pour but la création, l'entraînement et l'évaluation du modèle.
|
135 |
+
Ce script comprend les étapes suivantes :
|
136 |
+
- Chargement et prétraitement du jeu de données annoté manuellement par Datactivist.
|
137 |
+
- Création d'un modèle Camembert et d'un tokenizer.
|
138 |
+
- Entraînement du premier modèle pour prédire les catégories.
|
139 |
+
- Évaluation des performances du premier modèle (catégories)
|
140 |
+
- Prétraitement des données pour le deuxième modèle, concaténation avec les prédictions du premier modèle.
|
141 |
+
- Entraînement du deuxième modèle pour prédire les sous-catégories.
|
142 |
+
- Évaluation des performances du deuxième modèle (sous-catégories).
|
143 |
+
|
144 |
+
L'architecture du modèle est basée sur Camembert et est conçue pour la classification de texte.
|
145 |
+
L'objectif principal est de catégoriser les discussions dans des classes prédéfinies.
|
146 |
+
Le premier modèle classifie sur 6 catégories et le second modèle sur 26 sous-catégories.
|
147 |
+
Et chaque catégorie comporte plusieurs sous-catégories d'appartenances mais le modèle ne prédit que des catégories et sous-catégories d'appartenances uniques.
|
148 |
|
149 |
## Model Card Authors
|
150 |
|