BercyHub commited on
Commit
6738058
·
1 Parent(s): 9359fc3

Update(README) : Ajout d'informations

Browse files
Files changed (1) hide show
  1. README.md +20 -7
README.md CHANGED
@@ -45,11 +45,12 @@ Les utilisateurs peuvent utiliser directement le modèle pour des tâches de cla
45
  Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
46
 
47
  ## How to Get Started with the Model
48
-
49
- 1) Télécharger les fichiers de poids contenu dans les dossiers .zip du modèle pré-entraîné pour la classification des commentaires.
50
- 2) Télécharger et installer le fichier requirements.txt pour les dépendances
51
- 3) Télécharger le fichier inference_script.py pour effectuer des prédictions avec le modèle pré-entraîné.
52
- 4) Télécharger le fichier avec les données d'entrées à prédire
 
53
 
54
  ## Training Details
55
 
@@ -130,8 +131,20 @@ Ce désequilibre induit un certains biais entre les classes.
130
 
131
  ### Model Architecture and Objective
132
 
133
- [More Information Needed]
134
-
 
 
 
 
 
 
 
 
 
 
 
 
135
 
136
  ## Model Card Authors
137
 
 
45
  Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
46
 
47
  ## How to Get Started with the Model
48
+ 1) Télécharger et installer le fichier requirements.txt pour les dépendances.
49
+ ```pip install -r requirements.txt```
50
+ 2) Télécharger les fichiers de poids contenu dans les dossiers .zip du modèle pré-entraîné pour la classification des commentaires.
51
+ 3) Télécharger et installer le fichier requirements.txt pour les dépendances
52
+ 4) Télécharger le fichier inference_script.py pour effectuer des prédictions avec le modèle pré-entraîné.
53
+ 5) Télécharger le fichier avec les données d'entrées à prédire
54
 
55
  ## Training Details
56
 
 
131
 
132
  ### Model Architecture and Objective
133
 
134
+ Le notebook .ipynb a pour but la création, l'entraînement et l'évaluation du modèle.
135
+ Ce script comprend les étapes suivantes :
136
+ - Chargement et prétraitement du jeu de données annoté manuellement par Datactivist.
137
+ - Création d'un modèle Camembert et d'un tokenizer.
138
+ - Entraînement du premier modèle pour prédire les catégories.
139
+ - Évaluation des performances du premier modèle (catégories)
140
+ - Prétraitement des données pour le deuxième modèle, concaténation avec les prédictions du premier modèle.
141
+ - Entraînement du deuxième modèle pour prédire les sous-catégories.
142
+ - Évaluation des performances du deuxième modèle (sous-catégories).
143
+
144
+ L'architecture du modèle est basée sur Camembert et est conçue pour la classification de texte.
145
+ L'objectif principal est de catégoriser les discussions dans des classes prédéfinies.
146
+ Le premier modèle classifie sur 6 catégories et le second modèle sur 26 sous-catégories.
147
+ Et chaque catégorie comporte plusieurs sous-catégories d'appartenances mais le modèle ne prédit que des catégories et sous-catégories d'appartenances uniques.
148
 
149
  ## Model Card Authors
150