Spaces:

MMOON
/

APERTUSMM

Running

App Files Files Community

MMOON commited on 12 days ago

Commit

02f9aa6

verified ·

1 Parent(s): 3116c2c

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +39 -37

src/streamlit_app.py CHANGED Viewed

@@ -3,7 +3,10 @@ import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 from huggingface_hub import login
 # --- CONFIGURATION DE LA PAGE ---
 st.set_page_config(
     page_title="Chat Avancé avec Apertus",
     page_icon="🚀",
@@ -11,28 +14,15 @@ st.set_page_config(
     initial_sidebar_state="expanded",
 )
-# --- STYLES CSS PERSONNALISÉS (Optionnel) ---
-st.markdown("""
-<style>
-    .stSpinner > div > div {
-        border-top-color: #f63366;
-    }
-    .stChatMessage {
-        background-color: #f0f2f6;
-        border-radius: 10px;
-        padding: 15px;
-        margin-bottom: 10px;
-    }
-</style>
-""", unsafe_allow_html=True)
-# --- BARRE LATÉRALE DE CONFIGURATION ---
 with st.sidebar:
     st.title("🚀 Paramètres")
     st.markdown("Configurez l'assistant et le modèle de langage.")
-    # --- Authentification Hugging Face ---
     st.subheader("Authentification Hugging Face")
     hf_token = st.text_input("Votre Token Hugging Face (hf_...)", type="password")
     if st.button("Se Connecter"):
@@ -46,7 +36,7 @@ with st.sidebar:
         else:
             st.warning("Veuillez entrer un token Hugging Face.")
-    # --- Sélection du Modèle ---
     st.subheader("Sélection du Modèle")
     model_options = {
         "Apertus 8B (Rapide)": "swiss-ai/Apertus-8B-Instruct-2509",
@@ -56,23 +46,34 @@ with st.sidebar:
     model_id = model_options[selected_model_name]
     st.caption(f"ID du modèle : `{model_id}`")
-    # --- Paramètres de Génération ---
     st.subheader("Paramètres de Génération")
-    temperature = st.slider("Température", min_value=0.1, max_value=1.5, value=0.7, step=0.05,
-                              help="Plus la valeur est élevée, plus la réponse est créative et aléatoire.")
-    max_new_tokens = st.slider("Tokens Max", min_value=64, max_value=1024, value=256, step=64,
-                                 help="Longueur maximale de la réponse générée.")
-    top_p = st.slider("Top-p (Nucleus Sampling)", min_value=0.1, max_value=1.0, value=0.95, step=0.05,
-                      help="Contrôle la diversité en sélectionnant les mots les plus probables dont la somme des probabilités dépasse ce seuil.")
     # --- Bouton pour effacer l'historique ---
     if st.button("🗑️ Effacer l'historique"):
         st.session_state.messages = []
         st.experimental_rerun()
-# --- CHARGEMENT DU MODÈLE (MIS EN CACHE) ---
 @st.cache_resource(show_spinner=False)
 def load_model(model_identifier):
     """Charge le tokenizer et le modèle avec quantification 4-bit."""
@@ -90,19 +91,21 @@ def load_model(model_identifier):
         )
     return tokenizer, model
-# Charge le modèle sélectionné
 try:
     tokenizer, model = load_model(model_id)
 except Exception as e:
     st.error(f"Impossible de charger le modèle. Assurez-vous d'être connecté si le modèle est privé. Erreur : {e}")
     st.stop()
 # --- INTERFACE DE CHAT PRINCIPALE ---
 st.title("🤖 Chat avec Apertus")
 st.caption(f"Vous discutez actuellement avec **{selected_model_name}**.")
-# Initialisation de l'historique du chat
 if "messages" not in st.session_state:
     st.session_state.messages = []
@@ -111,19 +114,18 @@ for message in st.session_state.messages:
     with st.chat_message(message["role"]):
         st.markdown(message["content"])
-# Zone de saisie utilisateur
 if prompt := st.chat_input("Posez votre question à Apertus..."):
-    # Ajout et affichage du message utilisateur
     st.session_state.messages.append({"role": "user", "content": prompt})
     with st.chat_message("user"):
         st.markdown(prompt)
-    # --- GÉNÉRATION DE LA RÉPONSE ---
     with st.chat_message("assistant"):
         response_placeholder = st.empty()
         with st.spinner("Réflexion en cours... 🤔"):
             # Préparation des entrées pour le modèle
-            # Nous ne formaterons plus le prompt, le modèle instruct est déjà finetuné pour ça.
             input_ids = tokenizer(prompt, return_tensors="pt").to(model.device)
             # Génération de la réponse
@@ -138,7 +140,7 @@ if prompt := st.chat_input("Posez votre question à Apertus..."):
             # Décodage et nettoyage de la réponse
             response_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
-            # Nettoyage pour retirer la question initiale de la réponse
             cleaned_response = response_text.replace(prompt, "").strip()
             response_placeholder.markdown(cleaned_response)

 from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 from huggingface_hub import login
+# ==============================================================================
 # --- CONFIGURATION DE LA PAGE ---
+# Définit le titre, l'icône et la mise en page de l'application.
+# ==============================================================================
 st.set_page_config(
     page_title="Chat Avancé avec Apertus",
     page_icon="🚀",
     initial_sidebar_state="expanded",
 )
+# ==============================================================================
+# --- BARRE LATÉRALE (SIDEBAR) ---
+# Contient toutes les options de configuration pour l'utilisateur.
+# ==============================================================================
 with st.sidebar:
     st.title("🚀 Paramètres")
     st.markdown("Configurez l'assistant et le modèle de langage.")
+    # --- Section d'Authentification Hugging Face ---
     st.subheader("Authentification Hugging Face")
     hf_token = st.text_input("Votre Token Hugging Face (hf_...)", type="password")
     if st.button("Se Connecter"):
         else:
             st.warning("Veuillez entrer un token Hugging Face.")
+    # --- Section de Sélection du Modèle ---
     st.subheader("Sélection du Modèle")
     model_options = {
         "Apertus 8B (Rapide)": "swiss-ai/Apertus-8B-Instruct-2509",
     model_id = model_options[selected_model_name]
     st.caption(f"ID du modèle : `{model_id}`")
+    # --- Section des Paramètres de Génération ---
     st.subheader("Paramètres de Génération")
+    temperature = st.slider(
+        "Température",
+        min_value=0.1, max_value=1.5, value=0.7, step=0.05,
+        help="Plus la valeur est élevée, plus la réponse est créative et aléatoire."
+    )
+    max_new_tokens = st.slider(
+        "Tokens Max",
+        min_value=64, max_value=1024, value=256, step=64,
+        help="Longueur maximale de la réponse générée."
+    )
+    top_p = st.slider(
+        "Top-p (Nucleus Sampling)",
+        min_value=0.1, max_value=1.0, value=0.95, step=0.05,
+        help="Contrôle la diversité en sélectionnant les mots les plus probables."
+    )
     # --- Bouton pour effacer l'historique ---
+    st.subheader("Gestion du Chat")
     if st.button("🗑️ Effacer l'historique"):
         st.session_state.messages = []
         st.experimental_rerun()
+# ==============================================================================
+# --- FONCTION DE CHARGEMENT DU MODÈLE ---
+# Mise en cache pour ne charger le modèle qu'une seule fois.
+# ==============================================================================
 @st.cache_resource(show_spinner=False)
 def load_model(model_identifier):
     """Charge le tokenizer et le modèle avec quantification 4-bit."""
         )
     return tokenizer, model
+# Essai de chargement du modèle
 try:
     tokenizer, model = load_model(model_id)
 except Exception as e:
     st.error(f"Impossible de charger le modèle. Assurez-vous d'être connecté si le modèle est privé. Erreur : {e}")
     st.stop()
+# ==============================================================================
 # --- INTERFACE DE CHAT PRINCIPALE ---
+# Affiche les messages et gère les entrées de l'utilisateur.
+# ==============================================================================
 st.title("🤖 Chat avec Apertus")
 st.caption(f"Vous discutez actuellement avec **{selected_model_name}**.")
+# Initialisation de l'historique du chat s'il n'existe pas
 if "messages" not in st.session_state:
     st.session_state.messages = []
     with st.chat_message(message["role"]):
         st.markdown(message["content"])
+# Zone de saisie pour l'utilisateur
 if prompt := st.chat_input("Posez votre question à Apertus..."):
+    # Ajout et affichage du message de l'utilisateur
     st.session_state.messages.append({"role": "user", "content": prompt})
     with st.chat_message("user"):
         st.markdown(prompt)
+    # --- Génération de la réponse de l'assistant ---
     with st.chat_message("assistant"):
         response_placeholder = st.empty()
         with st.spinner("Réflexion en cours... 🤔"):
             # Préparation des entrées pour le modèle
             input_ids = tokenizer(prompt, return_tensors="pt").to(model.device)
             # Génération de la réponse
             # Décodage et nettoyage de la réponse
             response_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
+            # Nettoyage pour retirer le prompt de la réponse générée
             cleaned_response = response_text.replace(prompt, "").strip()
             response_placeholder.markdown(cleaned_response)