Spaces:

MMOON
/

APERTUSMM

Runtime error

App Files Files Community

MMOON commited on Sep 6

Commit

9486a95

verified ·

1 Parent(s): 04eec55

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +209 -38

src/streamlit_app.py CHANGED Viewed

@@ -1,40 +1,211 @@
-import altair as alt
-import numpy as np
-import pandas as pd
 import streamlit as st
-"""
-# Welcome to Streamlit!
-Edit `/streamlit_app.py` to customize this app to your heart's desire :heart:.
-If you have any questions, checkout our [documentation](https://docs.streamlit.io) and [community
-forums](https://discuss.streamlit.io).
-In the meantime, below is an example of what you can do with just a few lines of code:
-"""
-num_points = st.slider("Number of points in spiral", 1, 10000, 1100)
-num_turns = st.slider("Number of turns in spiral", 1, 300, 31)
-indices = np.linspace(0, 1, num_points)
-theta = 2 * np.pi * num_turns * indices
-radius = indices
-x = radius * np.cos(theta)
-y = radius * np.sin(theta)
-df = pd.DataFrame({
-    "x": x,
-    "y": y,
-    "idx": indices,
-    "rand": np.random.randn(num_points),
-})
-st.altair_chart(alt.Chart(df, height=700, width=700)
-    .mark_point(filled=True)
-    .encode(
-        x=alt.X("x", axis=None),
-        y=alt.Y("y", axis=None),
-        color=alt.Color("idx", legend=None, scale=alt.Scale()),
-        size=alt.Size("rand", legend=None, scale=alt.Scale(range=[1, 150])),
-    ))

+Absolument ! Voici une version améliorée du code.
+Cette nouvelle version intègre plusieurs améliorations clés :
+Design et Interface Utilisateur (UI) : Utilisation de st.sidebar pour les options et les crédits, et st.container pour une meilleure organisation visuelle du chat.
+Gestion des Modèles : Le code est maintenant plus flexible. Il vous permet de choisir entre le modèle original (Apertus-8B) et le modèle plus puissant que vous avez suggéré (Apertus-70B), et même d'autres si vous le souhaitez.
+Authentification Hugging Face : Intégration de la connexion via huggingface_hub pour utiliser des modèles qui pourraient être privés ou nécessiter une authentification. Le token est demandé de manière sécurisée via st.text_input de type "password".
+Paramètres de Génération Ajustables : Les paramètres comme la température, le top_p et le nombre maximum de tokens sont maintenant des curseurs dans la barre latérale, permettant à l'utilisateur de les ajuster dynamiquement.
+Optimisation et Clarté : Le code est restructuré en fonctions plus claires pour une meilleure lisibilité et maintenance.
+Aperçu du nouveau design
+L'interface sera divisée en deux parties :
+Une barre latérale (Sidebar) à gauche pour la configuration :
+Connexion à Hugging Face.
+Sélection du modèle.
+Réglage des paramètres de génération.
+Un bouton pour effacer l'historique.
+La fenêtre de chat principale à droite pour la conversation.
+Le Code Amélioré
+code
+Python
+download
+content_copy
+expand_less
 import streamlit as st
+import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
+from huggingface_hub import login
+# --- CONFIGURATION DE LA PAGE ---
+st.set_page_config(
+    page_title="Chat Avancé avec Apertus",
+    page_icon="🚀",
+    layout="wide",
+    initial_sidebar_state="expanded",
+)
+# --- STYLES CSS PERSONNALISÉS (Optionnel) ---
+st.markdown("""
+<style>
+    .stSpinner > div > div {
+        border-top-color: #f63366;
+    }
+    .stChatMessage {
+        background-color: #f0f2f6;
+        border-radius: 10px;
+        padding: 15px;
+        margin-bottom: 10px;
+    }
+</style>
+""", unsafe_allow_html=True)
+# --- BARRE LATÉRALE DE CONFIGURATION ---
+with st.sidebar:
+    st.title("🚀 Paramètres")
+    st.markdown("Configurez l'assistant et le modèle de langage.")
+    # --- Authentification Hugging Face ---
+    st.subheader("Authentification Hugging Face")
+    hf_token = st.text_input("Votre Token Hugging Face (hf_...)", type="password")
+    if st.button("Se Connecter"):
+        if hf_token:
+            try:
+                login(token=hf_token)
+                st.success("Connecté à Hugging Face Hub !")
+                st.session_state.hf_logged_in = True
+            except Exception as e:
+                st.error(f"Échec de la connexion : {e}")
+        else:
+            st.warning("Veuillez entrer un token Hugging Face.")
+    # --- Sélection du Modèle ---
+    st.subheader("Sélection du Modèle")
+    model_options = {
+        "Apertus 8B (Rapide)": "swiss-ai/Apertus-8B-Instruct-2509",
+        "Apertus 70B (Puissant)": "swiss-ai/Apertus-70B-2509"
+    }
+    selected_model_name = st.selectbox("Choisissez un modèle :", options=list(model_options.keys()))
+    model_id = model_options[selected_model_name]
+    st.caption(f"ID du modèle : `{model_id}`")
+    # --- Paramètres de Génération ---
+    st.subheader("Paramètres de Génération")
+    temperature = st.slider("Température", min_value=0.1, max_value=1.5, value=0.7, step=0.05,
+                              help="Plus la valeur est élevée, plus la réponse est créative et aléatoire.")
+    max_new_tokens = st.slider("Tokens Max", min_value=64, max_value=1024, value=256, step=64,
+                                 help="Longueur maximale de la réponse générée.")
+    top_p = st.slider("Top-p (Nucleus Sampling)", min_value=0.1, max_value=1.0, value=0.95, step=0.05,
+                      help="Contrôle la diversité en sélectionnant les mots les plus probables dont la somme des probabilités dépasse ce seuil.")
+    # --- Bouton pour effacer l'historique ---
+    if st.button("🗑️ Effacer l'historique"):
+        st.session_state.messages = []
+        st.experimental_rerun()
+# --- CHARGEMENT DU MODÈLE (MIS EN CACHE) ---
+@st.cache_resource(show_spinner=False)
+def load_model(model_identifier):
+    """Charge le tokenizer et le modèle avec quantification 4-bit."""
+    with st.spinner(f"Chargement du modèle '{model_identifier}'... Cela peut prendre un moment. ⏳"):
+        bnb_config = BitsAndBytesConfig(
+            load_in_4bit=True,
+            bnb_4bit_quant_type="nf4",
+            bnb_4bit_compute_dtype=torch.bfloat16,
+        )
+        tokenizer = AutoTokenizer.from_pretrained(model_identifier)
+        model = AutoModelForCausalLM.from_pretrained(
+            model_identifier,
+            quantization_config=bnb_config,
+            device_map="auto",
+        )
+    return tokenizer, model
+# Charge le modèle sélectionné
+try:
+    tokenizer, model = load_model(model_id)
+except Exception as e:
+    st.error(f"Impossible de charger le modèle. Assurez-vous d'être connecté si le modèle est privé. Erreur : {e}")
+    st.stop()
+# --- INTERFACE DE CHAT PRINCIPALE ---
+st.title("🤖 Chat avec Apertus")
+st.caption(f"Vous discutez actuellement avec **{selected_model_name}**.")
+# Initialisation de l'historique du chat
+if "messages" not in st.session_state:
+    st.session_state.messages = []
+# Affichage des messages de l'historique
+for message in st.session_state.messages:
+    with st.chat_message(message["role"]):
+        st.markdown(message["content"])
+# Zone de saisie utilisateur
+if prompt := st.chat_input("Posez votre question à Apertus..."):
+    # Ajout et affichage du message utilisateur
+    st.session_state.messages.append({"role": "user", "content": prompt})
+    with st.chat_message("user"):
+        st.markdown(prompt)
+    # --- GÉNÉRATION DE LA RÉPONSE ---
+    with st.chat_message("assistant"):
+        response_placeholder = st.empty()
+        with st.spinner("Réflexion en cours... 🤔"):
+            # Préparation des entrées pour le modèle
+            full_prompt = f"User: {prompt}\nAssistant:"
+            input_ids = tokenizer(full_prompt, return_tensors="pt").to(model.device)
+            # Génération de la réponse
+            outputs = model.generate(
+                **input_ids,
+                max_new_tokens=max_new_tokens,
+                do_sample=True,
+                temperature=temperature,
+                top_p=top_p,
+                eos_token_id=tokenizer.eos_token_id
+            )
+            # Décodage et nettoyage de la réponse
+            response_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
+            # Nettoyage pour retirer la question initiale de la réponse
+            cleaned_response = response_text.replace(full_prompt, "").strip()
+            response_placeholder.markdown(cleaned_response)
+    # Ajout de la réponse de l'assistant à l'historique
+    st.session_state.messages.append({"role": "assistant", "content": cleaned_response})
+Comment exécuter ce code
+Sauvegardez le code dans un fichier Python, par exemple app_v2.py.
+Installez les bibliothèques nécessaires si ce n'est pas déjà fait :
+code
+Bash
+download
+content_copy
+expand_less
+IGNORE_WHEN_COPYING_START
+IGNORE_WHEN_COPYING_END
+pip install streamlit torch transformers bitsandbytes accelerate huggingface_hub
+Lancez l'application depuis votre terminal :
+code
+Bash
+download
+content_copy
+expand_less
+IGNORE_WHEN_COPYING_START
+IGNORE_WHEN_COPYING_END
+streamlit run app_v2.py
+Votre navigateur s'ouvrira avec cette nouvelle interface, prête à l'emploi