Spaces:

El-Alberto67
/

Aria

Runtime error

El-Alberto67 commited on Aug 14

Commit

e755086

verified ·

1 Parent(s): 261029f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,20 +1,20 @@
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
-import os
-# Récupérer le token Hugging Face (secret)
 hf_token = os.environ.get("HF_TOKEN")
-# Nom du modèle léger et rapide
-model_name = "tiiuae/gemma-2b"
-# Charger le tokenizer et le modèle
 tokenizer = AutoTokenizer.from_pretrained(model_name, use_auth_token=hf_token)
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
-    torch_dtype=torch.float16,  # moins lourd
-    device_map="auto",           # utilise GPU si dispo sinon CPU
     use_auth_token=hf_token
 )
@@ -22,16 +22,9 @@ model = AutoModelForCausalLM.from_pretrained(
 system_prompt = """Tu es Aria, une IA bienveillante et polie qui répond de façon concise et claire."""
 def chat(message, history=[]):
-    # Construire le prompt complet avec historique
     prompt = system_prompt + "\n" + "\n".join([f"Utilisateur: {m[0]}\nAria: {m[1]}" for m in history]) + f"\nUtilisateur: {message}\nAria:"
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
-    outputs = model.generate(
-        **inputs,
-        max_new_tokens=200,
-        do_sample=True,          # rend les réponses plus naturelles
-        temperature=0.7
-    )
     reply = tokenizer.decode(outputs[0], skip_special_tokens=True)
     # Récupérer uniquement la réponse d'Aria
     reply = reply.split("Aria:")[-1].strip()

+import os
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
+# Récupérer le token Hugging Face depuis les secrets
 hf_token = os.environ.get("HF_TOKEN")
+# Modèle léger et rapide
+model_name = "tiiuae/phi-4-mini"
+# Charger le tokenizer et le modèle avec token
 tokenizer = AutoTokenizer.from_pretrained(model_name, use_auth_token=hf_token)
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
+    torch_dtype=torch.float16,
+    device_map="auto",
     use_auth_token=hf_token
 )
 system_prompt = """Tu es Aria, une IA bienveillante et polie qui répond de façon concise et claire."""
 def chat(message, history=[]):
     prompt = system_prompt + "\n" + "\n".join([f"Utilisateur: {m[0]}\nAria: {m[1]}" for m in history]) + f"\nUtilisateur: {message}\nAria:"
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
+    outputs = model.generate(**inputs, max_new_tokens=200)
     reply = tokenizer.decode(outputs[0], skip_special_tokens=True)
     # Récupérer uniquement la réponse d'Aria
     reply = reply.split("Aria:")[-1].strip()