Spaces:

Hayabu5a
/

Auf-gehts

Sleeping

Hayabu5a commited on Jun 3

Commit

a2eac3b

verified ·

1 Parent(s): 75045ca

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,43 +1,48 @@
 from transformers import pipeline
 import gradio as gr
-import time
 MODELS = {
-    "TinyDE": "malteos/tinyllama-1.1B-step-50K-105b",  # Kleinere Variante
-    "DistilBERT": "distilbert-base-german-cased",
     "GPT2": "gpt2"
 }
 def respond(message, history, model_choice):
     try:
-        # Fortschrittsbalken anzeigen
-        yield "🔄 Modell wird geladen... (bitte 15-30s warten)"
-        # Modell laden
         generator = pipeline(
             'text-generation',
             model=MODELS[model_choice],
-            max_new_tokens=50  # Antwortlänge begrenzen
         )
-        # Antwort generieren
-        response = generator(message)[0]['generated_text']
-        yield response
     except Exception as e:
-        yield f"❌ Fehler: {str(e)}\n\n🔧 Tipp: Probier ein anderes Modell aus!"
-# Dropdown mit kleineren Modellen
 gr.ChatInterface(
     respond,
     additional_inputs=[
         gr.Dropdown(
             list(MODELS.keys()),
             label="Modell",
-            value="TinyDE",
-            info="TinyDE für Deutsch, GPT2 für Englisch"
         )
     ],
-    title="🤖 LLM Lernlabor",
-    description="Wähle ein Modell und starte das Gespräch"
-).launch(debug=True)

 from transformers import pipeline
 import gradio as gr
 MODELS = {
+    "German GPT": "dbmdz/german-gpt2",
+    "TinyDE": "malteos/tinyllama-de",
     "GPT2": "gpt2"
 }
 def respond(message, history, model_choice):
     try:
+        # Konversationsverlauf erstellen
+        prompt = ""
+        for human, assistant in history:
+            prompt += f"Mensch: {human}\nKI: {assistant}\n"
+        prompt += f"Mensch: {message}\nKI:"
+        # Pipeline mit optimierten Parametern
         generator = pipeline(
             'text-generation',
             model=MODELS[model_choice],
+            max_new_tokens=80,
+            num_beams=2,
+            temperature=0.7
         )
+        # Antwort generieren und bereinigen
+        full_response = generator(prompt)[0]['generated_text']
+        response = full_response.split("KI:")[-1].split("\n")[0].strip()
+        return response
     except Exception as e:
+        return f"❌ Fehler: {str(e)}"
 gr.ChatInterface(
     respond,
     additional_inputs=[
         gr.Dropdown(
             list(MODELS.keys()),
             label="Modell",
+            value="German GPT",
+            info="German GPT für beste deutsche Ergebnisse"
         )
     ],
+    title="🤖 Verbesserter LLM Chat",
+    description="Wähle 'German GPT' für kohärentere Antworten"
+).launch()