Spaces:

nicolasmarques
/

gpt2-app-nicolas

Runtime error

App Files Files Community

nicolasmarques commited on Jul 1

Commit

b13ff53

verified ·

1 Parent(s): 49e41c6

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -61

app.py CHANGED Viewed

@@ -3,100 +3,68 @@ from langdetect import detect, DetectorFactory
 from transformers import pipeline
 import gradio as gr
-# Para resultados determinísticos na detecção de idioma
 DetectorFactory.seed = 0
-# Pipeline de geração de texto instruído (text2text) com FLAN-T5
 generator = pipeline(
     "text2text-generation",
-    model="google/flan-t5-small",
     device=-1
 )
-# Palavras-chave de comando em pt/en/fr
 COMMANDS = {
-    "resumo":    ["resuma", "resumo", "resumir", "summarize", "résumé", "résumer"],
-    "reescrever":["reescreva", "reformule", "reformular", "rewrite", "réécrire"],
-    "expandir":  ["expanda", "expansão", "expandir", "detalhe", "expand", "développez"],
-    "corrigir":  ["corrija", "corrigir", "melhore", "revise", "correct", "corriger"]
 }
-# Mensagens de instrução por comando e idioma
 INSTRUCTIONS = {
-  "resumo": {
-    "pt": "Resuma o texto a seguir de forma concisa:",
-    "en": "Please summarize the following text concisely:",
-    "fr": "Veuillez résumer le texte suivant de manière concise :"
-  },
-  "reescrever": {
-    "pt": "Reescreva este texto com mais clareza e estilo:",
-    "en": "Rewrite this text with more clarity and style:",
-    "fr": "Réécrivez ce texte avec plus de clarté et de style :"
-  },
-  "expandir": {
-    "pt": "Expanda este texto, adicionando detalhes e explicações:",
-    "en": "Expand the following text by adding details and explanations:",
-    "fr": "Développez ce texte en ajoutant des détails et des explications :"
-  },
-  "corrigir": {
-    "pt": "Corrija gramática, ortografia e estilo deste texto:",
-    "en": "Correct the grammar, spelling, and style of this text:",
-    "fr": "Corrigez la grammaire, l'orthographe et le style de ce texte :"
-  },
-}
-# Prompt de humanização por idioma
-HUMANIZE = {
-  "pt": "Por favor, torne o texto a seguir mais natural e humano:",
-  "en": "Please make the following text more natural and human-like:",
-  "fr": "Veuillez rendre le texte suivant plus naturel et humain :"
 }
 def detect_language(text: str) -> str:
     try:
-        code = detect(text)
-        return code if code in HUMANIZE else "pt"
     except:
         return "pt"
 def find_command(text: str) -> str:
-    low = text.lower()
     for cmd, kws in COMMANDS.items():
         for kw in kws:
-            if kw in low:
                 return cmd
-    return "expandir"  # padrão se não achar comando
 def clean_text(text: str) -> str:
-    txt = re.sub(r"\s+", " ", text).strip()
     for kws in COMMANDS.values():
         for kw in kws:
-            txt = re.sub(rf"\b{kw}\b", "", txt, flags=re.IGNORECASE)
-    return txt.strip()
 def gerar_resposta(texto: str) -> str:
-    lang = detect_language(texto)
-    cmd  = find_command(texto)
-    core = clean_text(texto)
-    # 1) Geração principal via FLAN-T5
-    instr = INSTRUCTIONS[cmd][lang]
-    prompt1 = f"{instr}\n\n{core}"
-    out1 = generator(prompt1, max_length=512, do_sample=False)[0]["generated_text"].strip()
-    # 2) Humanização
-    prompt2 = f"{HUMANIZE[lang]}\n\n{out1}"
-    out2 = generator(prompt2, max_length=256, do_sample=False)[0]["generated_text"].strip()
-    return out2
-# Interface Gradio
 app = gr.Interface(
     fn=gerar_resposta,
-    inputs=gr.Textbox(lines=6, placeholder="Escreva algo com 'resuma', 'expanda', etc...", label="Entrada"),
-    outputs=gr.Textbox(label="Resposta"),
-    title="🧠 IA Instruída Multilíngue",
-    description="Detecta idioma e comando embutido, responde no mesmo idioma e humaniza o texto."
 )
 if __name__ == "__main__":

 from transformers import pipeline
 import gradio as gr
+# Garante previsibilidade na detecção de idioma
 DetectorFactory.seed = 0
+# Pipeline usando ptt5-base (português)
 generator = pipeline(
     "text2text-generation",
+    model="unicamp-dl/ptt5-base-portuguese-vocab",
+    tokenizer="unicamp-dl/ptt5-base-portuguese-vocab",
     device=-1
 )
 COMMANDS = {
+    "resumo":    ["resuma", "resumo", "resumir"],
+    "reescrever":["reescreva", "reformule", "reformular"],
+    "expandir":  ["expanda", "expansão", "expandir", "detalhe"],
+    "corrigir":  ["corrija", "corrigir", "melhore", "revise"]
 }
 INSTRUCTIONS = {
+    "resumo":    "Resuma o seguinte texto:",
+    "reescrever":"Reescreva o seguinte texto com mais clareza e estilo:",
+    "expandir":  "Expanda o seguinte texto com mais detalhes e explicações:",
+    "corrigir":  "Corrija erros gramaticais e melhore o estilo do seguinte texto:"
 }
 def detect_language(text: str) -> str:
     try:
+        return detect(text)
     except:
         return "pt"
 def find_command(text: str) -> str:
     for cmd, kws in COMMANDS.items():
         for kw in kws:
+            if kw.lower() in text.lower():
                 return cmd
+    return "expandir"
 def clean_text(text: str) -> str:
     for kws in COMMANDS.values():
         for kw in kws:
+            text = re.sub(rf"\b{kw}\b", "", text, flags=re.IGNORECASE)
+    return re.sub(r"\s+", " ", text).strip()
 def gerar_resposta(texto: str) -> str:
+    idioma = detect_language(texto)
+    if idioma != "pt":
+        return "Desculpe, atualmente esta IA responde apenas em português."
+    cmd = find_command(texto)
+    core = clean_text(texto)
+    prompt = f"{INSTRUCTIONS[cmd]} {core}"
+    saida = generator(prompt, max_length=256, do_sample=False)[0]["generated_text"]
+    return saida.strip()
 app = gr.Interface(
     fn=gerar_resposta,
+    inputs=gr.Textbox(lines=6, label="Digite seu texto com 'resuma', 'expanda', etc..."),
+    outputs=gr.Textbox(label="Resposta da IA"),
+    title="🧠 IA de Texto Instruída em Português",
+    description="Entende comandos embutidos e responde em português com clareza.",
 )
 if __name__ == "__main__":