Spaces:

healthtechbrasil
/

ProvaObjetiva

Runtime error

App Files Files Community

healthtechbrasil commited on Jun 11

Commit

9eab4dd

1 Parent(s): 6952db2

force cpu usage

Browse files

Files changed (1) hide show

app.py +29 -20

app.py CHANGED Viewed

@@ -2,6 +2,11 @@ from fastapi import FastAPI
 from transformers import AutoTokenizer, T5ForConditionalGeneration
 import json
 import os
 app = FastAPI()
@@ -9,30 +14,35 @@ app = FastAPI()
 try:
     with open("questions.json", "r", encoding="utf-8") as f:
         examples = json.load(f)
 except FileNotFoundError:
     examples = []
-# Função para carregar o modelo e tokenizer
-def load_model():
-    try:
-        tokenizer = AutoTokenizer.from_pretrained(
-            "unicamp-dl/ptt5-base-portuguese-vocab",
-            legacy=False,  # Usa o novo comportamento do tokenizer
-            clean_up_tokenization_spaces=True  # Define explicitamente para evitar warnings futuros
-        )
-        model = T5ForConditionalGeneration.from_pretrained(
-            "unicamp-dl/ptt5-base-portuguese-vocab",
-            device_map="auto" if os.getenv("HF_TOKEN") else None
-        )
-        return {"tokenizer": tokenizer, "model": model}
-    except Exception as e:
-        print(f"Erro ao carregar o modelo: {e}")
-        return None
-# Inicializa o modelo e tokenizer
-model_data = load_model()
 def generate_question_from_prompt(theme, difficulty, example_question=None):
     if not model_data or not model_data["tokenizer"] or not model_data["model"]:
         return {"question": "Erro: Modelo ou tokenizer não carregado.", "options": [], "answer": "", "explanation": "Por favor, verifique os logs."}
@@ -65,7 +75,6 @@ def generate_question_from_prompt(theme, difficulty, example_question=None):
         inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True, max_length=512)
         outputs = model.generate(**inputs, max_new_tokens=512, temperature=0.7, top_p=0.9)
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
-        # Parseia a resposta para extrair os componentes
         parts = response.split("Alternativas:")
         if len(parts) > 1:
             question_part = parts[0].replace("Enunciado clínico:", "").strip()

 from transformers import AutoTokenizer, T5ForConditionalGeneration
 import json
 import os
+import logging
+# Configura logging para capturar mais detalhes
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
 app = FastAPI()
 try:
     with open("questions.json", "r", encoding="utf-8") as f:
         examples = json.load(f)
+    logger.info("questions.json carregado com sucesso.")
 except FileNotFoundError:
     examples = []
+    logger.warning("questions.json não encontrado, usando lista vazia.")
+# Função para carregar o modelo e tokenizer sob demanda
+def get_model():
+    if not hasattr(get_model, "model_data"):
+        logger.info("Carregando modelo e tokenizer pela primeira vez...")
+        try:
+            tokenizer = AutoTokenizer.from_pretrained(
+                "unicamp-dl/ptt5-base-portuguese-vocab",
+                legacy=False,
+                clean_up_tokenization_spaces=True
+            )
+            logger.info("Tokenizer carregado com sucesso.")
+            model = T5ForConditionalGeneration.from_pretrained(
+                "unicamp-dl/ptt5-base-portuguese-vocab",
+                device_map="cpu"  # Força uso da CPU
+            )
+            logger.info("Modelo carregado com sucesso.")
+            get_model.model_data = {"tokenizer": tokenizer, "model": model}
+        except Exception as e:
+            logger.error(f"Erro ao carregar modelo ou tokenizer: {e}")
+            get_model.model_data = None
+    return get_model.model_data
 def generate_question_from_prompt(theme, difficulty, example_question=None):
+    model_data = get_model()
     if not model_data or not model_data["tokenizer"] or not model_data["model"]:
         return {"question": "Erro: Modelo ou tokenizer não carregado.", "options": [], "answer": "", "explanation": "Por favor, verifique os logs."}
         inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True, max_length=512)
         outputs = model.generate(**inputs, max_new_tokens=512, temperature=0.7, top_p=0.9)
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
         parts = response.split("Alternativas:")
         if len(parts) > 1:
             question_part = parts[0].replace("Enunciado clínico:", "").strip()