Spaces:

AlbertDuvan
/

AlvearRendon

Sleeping

App Files Files Community

AlbertDuvan commited on Feb 4

Commit

e3487ab

verified ·

1 Parent(s): 344ca58

Upload app.py

Browse files

Files changed (1) hide show

app.py +8 -8

app.py CHANGED Viewed

@@ -33,7 +33,7 @@ def buscar_en_pubmed(pregunta):
             for id_articulo in record["IdList"]:
                 handle = Entrez.efetch(db="pubmed", id=id_articulo, rettype="abstract", retmode="text")
                 resumen = handle.read()
-                referencias.append(f"Artículo {id_articulo}:\n{resumen[:300]}...\n")  # Limitar a 300 caracteres
                 handle.close()
             return "\n".join(referencias)
         else:
@@ -46,13 +46,13 @@ def buscar_en_pubmed(pregunta):
 def buscar_en_internet(pregunta):
     try:
         # Agregar palabras clave médicas a la pregunta
-        termino = f"{pregunta} medical"
         url = f"https://api.duckduckgo.com/?q={termino}&format=json"
         respuesta = requests.get(url, timeout=10)  # Incrementa el tiempo de espera a 10 segundos
         datos = respuesta.json()
         if "Abstract" in datos and datos["Abstract"]:
-            return datos["Abstract"][:200]  # Limitar a 200 caracteres
         else:
             return "No encontré información en Internet."
     except Exception as e:
@@ -66,7 +66,7 @@ def generar_respuesta(pregunta):
         pregunta = pregunta[:500]  # Limitar a 500 caracteres
         inputs = tokenizer(
-            f"Explica {pregunta} de forma clara y detallada. Usa términos médicos explicados.",
             return_tensors="pt",
             max_length=512,  # Limitar la longitud máxima de entrada
             truncation=True
@@ -75,16 +75,16 @@ def generar_respuesta(pregunta):
         with torch.no_grad():
             outputs = model.generate(
                 **inputs,
-                max_new_tokens=300,  # Aumentar el límite para respuestas más largas
                 do_sample=True,      # Usar muestreo para respuestas más naturales
-                temperature=0.7,     # Controlar la creatividad del modelo
-                num_beams=4          # Balancear calidad y velocidad
             )
         respuesta = tokenizer.decode(outputs[0], skip_special_tokens=True)
         # Eliminar el prompt de la respuesta
-        respuesta = respuesta.replace(f"Explica {pregunta} de forma clara y detallada. Usa términos médicos explicados.", "").strip()
         return respuesta

             for id_articulo in record["IdList"]:
                 handle = Entrez.efetch(db="pubmed", id=id_articulo, rettype="abstract", retmode="text")
                 resumen = handle.read()
+                referencias.append(f"Artículo {id_articulo}:\n{resumen[:500]}...\n")  # Aumentar el límite a 500 caracteres
                 handle.close()
             return "\n".join(referencias)
         else:
 def buscar_en_internet(pregunta):
     try:
         # Agregar palabras clave médicas a la pregunta
+        termino = f"{pregunta} medical OR healthcare OR treatment"
         url = f"https://api.duckduckgo.com/?q={termino}&format=json"
         respuesta = requests.get(url, timeout=10)  # Incrementa el tiempo de espera a 10 segundos
         datos = respuesta.json()
         if "Abstract" in datos and datos["Abstract"]:
+            return datos["Abstract"][:300]  # Aumentar el límite a 300 caracteres
         else:
             return "No encontré información en Internet."
     except Exception as e:
         pregunta = pregunta[:500]  # Limitar a 500 caracteres
         inputs = tokenizer(
+            f"Explica {pregunta} de forma clara y detallada. Incluye causas, síntomas, diagnóstico y tratamiento si corresponde.",
             return_tensors="pt",
             max_length=512,  # Limitar la longitud máxima de entrada
             truncation=True
         with torch.no_grad():
             outputs = model.generate(
                 **inputs,
+                max_new_tokens=400,  # Aumentar el límite para respuestas más largas
                 do_sample=True,      # Usar muestreo para respuestas más naturales
+                temperature=0.5,     # Reducir la creatividad para respuestas más precisas
+                num_beams=6          # Mejorar la coherencia
             )
         respuesta = tokenizer.decode(outputs[0], skip_special_tokens=True)
         # Eliminar el prompt de la respuesta
+        respuesta = respuesta.replace(f"Explica {pregunta} de forma clara y detallada. Incluye causas, síntomas, diagnóstico y tratamiento si corresponde.", "").strip()
         return respuesta