Spaces:

AlbertDuvan
/

AlvearRendon

Sleeping

App Files Files Community

AlbertDuvan commited on Feb 4

Commit

32802b5

verified ·

1 Parent(s): 83f1eb5

Upload 2 files

Browse files

Files changed (2) hide show

app.py +97 -14
requirements.txt +4 -1

app.py CHANGED Viewed

@@ -1,24 +1,107 @@
-from transformers import pipeline
 import gradio as gr
-# Cargar un modelo de lenguaje médico de Hugging Face
-modelo_medico = pipeline("text-generation", model="microsoft/BioGPT-Large")
-# Función para hacer preguntas al bot
-def pregunta_medica(pregunta):
-    respuesta = modelo_medico(
-        f"Eres un experto médico con vasto conocimiento en fisiología, bioquímica, farmacología y otras áreas médicas. Responde de manera sarcástica y directa, como el Dr. House. Pregunta: {pregunta}",
-        max_length=150
     )
-    return respuesta[0]['generated_text']
 # Crear la interfaz web con Gradio
 interfaz = gr.Interface(
-    fn=pregunta_medica,
-    inputs="text",
-    outputs="text",
-    title="Dr. House Bot",
-    description="Pregúntale al Dr. House sobre medicina."
 )
 # Lanzar la interfaz

+from transformers import AutoModelForCausalLM, AutoTokenizer
+import torch
 import gradio as gr
+from Bio import Entrez
+import requests
+from functools import lru_cache
+import logging
+# Configurar logging
+logging.basicConfig(level=logging.INFO)
+# Cargar un modelo de lenguaje médico optimizado (usando quantización)
+model_name = "microsoft/BioGPT"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name, load_in_8bit=True, device_map="auto")
+# Configurar PubMed
+Entrez.email = "[email protected]"  # Proporciona un correo válido
+# Función para buscar en PubMed con caché
+@lru_cache(maxsize=100)
+def buscar_en_pubmed(pregunta):
+    try:
+        handle = Entrez.esearch(db="pubmed", term=pregunta, retmax=1)  # Buscar solo 1 artículo
+        record = Entrez.read(handle)
+        handle.close()
+        if record["IdList"]:
+            referencias = []
+            for id_articulo in record["IdList"]:
+                handle = Entrez.efetch(db="pubmed", id=id_articulo, rettype="abstract", retmode="text")
+                resumen = handle.read()
+                referencias.append(f"Artículo {id_articulo}:\n{resumen[:300]}...\n")  # Limitar a 300 caracteres
+                handle.close()
+            return "\n".join(referencias)
+        else:
+            return "No encontré artículos relevantes en PubMed."
+    except Exception as e:
+        logging.error(f"Error al buscar en PubMed: {e}")
+        return f"Error al buscar en PubMed: {e}"
+# Función para buscar en Internet con tiempo de espera
+def buscar_en_internet(pregunta):
+    try:
+        url = f"https://api.duckduckgo.com/?q={pregunta}&format=json"
+        respuesta = requests.get(url, timeout=5)  # Tiempo de espera de 5 segundos
+        datos = respuesta.json()
+        if "Abstract" in datos and datos["Abstract"]:
+            return datos["Abstract"][:200]  # Limitar a 200 caracteres
+        else:
+            return "No encontré información en Internet."
+    except Exception as e:
+        logging.error(f"Error al buscar en Internet: {e}")
+        return f"Error al buscar en Internet: {e}"
+# Función para generar respuestas del modelo
+def generar_respuesta(pregunta):
+    inputs = tokenizer(
+        f"Eres un profesor médico con vasto conocimiento en fisiología, bioquímica, farmacología y otras áreas médicas. "
+        f"Explica de manera clara, sencilla y didáctica. Utiliza términos médicos y explícalos dentro de tus respuestas. "
+        f"Si no estás seguro de algo, di 'No tengo suficiente información para responder a eso'. Pregunta: {pregunta}",
+        return_tensors="pt"
+    ).to("cuda")
+    outputs = model.generate(**inputs, max_length=150)  # Reducir max_length para mayor velocidad
+    return tokenizer.decode(outputs[0], skip_special_tokens=True)
+# Función principal para hacer preguntas al bot
+def pregunta_medica_con_carga(pregunta):
+    yield "Procesando tu pregunta..."  # Mensaje de carga
+    # Respuesta del modelo médico
+    respuesta_modelo = generar_respuesta(pregunta)
+    # Buscar en PubMed
+    referencias_pubmed = buscar_en_pubmed(pregunta)
+    # Buscar en Internet
+    respuesta_internet = buscar_en_internet(pregunta)
+    # Combinar respuestas
+    respuesta_final = (
+        f"Respuesta del Profesor Médico:\n{respuesta_modelo}\n\n"
+        f"Referencias de PubMed:\n{referencias_pubmed}\n\n"
+        f"Información de Internet:\n{respuesta_internet}"
     )
+    yield respuesta_final
 # Crear la interfaz web con Gradio
+css = """
+.gradio-container {
+    background-color: #f0f8ff;
+}
+"""
 interfaz = gr.Interface(
+    fn=pregunta_medica_con_carga,
+    inputs=gr.Textbox(label="Pregunta"),
+    outputs=gr.Textbox(label="Respuesta"),
+    title="Profesor Médico Bot",
+    description="Pregúntale al Profesor Médico sobre medicina. Te explicará de manera clara y didáctica.",
+    css=css
 )
 # Lanzar la interfaz

requirements.txt CHANGED Viewed

@@ -3,4 +3,7 @@ transformers
 gradio
 requests
 biopython
-sacremoses

 gradio
 requests
 biopython
+sacremoses
+bitsandbytes
+sentencepiece
+accelerate