File size: 1,615 Bytes
61d6506 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 |
import streamlit as st
from transformers import AutoModelForCausalLM, AutoTokenizer
# Título de la aplicación
st.title("Chat con el modelo BSC-LT/ALIA-40b")
st.markdown("Interactúa con el modelo BSC-LT/ALIA-40b en este chat. Escribe tu mensaje abajo:")
# Cargar modelo y tokenizador
@st.cache_resource
def load_model():
model_name = "BSC-LT/ALIA-40b"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")
return model, tokenizer
model, tokenizer = load_model()
# Historial de chat
if "messages" not in st.session_state:
st.session_state.messages = []
# Mostrar historial
for msg in st.session_state.messages:
if msg["role"] == "user":
st.markdown(f"**Tú:** {msg['content']}")
else:
st.markdown(f"**Modelo:** {msg['content']}")
# Input del usuario
user_input = st.text_input("Escribe tu mensaje aquí:", key="input")
# Botón de enviar
if st.button("Enviar") and user_input.strip():
# Añadir el mensaje del usuario al historial
st.session_state.messages.append({"role": "user", "content": user_input})
# Preparar entrada para el modelo
inputs = tokenizer(user_input, return_tensors="pt").to("cuda")
outputs = model.generate(inputs["input_ids"], max_length=100, num_return_sequences=1)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
# Añadir la respuesta del modelo al historial
st.session_state.messages.append({"role": "model", "content": response})
# Recargar la página para mostrar el mensaje
st.experimental_rerun()
|