Spaces:

Xennus
/

niko-mistral-cyberbot

Runtime error

Xennus commited on 1 day ago

Commit

287b981

verified ·

1 Parent(s): c9b72cc

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,14 +1,20 @@
-import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 model_name = "Xennus/niko-mistral-cyberbot"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
-def generate_response(prompt):
-    inputs = tokenizer(prompt, return_tensors="pt")
-    outputs = model.generate(**inputs, max_length=200)
-    return tokenizer.decode(outputs[0], skip_special_tokens=True)
-iface = gr.Interface(fn=generate_response, inputs="text", outputs="text")
-iface.launch()

+from fastapi import FastAPI
+from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
+app = FastAPI()
 model_name = "Xennus/niko-mistral-cyberbot"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
+model.eval()
+class Request(BaseModel):
+    prompt: str
+@app.post("/generate")
+async def generate(request: Request):
+    inputs = tokenizer(request.prompt, return_tensors="pt")
+    outputs = model.generate(**inputs, max_length=200)
+    text = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    return {"response": text}