Spaces:

gowthamtamilkathir
/

deepseek

Sleeping

gowthamtamilkathir commited on Jul 27

Commit

8acea2e

verified ·

1 Parent(s): 4892ef5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,18 @@
 from fastapi import FastAPI
 app = FastAPI()
-@app.get("/")
-def greet_json():
-    return {"Hello": "World!"}

 from fastapi import FastAPI
+from transformers import AutoTokenizer, AutoModelForCausalLM
+import torch
 app = FastAPI()
+tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/deepseek-llm-7b-base")
+model = AutoModelForCausalLM.from_pretrained(
+    "deepseek-ai/deepseek-llm-7b-base",
+    torch_dtype=torch.float16,
+    device_map="auto"
+)
+@app.get("/ask")
+def ask(prompt: str):
+    inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
+    outputs = model.generate(**inputs, max_new_tokens=100)
+    return {"response": tokenizer.decode(outputs[0], skip_special_tokens=True)}