Spaces:

gowthamtamilkathir
/

deepseek

Sleeping

gowthamtamilkathir commited on Jul 27

Commit

00ff3dc

verified ·

1 Parent(s): c3f9463

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,20 +1,27 @@
 from fastapi import FastAPI, Query
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 app = FastAPI()
-# Load the model and tokenizer
 tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/deepseek-llm-7b-base")
 model = AutoModelForCausalLM.from_pretrained(
     "deepseek-ai/deepseek-llm-7b-base",
     torch_dtype=torch.float16,
-    device_map="auto"
 )
 @app.get("/")
 def home():
-    return {"message": "DeepSeek LLM is running. Use /ask?prompt=your+question"}
 @app.get("/ask")
 def ask(prompt: str = Query(..., description="Your input prompt")):

 from fastapi import FastAPI, Query
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
+import os
 app = FastAPI()
+# Create offload folder if not exists
+os.makedirs("./offload", exist_ok=True)
+# Load tokenizer and model with offload_folder to prevent device_map error
 tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/deepseek-llm-7b-base")
 model = AutoModelForCausalLM.from_pretrained(
     "deepseek-ai/deepseek-llm-7b-base",
     torch_dtype=torch.float16,
+    device_map="auto",
+    offload_folder="./offload"
 )
 @app.get("/")
 def home():
+    return {
+        "message": "✅ DeepSeek LLM is running. Use endpoint /ask?prompt=your+question"
+    }
 @app.get("/ask")
 def ask(prompt: str = Query(..., description="Your input prompt")):