Spaces:

usag1e
/

meta-llama-Llama-3.1-8B-Instruct

Build error

usag1e commited on 29 days ago

Commit

6cfe633

verified ·

1 Parent(s): 07e7927

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,26 +1,23 @@
-from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from transformers import AutoTokenizer, AutoModelForCausalLM
 model_name = "meta-llama/Llama-3.1-8B-Instruct"
-# Use the Hugging Face token
-tokenizer = AutoTokenizer.from_pretrained(model_name, use_auth_token=True)
-model = AutoModelForCausalLM.from_pretrained(model_name, use_auth_token=True)
-# Initialize FastAPI
 app = FastAPI()
-# Define request and response models
 class Prompt(BaseModel):
     text: str
 @app.post("/generate")
 def generate_text(prompt: Prompt):
-    try:
-        inputs = tokenizer(prompt.text, return_tensors="pt")
-        outputs = model.generate(**inputs, max_length=100)
-        generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
-        return {"generated_text": generated_text}
-    except Exception as e:
-        raise HTTPException(status_code=500, detail=f"Error generating text: {str(e)}")

+from fastapi import FastAPI
 from pydantic import BaseModel
 from transformers import AutoTokenizer, AutoModelForCausalLM
+import os
 model_name = "meta-llama/Llama-3.1-8B-Instruct"
+# Use the Hugging Face token from the environment variable
+hf_token = os.getenv("HF_TOKEN")
+tokenizer = AutoTokenizer.from_pretrained(model_name, token=hf_token)
+model = AutoModelForCausalLM.from_pretrained(model_name, token=hf_token)
 app = FastAPI()
 class Prompt(BaseModel):
     text: str
 @app.post("/generate")
 def generate_text(prompt: Prompt):
+    inputs = tokenizer(prompt.text, return_tensors="pt")
+    outputs = model.generate(**inputs, max_length=100)
+    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    return {"generated_text": generated_text}