Spaces:

feel-fl
/

open-human-feedback-chat

Running on Zero

burtenshaw commited on Mar 6

Commit

3372a22

1 Parent(s): 348c664

move max_new_tokens to model definition

Files changed (1) hide show

app/app.py CHANGED Viewed

@@ -58,12 +58,13 @@ def create_inference_client(
     """
     if ZERO_GPU:
         tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
-        model = AutoModelForCausalLM.from_pretrained(BASE_MODEL, load_in_8bit=True)
         return pipeline(
             "text-generation",
             model=model,
             tokenizer=tokenizer,
-            model_kwargs={"max_new_tokens": 2000},
         )
     else:
         return InferenceClient(

     """
     if ZERO_GPU:
         tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
+        model = AutoModelForCausalLM.from_pretrained(
+            BASE_MODEL, load_in_8bit=True, max_new_tokens=2000
+        )
         return pipeline(
             "text-generation",
             model=model,
             tokenizer=tokenizer,
         )
     else:
         return InferenceClient(