Spaces:

rodrigomasini
/

rephrase

Paused

rodrigomasini commited on Nov 7, 2023

Commit

b23a956

1 Parent(s): 08e3783

Update app_v3.py

Files changed (1) hide show

app_v3.py CHANGED Viewed

@@ -38,15 +38,15 @@ if torch.cuda.is_available():
 #tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True, legacy=False)
 tokenizer = AutoTokenizer.from_pretrained(pretrained_model_dir, use_fast=True)
 model = AutoGPTQForCausalLM.from_quantized(
     pretrained_model_dir,
     model_basename=model_basename,
     use_safetensors=True,
-    device="cuda:0",
-    #use_triton=use_triton,
-    #quantize_config=None
 )
 viz = torch.cuda.memory_summary()
 st.write(viz)
@@ -55,7 +55,8 @@ user_input = st.text_input("Input a phrase")
 prompt_template = f'USER: {user_input}\nASSISTANT:'
 if st.button("Generate the prompt"):
-    inputs = tokenizer(prompt_template, return_tensors='pt')
     #streamer = TextStreamer(tokenizer)
     #pipe = pipeline(
     #    "text-generation",

 #tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True, legacy=False)
 tokenizer = AutoTokenizer.from_pretrained(pretrained_model_dir, use_fast=True)
+device = "cuda:0" if torch.cuda.is_available() else "cpu"
 model = AutoGPTQForCausalLM.from_quantized(
     pretrained_model_dir,
     model_basename=model_basename,
     use_safetensors=True,
+    device=device,
 )
 viz = torch.cuda.memory_summary()
 st.write(viz)
 prompt_template = f'USER: {user_input}\nASSISTANT:'
 if st.button("Generate the prompt"):
+    inputs = tokenizer(prompt_template, return_tensors='pt', max_length=512, truncation=True, padding='max_length', batch_size=4)
+    #inputs = tokenizer(prompt_template, return_tensors='pt')
     #streamer = TextStreamer(tokenizer)
     #pipe = pipeline(
     #    "text-generation",