Spaces:

cedpsam
/

mistral_openorca_lamacpp

Runtime error

cedpsam commited on Oct 23, 2023

Commit

b4905cb

1 Parent(s): bc4f800

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -27,9 +27,9 @@ llm = LlamaCpp(
 def format_prompt(message, history):
   prompt = "<s>"
   for user_prompt, bot_response in history:
-    prompt += f"[INST] {user_prompt} [/INST]"
-    prompt += f" {bot_response}</s> "
-  prompt += f"[INST] {message} [/INST]"
   return prompt
 def generate(
@@ -51,7 +51,9 @@ def generate(
                temperature=temperature,
         max_tokens=max_new_tokens,
                repeat_penalty=repetition_penalty,
-        top_p=top_p,)
     # output=formatted_prompt+"ans:"+output
     # for response in stream:
     #     output += response.token.text

 def format_prompt(message, history):
   prompt = "<s>"
   for user_prompt, bot_response in history:
+    prompt += f"<|im_start|>user\n {user_prompt} <|im_end|>\n"
+    prompt += f"<|im_start|>assistant\n  {bot_response}<|im_end|>\n"
+  prompt += f"<|im_start|>user\n {message} <|im_end|>\n<|im_start|>assistant\n"
   return prompt
 def generate(
                temperature=temperature,
         max_tokens=max_new_tokens,
                repeat_penalty=repetition_penalty,
+        top_p=top_p,
+               stop=["<|im_end|>","<|im_start|>user"]
+              )
     # output=formatted_prompt+"ans:"+output
     # for response in stream:
     #     output += response.token.text