Spaces:

Blane187
/

TESTGroq-API-Chat

Paused

App Files Files Community

Nick088 commited on Jul 8, 2024

Commit

5977160

verified ·

1 Parent(s): 1ea872a

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -11

app.py CHANGED Viewed

@@ -10,14 +10,19 @@ client = Groq(api_key=os.environ.get("Groq_Api_Key"))
 # llms
 def create_history_messages(history):
     history_messages = [{"role": "user", "content": m[0]} for m in history]
     history_messages.extend([{"role": "assistant", "content": m[1]} for m in history])
     return history_messages
-MAX_SEED = np.iinfo(np.int32).max
 def generate_response(prompt, history, model, temperature, max_tokens, top_p, seed):
     messages = create_history_messages(history)
     messages.append({"role": "user", "content": prompt})
@@ -257,7 +262,19 @@ with gr.Blocks() as demo:
     with gr.Tabs():
         with gr.TabItem("LLMs"):
             with gr.Row():
-                with gr.Column():
                     model = gr.Dropdown(
                         choices=[
                             "llama3-70b-8192",
@@ -279,7 +296,7 @@ with gr.Blocks() as demo:
                     )
                     max_tokens = gr.Slider(
                         minimum=1,
-                        maximum=32192,
                         step=1,
                         value=4096,
                         label="Max Tokens",
@@ -296,12 +313,7 @@ with gr.Blocks() as demo:
                     seed = gr.Number(
                         precision=0, value=42, label="Seed", info="A starting point to initiate generation, use 0 for random"
                     )
-                with gr.Column():
-                    chatbot_ui = gr.ChatInterface(
-                        fn=generate_response,
-                        chatbot=None,
-                        additional_inputs=[model, temperature, max_tokens, top_p, seed],
-                    )
         with gr.TabItem("Speech To Text"):
             with gr.Tabs():
                 with gr.TabItem("Transcription"):

 # llms
+MAX_SEED = np.iinfo(np.int32).max
+def update_max_tokens(model):
+    if model in ["llama3-70b-8192", "llama3-8b-8192", "gemma-7b-it", "gemma2-9b-it"]:
+        return gr.update(maximum=8192)
+    elif model == "mixtral-8x7b-32768":
+        return gr.update(maximum=32768)
 def create_history_messages(history):
     history_messages = [{"role": "user", "content": m[0]} for m in history]
     history_messages.extend([{"role": "assistant", "content": m[1]} for m in history])
     return history_messages
 def generate_response(prompt, history, model, temperature, max_tokens, top_p, seed):
     messages = create_history_messages(history)
     messages.append({"role": "user", "content": prompt})
     with gr.Tabs():
         with gr.TabItem("LLMs"):
             with gr.Row():
+                with gr.Column(scale=1, min_width=400):
+                    chatbot = gr.ChatInterface(
+                        fn=generate_response,
+                        chatbot=None,
+                        additional_inputs=[
+                            model,
+                            temperature,
+                            max_tokens,
+                            top_p,
+                            seed,
+                        ],
+                    )
+                with gr.Column(scale=1, min_width=250):
                     model = gr.Dropdown(
                         choices=[
                             "llama3-70b-8192",
                     )
                     max_tokens = gr.Slider(
                         minimum=1,
+                        maximum=8192,
                         step=1,
                         value=4096,
                         label="Max Tokens",
                     seed = gr.Number(
                         precision=0, value=42, label="Seed", info="A starting point to initiate generation, use 0 for random"
                     )
+                    model.change(update_max_tokens, inputs=[model], outputs=max_tokens)
         with gr.TabItem("Speech To Text"):
             with gr.Tabs():
                 with gr.TabItem("Transcription"):