Spaces:

KingNish
/

Sarvam-M-Demo

Running on Zero

App Files Files Community

KingNish commited on Jun 8

Commit

89f33a5

verified ·

1 Parent(s): 9c9a215

Create app.py

Browse files

Files changed (1) hide show

app.py +191 -0

app.py ADDED Viewed

	@@ -0,0 +1,191 @@

+import os
+import time
+import threading
+import gradio as gr
+import modelscope_studio.components.antd as antd
+import modelscope_studio.components.antdx as antdx
+import modelscope_studio.components.base as ms
+import modelscope_studio.components.pro as pro
+from modelscope_studio.components.pro.chatbot import (
+    ChatbotBotConfig,
+    ChatbotPromptsConfig,
+    ChatbotUserConfig,
+    ChatbotWelcomeConfig
+)
+from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
+import torch
+# Load the Sarvam AI model and tokenizer
+model_name = "sarvamai/sarvam-m"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16, device_map="auto")
+def prompt_select(e: gr.EventData):
+    return gr.update(value=e._data["payload"][0]["value"]["description"])
+def clear():
+    return gr.update(value=None)
+def retry(chatbot_value, e: gr.EventData):
+    index = e._data["payload"][0]["index"]
+    chatbot_value = chatbot_value[:index]
+    yield gr.update(loading=True), gr.update(value=chatbot_value), gr.update(disabled=True)
+    for chunk in submit(None, chatbot_value):
+        yield chunk
+def cancel(chatbot_value):
+    chatbot_value[-1]["loading"] = False
+    chatbot_value[-1]["status"] = "done"
+    chatbot_value[-1]["footer"] = "Chat completion paused"
+    return gr.update(value=chatbot_value), gr.update(loading=False), gr.update(disabled=False)
+def format_history(history):
+    messages = [{"role": "system", "content": "You are a helpful assistant."}]
+    for item in history:
+        if item["role"] == "user":
+            messages.append({"role": "user", "content": item["content"]})
+        elif item["role"] == "assistant":
+            messages.append({"role": "assistant", "content": item["content"][-1]["content"]})
+    return messages
+def generate_response(messages, chatbot_value, sender, clear_btn):
+    text = tokenizer.apply_chat_template(messages, tokenize=False, enable_thinking=True)
+    model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
+    streamer = TextIteratorStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
+    generate_kwargs = dict(
+        **model_inputs,
+        streamer=streamer,
+        max_new_tokens=8192,
+        do_sample=True,
+        temperature=0.7
+    )
+    thread = threading.Thread(target=model.generate, kwargs=generate_kwargs)
+    thread.start()
+    thought_done = False
+    start_time = time.time()
+    message_content = chatbot_value[-1]["content"]
+    message_content.append({
+        "copyable": False,
+        "editable": False,
+        "type": "tool",
+        "content": "",
+        "options": {"title": "Thinking..."}
+    })
+    message_content.append({"type": "text", "content": "",})
+    reasoning_content = ""
+    content = ""
+    for new_text in streamer:
+        if "</think>" in new_text:
+            reasoning_content = new_text.split("</think>")[0].rstrip("\n")
+            content = new_text.split("</think>")[-1].lstrip("\n").rstrip("</s>")
+        else:
+            content = new_text
+        chatbot_value[-1]["loading"] = False
+        if reasoning_content and not thought_done:
+            message_content[-2]["content"] = reasoning_content
+            thought_done = True
+            thought_cost_time = "{:.2f}".format(time.time() - start_time)
+            message_content[-2]["options"]["title"] = f"End of Thought ({thought_cost_time}s)"
+            message_content[-2]["options"]["status"] = "done"
+        message_content[-1]["content"] += content
+        yield {
+            clear_btn: gr.update(disabled=False),
+            sender: gr.update(loading=False),
+            chatbot: gr.update(value=chatbot_value),
+        }
+    chatbot_value[-1]["footer"] = "{:.2f}".format(time.time() - start_time) + 's'
+    chatbot_value[-1]["status"] = "done"
+    yield {
+        clear_btn: gr.update(disabled=False),
+        sender: gr.update(loading=False),
+        chatbot: gr.update(value=chatbot_value),
+    }
+def submit(sender_value, chatbot_value):
+    if sender_value is not None:
+        chatbot_value.append({"role": "user", "content": sender_value})
+    history_messages = format_history(chatbot_value)
+    chatbot_value.append({"role": "assistant", "content": [], "loading": True, "status": "pending"})
+    yield {
+        sender: gr.update(value=None, loading=True),
+        clear_btn: gr.update(disabled=True),
+        chatbot: gr.update(value=chatbot_value)
+    }
+    try:
+        for chunk in generate_response(history_messages, chatbot_value, sender, clear_btn):
+            yield chunk
+    except Exception as e:
+        chatbot_value[-1]["loading"] = False
+        chatbot_value[-1]["status"] = "done"
+        chatbot_value[-1]["content"] = "Failed to respond, please try again."
+        yield {
+            clear_btn: gr.update(disabled=False),
+            sender: gr.update(loading=False),
+            chatbot: gr.update(value=chatbot_value),
+        }
+        raise e
+with gr.Blocks() as demo, ms.Application(), antdx.XProvider():
+    with antd.Flex(vertical=True, gap="middle"):
+        chatbot = pro.Chatbot(
+            height=600,
+            welcome_config=ChatbotWelcomeConfig(
+                variant="borderless",
+                icon="https://cdn-avatars.huggingface.co/v1/production/uploads/60270a7c32856987162c641a/umd13GCWVijwTDGZzw3q-.png",
+                title=f"Hello, I'm Sarvam AI",
+                description="You can input text to get started.",
+                prompts=ChatbotPromptsConfig(
+                    title="How can I help you today?",
+                    styles={
+                        "list": {"width": '100%'},
+                        "item": {"flex": 1},
+                    },
+                    items=[
+                        {
+                            "label": "📅 Make a plan",
+                            "children": [
+                                {"description": "Help me with a plan to start a business"},
+                                {"description": "Help me with a plan to achieve my goals"},
+                                {"description": "Help me with a plan for a successful interview"}
+                            ]
+                        },
+                        {
+                            "label": "🖋 Help me write",
+                            "children": [
+                                {"description": "Help me write a story with a twist ending"},
+                                {"description": "Help me write a blog post on mental health"},
+                                {"description": "Help me write a letter to my future self"}
+                            ]
+                        }
+                    ]
+                )
+            ),
+            user_config=ChatbotUserConfig(avatar="https://api.dicebear.com/7.x/miniavs/svg?seed=3"),
+            bot_config=ChatbotBotConfig(
+                header="Sarvam AI",
+                avatar="https://cdn-avatars.huggingface.co/v1/production/uploads/60270a7c32856987162c641a/umd13GCWVijwTDGZzw3q-.png",
+                actions=["copy", "retry"]
+            ),
+        )
+        with antdx.Sender() as sender:
+            with ms.Slot("prefix"):
+                with antd.Button(value=None, color="default", variant="text") as clear_btn:
+                    with ms.Slot("icon"):
+                        antd.Icon("ClearOutlined")
+        clear_btn.click(fn=clear, outputs=[chatbot])
+        submit_event = sender.submit(fn=submit, inputs=[sender, chatbot], outputs=[sender, chatbot, clear_btn])
+        sender.cancel(fn=cancel, inputs=[chatbot], outputs=[chatbot, sender, clear_btn], cancels=[submit_event], queue=False)
+        chatbot.retry(fn=retry, inputs=[chatbot], outputs=[sender, chatbot, clear_btn])
+        chatbot.welcome_prompt_select(fn=prompt_select, outputs=[sender])
+if __name__ == "__main__":
+    demo.launch(mcp_server=True)