Spaces:

Rajesh3338
/

Check

Runtime error

App Files Files Community

Rajesh3338 commited on Feb 25

Commit

16fd3b1

verified ·

1 Parent(s): 2e56b20

Update app.py

Browse files

Files changed (1) hide show

app.py +33 -85

app.py CHANGED Viewed

@@ -1,87 +1,35 @@
 import gradio as gr
-import spaces
 import torch
-from langchain.document_loaders import TextLoader
-from langchain.text_splitter import RecursiveCharacterTextSplitter
-from langchain.embeddings import HuggingFaceEmbeddings
-from langchain.vectorstores import FAISS
-from langchain.llms import HuggingFacePipeline
-from langchain.chains import RetrievalQA
-from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
-# Load and process documents
-doc_loader = TextLoader("dataset.txt")
-docs = doc_loader.load()
-text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
-split_docs = text_splitter.split_documents(docs)
-# Create vector database
-embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
-vectordb = FAISS.from_documents(split_docs, embeddings)
-# Load model and create pipeline
-model_name = "Qwen/Qwen2.5-Coder-3B-Instruct"
-device = "cuda" if torch.cuda.is_available() else "cpu"
-print(f"Using device: {device}")
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-#model = AutoModelForCausalLM.from_pretrained(model_name, device_map="cuda", torch_dtype="auto")
-model = AutoModelForCausalLM.from_pretrained(
-    model_name,
-    device_map=device,
-    torch_dtype=torch.float16 if device == "cuda" else torch.float32
-)
-#model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto", torch_dtype="auto")
-qa_pipeline = pipeline(
-    "text-generation",
-    model=model,
-    tokenizer=tokenizer,
-    max_new_tokens=1500,
-    pad_token_id=tokenizer.eos_token_id
-)
-# Set up LangChain
-llm = HuggingFacePipeline(pipeline=qa_pipeline)
-retriever = vectordb.as_retriever(search_kwargs={"k": 5})
-qa_chain = RetrievalQA.from_chain_type(
-    retriever=retriever,
-    chain_type="stuff",
-    llm=llm,
-    return_source_documents=False
-)
-@spaces.GPU
-def preprocess_query(query):
-    if "script" in query or "code" in query.lower():
-        return f"Write a CPSL script: {query}"
-    return query
-@spaces.GPU
-def clean_response(response):
-    result = response.get("result", "")
-    if "Answer:" in result:
-        return result.split("Answer:")[1].strip()
-    return result.strip()
-@spaces.GPU
-def chatbot_response(user_input):
-    processed_query = preprocess_query(user_input)
-    raw_response = qa_chain.invoke({"query": processed_query})
-    return clean_response(raw_response)
-with gr.Blocks() as demo:  # Removed @spaces.GPU here
-    gr.Markdown("# CPSL Chatbot")
-    chat_history = gr.Chatbot()
-    user_input = gr.Textbox(label="Your Message:")
-    send_button = gr.Button("Send")
-    @spaces.GPU
-    def interact(user_message, history):
-        bot_reply = chatbot_response(user_message)
-        history.append((user_message, bot_reply))
-        return history, history
-    send_button.click(interact, inputs=[user_input, chat_history], outputs=[chat_history, chat_history])
-demo.launch()

 import gradio as gr
 import torch
+from transformers import PaliGemmaProcessor, PaliGemmaForConditionalGeneration
+from PIL import Image
+# Load model and processor
+model_id = "google/paligemma2-28b-mix-448"
+model = PaliGemmaForConditionalGeneration.from_pretrained(model_id, torch_dtype=torch.bfloat16, device_map="auto").eval()
+processor = PaliGemmaProcessor.from_pretrained(model_id)
+def generate_description(image, prompt):
+    if image is None:
+        return "Please upload an image."
+    model_inputs = processor(text=prompt, images=image, return_tensors="pt").to(torch.bfloat16).to(model.device)
+    input_len = model_inputs["input_ids"].shape[-1]
+    with torch.inference_mode():
+        generation = model.generate(**model_inputs, max_new_tokens=100, do_sample=False)
+        generation = generation[0][input_len:]
+        decoded = processor.decode(generation, skip_special_tokens=True)
+    return decoded
+# Gradio UI
+with gr.Blocks() as demo:
+    gr.Markdown("# PaliGemma Image Captioning")
+    image_input = gr.Image(type="pil", label="Upload Image")
+    prompt_input = gr.Textbox(label="Enter Prompt", value="describe en")
+    output_text = gr.Textbox(label="Generated Description")
+    submit_button = gr.Button("Generate")
+    submit_button.click(generate_description, inputs=[image_input, prompt_input], outputs=output_text)
+demo.launch()