caption-creator-pro

Running

App Files Files Community

GChilukala commited on Jun 9

Commit

0543f77

verified ·

1 Parent(s): 1e75f14

Update app.py

Browse files

Files changed (1) hide show

app.py +433 -20

app.py CHANGED Viewed

@@ -18,14 +18,11 @@ Date: June 2025
 import os
 import base64
 import json
-import asyncio
-import aiohttp
 from datetime import datetime, timedelta
 from typing import List, Dict, Optional, Any
 import io
 import re
 from dataclasses import dataclass
-from urllib.parse import quote_plus
 import functools
 import gc
@@ -33,17 +30,12 @@ import gc
 if not os.environ.get("HF_TOKEN"):
     print("⚠️ HF_TOKEN not found - translation features will use fallback mode")
-if not os.environ.get("SAMBANOVA_API_KEY"):
-    os.environ["SAMBANOVA_API_KEY"] = "7f3e8b92-3171-4927-a250-14e3a7e01a9d"
 # Core libraries
 import gradio as gr
-from PIL import Image, ImageEnhance, ImageFilter
-import numpy as np
-import pandas as pd
 from textblob import TextBlob
-import requests
-from bs4 import BeautifulSoup
 # OpenAI for SambaNova
 import openai
@@ -792,6 +784,121 @@ class AdvancedInstagramGenerator:
         return ''.join(caption_parts)
     async def generate_advanced_caption(self, images: List[Image.Image], style: str,
                                       audience: str, custom_prompt: str = "") -> str:
         """Generate advanced caption with SambaNova integration"""
@@ -945,6 +1052,65 @@ async def generate_advanced_caption_interface(uploaded_files, style, audience,
     return result, caption_only
 async def translate_caption_interface(base_caption, selected_languages):
     """Generate multi-language versions of captions"""
     if not base_caption.strip():
@@ -1044,26 +1210,96 @@ async def translate_caption_interface(base_caption, selected_languages):
 def create_gradio_app():
-    """Create the simplified Gradio app"""
     # Status indicators
     hf_status = "✅ Connected" if generator and generator.hf_client_working else "⚠️ Fallback Mode"
     sambanova_status = "✅ Connected" if generator and generator.sambanova_client_working else "⚠️ Fallback Mode"
-    with gr.Blocks(title="📱 Instagram Generator", theme=gr.themes.Soft()) as app:
         # Main Header
         gr.HTML(f"""
-        <div style="text-align: center; margin-bottom: 30px; padding: 30px; background: linear-gradient(135deg, #667eea 0%, #764ba2 100%); border-radius: 20px; color: white;">
-            <h1 style="font-size: 2.5rem; margin-bottom: 15px; font-weight: 800;">
                 📱 INSTAGRAM CAPTION GENERATOR
             </h1>
             <h2 style="font-size: 1.2rem; margin-bottom: 20px; opacity: 0.9;">
                 🚀 AI-Powered Content Creation • SambaNova + Hugging Face
             </h2>
             <div style="display: flex; justify-content: center; gap: 20px; margin-top: 15px;">
-                <span style="background: rgba(255,255,255,0.2); padding: 6px 12px; border-radius: 15px; font-size: 0.9rem;">🤖 SambaNova: {sambanova_status}</span>
-                <span style="background: rgba(255,255,255,0.2); padding: 6px 12px; border-radius: 15px; font-size: 0.9rem;">🤗 Hugging Face: {hf_status}</span>
             </div>
         </div>
         """)
@@ -1072,8 +1308,9 @@ def create_gradio_app():
         with gr.Tab("🎯 Caption Generator"):
             with gr.Row():
                 # Left Column - Controls
-                with gr.Column(scale=2):
                     gr.Markdown("### 🖼️ Upload Images")
                     images = gr.File(
                         label="📸 Upload Images (Max 3)",
@@ -1128,7 +1365,7 @@ def create_gradio_app():
                     )
                 # Right Column - Results
-                with gr.Column(scale=3):
                     gr.Markdown("### 📊 Generated Content")
                     output = gr.Textbox(
@@ -1138,11 +1375,25 @@ def create_gradio_app():
                         show_copy_button=True,
                         placeholder="Upload images and generate your Instagram content..."
                     )
         # Multi-Language Tab
         with gr.Tab("🌍 Multi-Language"):
             with gr.Row():
-                with gr.Column():
                     gr.Markdown("### 🗣️ Global Content Creation")
                     gr.Markdown("*Powered by Hugging Face Translation Models*")
@@ -1168,7 +1419,7 @@ def create_gradio_app():
                         variant="primary"
                     )
-                with gr.Column():
                     multilingual_output = gr.Textbox(
                         label="🗺️ Multi-Language Captions",
                         lines=20,
@@ -1176,6 +1427,161 @@ def create_gradio_app():
                         placeholder="Culturally adapted captions for global audiences..."
                     )
         # Event Handlers
         generate_btn.click(
             fn=generate_advanced_caption_interface,
@@ -1183,6 +1589,13 @@ def create_gradio_app():
             outputs=[output, base_caption_input]
         )
         # Multi-language translation
         translate_btn.click(
             fn=translate_caption_interface,

 import os
 import base64
 import json
 from datetime import datetime, timedelta
 from typing import List, Dict, Optional, Any
 import io
 import re
 from dataclasses import dataclass
 import functools
 import gc
 if not os.environ.get("HF_TOKEN"):
     print("⚠️ HF_TOKEN not found - translation features will use fallback mode")
+# SambaNova API key should be set in environment variables
 # Core libraries
 import gradio as gr
+from PIL import Image
 from textblob import TextBlob
 # OpenAI for SambaNova
 import openai
         return ''.join(caption_parts)
+    async def generate_mistral_variations(self, base_caption: str, count: int = 3) -> List[str]:
+        """Generate caption variations using Meta-Llama-3.2-3B-Instruct"""
+        variations = []
+        # Check if SambaNova client is available
+        if not self.sambanova_client:
+            print("⚠️ SambaNova client not available for Llama variations, using fallback")
+            for i in range(count):
+                fallback_variation = self.create_simple_variation(base_caption, i+1)
+                variations.append(f"{fallback_variation}\n\n✨ Generated by Fallback Method (SambaNova unavailable)")
+            return variations
+        # Different variation approaches to ensure variety
+        variation_styles = [
+            "Make this caption more energetic and exciting with different emojis",
+            "Create a more casual and friendly version of this caption",
+            "Write a shorter, punchier version that's more direct"
+        ]
+        for i in range(count):
+            try:
+                # Create specific variation prompt for each attempt
+                variation_prompt = f"""You are creating Instagram caption variations. {variation_styles[i]}.
+Original caption:
+{base_caption}
+Instructions:
+- Keep the same hashtags but rearrange them
+- Change the wording while keeping the same message
+- Use different emojis and expressions
+- Don't explain your changes
+- Only output the new caption, nothing else
+New caption:"""
+                print(f"🔄 Generating Llama-3.2 variation {i+1}...")
+                # Generate variation using Meta-Llama-3.2-3B-Instruct model
+                response = self.sambanova_client.chat.completions.create(
+                    model=self.variation_model,  # Meta-Llama-3.2-3B-Instruct
+                    messages=[
+                        {"role": "system", "content": "You are a helpful Instagram caption writer. Only output the caption, no explanations."},
+                        {"role": "user", "content": variation_prompt}
+                    ],
+                    temperature=0.9,  # Higher temperature for more variety
+                    top_p=0.95,
+                    max_tokens=200  # Limit output length
+                )
+                if response and response.choices and len(response.choices) > 0:
+                    result = response.choices[0].message.content.strip()
+                    # Clean up the result - remove explanatory text
+                    lines = result.split('\n')
+                    clean_result = []
+                    for line in lines:
+                        line = line.strip()
+                        # Skip lines that look like explanations
+                        if (line and
+                            not line.startswith('This variation') and
+                            not line.startswith('- ') and
+                            not line.startswith('The ') and
+                            not 'maintains the same' in line.lower() and
+                            not 'variation' in line.lower()):
+                            clean_result.append(line)
+                    final_result = '\n'.join(clean_result).strip()
+                    if final_result and len(final_result.strip()) > 20:
+                        variations.append(f"{final_result}\n\n✨ Generated by Meta-Llama-3.2-3B-Instruct")
+                        print(f"✅ Llama-3.2 variation {i+1} generated successfully")
+                    else:
+                        print(f"⚠️ Poor response from Llama-3.2 for variation {i+1}, using fallback")
+                        fallback_variation = self.create_simple_variation(base_caption, i+1)
+                        variations.append(f"{fallback_variation}\n\n✨ Generated by Fallback Method (Poor response)")
+                else:
+                    print(f"⚠️ Empty response from Llama-3.2 for variation {i+1}, using fallback")
+                    fallback_variation = self.create_simple_variation(base_caption, i+1)
+                    variations.append(f"{fallback_variation}\n\n✨ Generated by Fallback Method (Empty response)")
+            except Exception as e:
+                print(f"⚠️ Error generating Llama-3.2 variation {i+1}: {e}")
+                # Create a simple variation as fallback
+                fallback_variation = self.create_simple_variation(base_caption, i+1)
+                variations.append(f"{fallback_variation}\n\n✨ Generated by Fallback Method (Error: {str(e)[:50]})")
+        return variations
+    def create_simple_variation(self, base_caption: str, variation_num: int) -> str:
+        """Create a simple variation when Mistral fails"""
+        # More sophisticated text modifications for fallback
+        if variation_num == 1:
+            # Variation 1: Change sentence starters and expressions
+            modified = base_caption.replace("This is", "Here's").replace("Check out", "Take a look at")
+            modified = modified.replace("Amazing", "Incredible").replace("Love", "Absolutely adore")
+            modified = modified.replace("Can't wait", "So excited").replace("Let me know", "Tell me")
+            return modified
+        elif variation_num == 2:
+            # Variation 2: Add emphasis and change punctuation
+            modified = base_caption.replace("!", " ✨").replace(".", "! ")
+            modified = modified.replace("Great", "Fantastic").replace("Beautiful", "Stunning")
+            modified = modified.replace("Perfect", "Absolutely perfect").replace("Share", "Don't forget to share")
+            return modified
+        else:  # variation_num == 3
+            # Variation 3: Rearrange and substitute words
+            modified = base_caption.replace("🔥", "💫").replace("Follow", "Join me")
+            modified = modified.replace("Comment", "Drop a comment").replace("Tag", "Make sure to tag")
+            modified = modified.replace("What do you think", "I'd love to hear your thoughts")
+            return modified
     async def generate_advanced_caption(self, images: List[Image.Image], style: str,
                                       audience: str, custom_prompt: str = "") -> str:
         """Generate advanced caption with SambaNova integration"""
     return result, caption_only
+async def generate_multiple_captions_interface(uploaded_files, style, audience,
+                                             custom_prompt):
+    """Generate multiple caption variations using Meta-Llama-3.2-3B-Instruct"""
+    if not setup_success:
+        return f"❌ Setup Error: {setup_error}"
+    images = []
+    if uploaded_files:
+        for file in uploaded_files[:3]:
+            try:
+                image = Image.open(file.name)
+                images.append(image)
+            except Exception as e:
+                return f"❌ Error processing file: {e}"
+    if not images:
+        return "❌ Please upload at least one image to generate caption variations."
+    # First generate the main caption using Llama-4-Maverick
+    main_result = await generator.generate_advanced_caption(
+        images, style, audience, custom_prompt
+    )
+    # Extract just the caption text (without the header and footer)
+    base_caption = ""
+    if "✨ AI-GENERATED INSTAGRAM CONTENT:" in main_result:
+        lines = main_result.split('\n')
+        caption_lines = []
+        start_capturing = False
+        for line in lines:
+            if "✨ AI-GENERATED INSTAGRAM CONTENT:" in line:
+                start_capturing = True
+                continue
+            elif "🤖 Powered by SambaNova" in line:
+                break
+            elif start_capturing and line.strip():
+                caption_lines.append(line)
+        base_caption = '\n'.join(caption_lines).strip()
+    if not base_caption:
+        return "❌ Failed to generate base caption for variations"
+    # Generate 3 variations using Meta-Llama-3.2-3B-Instruct
+    variations = await generator.generate_mistral_variations(base_caption, count=3)
+    # Format the results
+    formatted_result = "✨ ALTERNATIVE CAPTIONS:\n\n"
+    formatted_result += "=" * 60 + "\n\n"
+    for i, variation in enumerate(variations, 1):
+        formatted_result += f"📝 ALTERNATIVE {i}:\n"
+        formatted_result += f"{variation}\n"
+        formatted_result += "=" * 60 + "\n\n"
+    return formatted_result
 async def translate_caption_interface(base_caption, selected_languages):
     """Generate multi-language versions of captions"""
     if not base_caption.strip():
 def create_gradio_app():
+    """Create the Gradio app with good UI styling"""
     # Status indicators
     hf_status = "✅ Connected" if generator and generator.hf_client_working else "⚠️ Fallback Mode"
     sambanova_status = "✅ Connected" if generator and generator.sambanova_client_working else "⚠️ Fallback Mode"
+    # Enhanced CSS for better UI
+    css = """
+    @import url('https://fonts.googleapis.com/css2?family=Space+Grotesk:wght@300;400;500;600;700&display=swap');
+    .gradio-container {
+        background: linear-gradient(135deg, #667eea 0%, #764ba2 25%, #f093fb 50%, #f5576c 75%, #4facfe 100%);
+        font-family: 'Space Grotesk', 'Inter', system-ui, sans-serif;
+        min-height: 100vh;
+    }
+    .main-header {
+        text-align: center;
+        color: white;
+        margin-bottom: 30px;
+        padding: 30px;
+        background: rgba(255,255,255,0.1);
+        border-radius: 20px;
+        backdrop-filter: blur(20px);
+        border: 1px solid rgba(255,255,255,0.2);
+        box-shadow: 0 20px 40px rgba(0,0,0,0.1);
+    }
+    .feature-card {
+        background: rgba(255,255,255,0.1);
+        border-radius: 15px;
+        padding: 20px;
+        backdrop-filter: blur(15px);
+        border: 1px solid rgba(255,255,255,0.2);
+        box-shadow: 0 15px 30px rgba(0,0,0,0.1);
+        margin: 10px 0;
+    }
+    .gradio-button-primary {
+        background: linear-gradient(45deg, #ff6b6b, #ee5a24, #ff9ff3, #54a0ff) !important;
+        border: none !important;
+        border-radius: 15px !important;
+        padding: 15px 25px !important;
+        font-weight: 600 !important;
+        color: white !important;
+        box-shadow: 0 10px 20px rgba(255, 107, 107, 0.3) !important;
+        transition: all 0.3s ease !important;
+    }
+    .gradio-button-primary:hover {
+        transform: translateY(-2px) !important;
+        box-shadow: 0 15px 30px rgba(255, 107, 107, 0.5) !important;
+    }
+    .gradio-button-secondary {
+        background: linear-gradient(45deg, #feca57, #ff9ff3, #54a0ff, #5f27cd) !important;
+        border: none !important;
+        border-radius: 12px !important;
+        padding: 12px 20px !important;
+        font-weight: 600 !important;
+        color: white !important;
+        box-shadow: 0 8px 16px rgba(254, 202, 87, 0.3) !important;
+    }
+    .status-badge {
+        background: linear-gradient(90deg, #2ecc71, #27ae60);
+        color: white;
+        padding: 10px 20px;
+        border-radius: 10px;
+        text-align: center;
+        font-weight: 600;
+        box-shadow: 0 8px 16px rgba(46, 204, 113, 0.3);
+        margin: 10px 0;
+    }
+    """
+    with gr.Blocks(css=css, title="📱 Instagram Generator", theme=gr.themes.Glass()) as app:
         # Main Header
         gr.HTML(f"""
+        <div class="main-header">
+            <h1 style="font-size: 2.5rem; margin-bottom: 15px; font-weight: 800; background: linear-gradient(45deg, #ff6b6b, #feca57, #ff9ff3, #54a0ff); -webkit-background-clip: text; -webkit-text-fill-color: transparent;">
                 📱 INSTAGRAM CAPTION GENERATOR
             </h1>
             <h2 style="font-size: 1.2rem; margin-bottom: 20px; opacity: 0.9;">
                 🚀 AI-Powered Content Creation • SambaNova + Hugging Face
             </h2>
             <div style="display: flex; justify-content: center; gap: 20px; margin-top: 15px;">
+                <span style="background: rgba(255,255,255,0.2); padding: 8px 16px; border-radius: 15px;">🤖 SambaNova: {sambanova_status}</span>
+                <span style="background: rgba(255,255,255,0.2); padding: 8px 16px; border-radius: 15px;">🤗 Hugging Face: {hf_status}</span>
             </div>
         </div>
         """)
         with gr.Tab("🎯 Caption Generator"):
             with gr.Row():
                 # Left Column - Controls
+                with gr.Column(scale=2, elem_classes=["feature-card"]):
                     gr.Markdown("### 🖼️ Upload Images")
+                    gr.Markdown("*SambaNova AI vision analysis with quality scoring*")
                     images = gr.File(
                         label="📸 Upload Images (Max 3)",
                     )
                 # Right Column - Results
+                with gr.Column(scale=3, elem_classes=["feature-card"]):
                     gr.Markdown("### 📊 Generated Content")
                     output = gr.Textbox(
                         show_copy_button=True,
                         placeholder="Upload images and generate your Instagram content..."
                     )
+                    with gr.Row():
+                        alternatives_btn = gr.Button(
+                            "✨ Generate 3 Alternative Captions",
+                            variant="secondary",
+                            scale=1
+                        )
+                    alternatives_output = gr.Textbox(
+                        label="✨ Alternative Captions",
+                        lines=15,
+                        show_copy_button=True,
+                        placeholder="Generate 3 different caption alternatives using Meta-Llama-3.2-3B-Instruct..."
+                    )
         # Multi-Language Tab
         with gr.Tab("🌍 Multi-Language"):
             with gr.Row():
+                with gr.Column(elem_classes=["feature-card"]):
                     gr.Markdown("### 🗣️ Global Content Creation")
                     gr.Markdown("*Powered by Hugging Face Translation Models*")
                         variant="primary"
                     )
+                with gr.Column(elem_classes=["feature-card"]):
                     multilingual_output = gr.Textbox(
                         label="🗺️ Multi-Language Captions",
                         lines=20,
                         placeholder="Culturally adapted captions for global audiences..."
                     )
+        # SambaNova Features Tab
+        with gr.Tab("🤖 SambaNova Features"):
+            gr.HTML(f"""
+            <div class="status-badge">
+                🚀 SambaNova Status: {sambanova_status} • 🦙 Llama-4-Maverick + Llama-3.2-3B
+            </div>
+            """)
+            with gr.Row():
+                with gr.Column(elem_classes=["feature-card"]):
+                    gr.HTML("""
+                    <div style="text-align: center; padding: 20px;">
+                        <h3>⚡ SambaNova AI Capabilities</h3>
+                        <div style="display: grid; grid-template-columns: repeat(2, 1fr); gap: 15px; margin-top: 20px;">
+                            <div style="padding: 15px; background: rgba(255,255,255,0.1); border-radius: 10px;">
+                                <h4 style="color: #2ecc71; margin: 0;">Llama-4-Maverick</h4>
+                                <p style="margin: 5px 0; opacity: 0.8;">Main Caption Generation</p>
+                            </div>
+                            <div style="padding: 15px; background: rgba(255,255,255,0.1); border-radius: 10px;">
+                                <h4 style="color: #3498db; margin: 0;">Llama-3.2-3B</h4>
+                                <p style="margin: 5px 0; opacity: 0.8;">Caption Variations</p>
+                            </div>
+                            <div style="padding: 15px; background: rgba(255,255,255,0.1); border-radius: 10px;">
+                                <h4 style="color: #e74c3c; margin: 0;">Multi-Modal</h4>
+                                <p style="margin: 5px 0; opacity: 0.8;">Vision + Text Analysis</p>
+                            </div>
+                            <div style="padding: 15px; background: rgba(255,255,255,0.1); border-radius: 10px;">
+                                <h4 style="color: #f39c12; margin: 0;">Advanced</h4>
+                                <p style="margin: 5px 0; opacity: 0.8;">Style & Audience Targeting</p>
+                            </div>
+                        </div>
+                    </div>
+                    """)
+                with gr.Column(elem_classes=["feature-card"]):
+                    gr.Code(
+                        value="""
+# SambaNova API Integration:
+from openai import OpenAI
+client = OpenAI(
+    api_key=os.environ["SAMBANOVA_API_KEY"],
+    base_url="https://api.sambanova.ai/v1",
+)
+# Main caption generation
+response = client.chat.completions.create(
+    model="Llama-4-Maverick-17B-128E-Instruct",
+    messages=[{
+        "role": "user",
+        "content": [
+            {"type": "text", "text": "Create Instagram caption"},
+            {"type": "image_url", "image_url": {"url": "data:image/jpeg;base64,..."}}
+        ]
+    }],
+    temperature=0.1,
+    top_p=0.1
+)
+# Caption variations
+variations = client.chat.completions.create(
+    model="Meta-Llama-3.2-3B-Instruct",
+    messages=[{
+        "role": "user",
+        "content": "Create different version of this caption..."
+    }],
+    temperature=0.9,
+    top_p=0.95
+)
+                        """,
+                        language="python",
+                        label="🔧 SambaNova Integration Code"
+                    )
+        # Hugging Face Features Tab
+        with gr.Tab("🤗 Hugging Face Features"):
+            gr.HTML(f"""
+            <div class="status-badge">
+                🤗 Hugging Face Status: {hf_status} • 🌍 Multi-Language Translation
+            </div>
+            """)
+            with gr.Row():
+                with gr.Column(elem_classes=["feature-card"]):
+                    gr.HTML("""
+                    <div style="text-align: center; padding: 20px;">
+                        <h3>🌍 Translation Models</h3>
+                        <div style="display: grid; grid-template-columns: repeat(2, 1fr); gap: 15px; margin-top: 20px;">
+                            <div style="padding: 15px; background: rgba(255,255,255,0.1); border-radius: 10px;">
+                                <h4 style="color: #2ecc71; margin: 0;">🇩🇪 German</h4>
+                                <p style="margin: 5px 0; opacity: 0.8;">google-t5/t5-small</p>
+                            </div>
+                            <div style="padding: 15px; background: rgba(255,255,255,0.1); border-radius: 10px;">
+                                <h4 style="color: #3498db; margin: 0;">🇨🇳 Chinese</h4>
+                                <p style="margin: 5px 0; opacity: 0.8;">chence08/mt5-small-iwslt2017-zh-en</p>
+                            </div>
+                            <div style="padding: 15px; background: rgba(255,255,255,0.1); border-radius: 10px;">
+                                <h4 style="color: #e74c3c; margin: 0;">🇫🇷 French</h4>
+                                <p style="margin: 5px 0; opacity: 0.8;">google-t5/t5-large</p>
+                            </div>
+                            <div style="padding: 15px; background: rgba(255,255,255,0.1); border-radius: 10px;">
+                                <h4 style="color: #f39c12; margin: 0;">🇸🇦 Arabic</h4>
+                                <p style="margin: 5px 0; opacity: 0.8;">marefa-nlp/marefa-mt-en-ar</p>
+                            </div>
+                        </div>
+                    </div>
+                    """)
+                with gr.Column(elem_classes=["feature-card"]):
+                    gr.Code(
+                        value="""
+# Hugging Face Translation Integration:
+from huggingface_hub import InferenceClient
+client = InferenceClient(
+    provider="hf-inference",
+    api_key=os.environ["HF_TOKEN"],
+)
+# German translation
+german_result = client.translation(
+    "This is an amazing moment! ✨",
+    model="google-t5/t5-small",
+)
+# Chinese translation
+chinese_result = client.translation(
+    "Amazing content for Instagram",
+    model="chence08/mt5-small-iwslt2017-zh-en",
+)
+# French translation
+french_result = client.translation(
+    "Beautiful content creation",
+    model="google-t5/t5-large",
+)
+# Arabic translation
+arabic_result = client.translation(
+    "Social media content",
+    model="marefa-nlp/marefa-mt-en-ar",
+)
+# Features:
+# ✅ 4 language models
+# ✅ Fallback support
+# ✅ Instagram-optimized output
+# ✅ Cultural adaptation
+                        """,
+                        language="python",
+                        label="🔧 Hugging Face Translation Code"
+                    )
         # Event Handlers
         generate_btn.click(
             fn=generate_advanced_caption_interface,
             outputs=[output, base_caption_input]
         )
+        # Generate multiple alternatives
+        alternatives_btn.click(
+            fn=generate_multiple_captions_interface,
+            inputs=[images, caption_style, target_audience, custom_prompt],
+            outputs=alternatives_output
+        )
         # Multi-language translation
         translate_btn.click(
             fn=translate_caption_interface,