Spaces:

TDN-M
/

vvv

Sleeping

App Files Files Community

TDN-M commited on Apr 18

Commit

3bb7349

verified ·

1 Parent(s): 2f7b37f

Update app.py

Browse files

Files changed (1) hide show

app.py +99 -17

app.py CHANGED Viewed

@@ -11,11 +11,12 @@ logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 # Cấu hình API TDNM
-VIDU_API_KEY = os.getenv("VIDU_API_KEY")  # Giữ tên biến để tương thích với API
-TDNM_KEY = os.getenv("TDNM_KEY")  # Khóa bí mật để xác thực người dùng
-VIDU_API_URL = "https://api.vidu.com"  # URL API thực tế
 POLL_INTERVAL = 5  # Giây giữa các lần kiểm tra trạng thái
 TIMEOUT = 300  # Thời gian chờ tối đa để tạo video
 # Hàm kiểm tra TDNM_KEY
 def validate_tdn_key(user_key):
@@ -28,13 +29,13 @@ def validate_tdn_key(user_key):
     return True, "Khóa bí mật được xác thực thành công."
 # Hàm kiểm tra yêu cầu hình ảnh
-def validate_image(image_path):
     if not image_path:
         return False, "Lỗi: Chưa cung cấp hình ảnh."
-    # Kiểm tra kích thước tệp (<10MB)
-    if os.path.getsize(image_path) > 10 * 1024 * 1024:
-        return False, "Lỗi: Kích thước hình ảnh vượt quá 10MB."
     # Kiểm tra định dạng
     mime_type, _ = mimetypes.guess_type(image_path)
@@ -52,7 +53,7 @@ def validate_image(image_path):
     except Exception as e:
         return False, f"Lỗi khi kiểm tra hình ảnh: {str(e)}"
-# Hàm kiểm tra tỷ lệ mật độ điểm ảnh giữa hai hình ảnh
 def validate_pixel_density(start_image, end_image):
     try:
         start_img = Image.open(start_image)
@@ -67,12 +68,12 @@ def validate_pixel_density(start_image, end_image):
         return False, f"Lỗi khi kiểm tra mật độ điểm ảnh: {str(e)}"
 # Hàm tải hình ảnh lên TDNM
-def upload_image_to_vidu(image_path):
     if not VIDU_API_KEY:
         return None, "Lỗi: Khóa API TDNM chưa được cấu hình."
     # Kiểm tra hình ảnh
-    valid, error_message = validate_image(image_path)
     if not valid:
         return None, error_message
@@ -131,7 +132,7 @@ def upload_image_to_vidu(image_path):
         return None, f"Lỗi khi hoàn tất tải lên: {str(e)}"
 # Hàm gọi API TDNM cho Start-End to Video
-def start_end_to_video(start_image, end_image, prompt, model="vidu2.0", resolution="720p", duration=4, movement_amplitude="auto", seed=None, user_key=None):
     # Kiểm tra TDNM_KEY
     valid_key, key_message = validate_tdn_key(user_key)
     if not valid_key:
@@ -166,7 +167,7 @@ def start_end_to_video(start_image, end_image, prompt, model="vidu2.0", resoluti
     }
     payload = {
-        "model": model,
         "images": [start_uri, end_uri],
         "prompt": prompt or "",
         "duration": duration,
@@ -191,6 +192,59 @@ def start_end_to_video(start_image, end_image, prompt, model="vidu2.0", resoluti
             logger.error(f"Phản hồi API: {response.text}")
         return None, f"Lỗi: {str(e)} - {response.text}"
 # Placeholder cho References to Video
 def references_to_video(reference_images, prompt, resolution="720p", duration=4, user_key=None):
     # Kiểm tra TDNM_KEY
@@ -241,10 +295,20 @@ def check_task_status(task_id):
     return None, f"Lỗi: Hết thời gian tạo video. ID tác vụ: {task_id}"
 # Hàm giao diện Gradio cho Start-End to Video
-def gradio_start_end_to_video(start_image, end_image, prompt, model, resolution, duration, movement_amplitude, seed, user_key):
     if not start_image or not end_image:
         return None, "Lỗi: Cần cung cấp cả hai hình ảnh đầu và cuối."
-    task_id, message = start_end_to_video(start_image, end_image, prompt, model, resolution, duration, movement_amplitude, seed, user_key)
     if not task_id:
         return None, message
     video_url, status_message = check_task_status(task_id)
@@ -268,7 +332,7 @@ with gr.Blocks(title="Trình Tạo Video TDNM") as demo:
     gr.Markdown("# Trình Tạo Video TDNM")
     gr.Markdown("Tạo video với TDNM. Vui lòng nhập khóa bí mật (TDNM_KEY) để sử dụng ứng dụng.")
-    # Trường nhập khóa bí mật (áp dụng cho cả hai tab)
     user_key = gr.Textbox(label="Khóa Bí Mật (TDNM_KEY)", type="password", placeholder="Nhập khóa bí mật của bạn")
     # Tab cho Start-End to Video
@@ -277,7 +341,6 @@ with gr.Blocks(title="Trình Tạo Video TDNM") as demo:
         start_image = gr.Image(type="filepath", label="Hình Ảnh Đầu")
         end_image = gr.Image(type="filepath", label="Hình Ảnh Cuối")
         prompt_se = gr.Textbox(label="Mô Tả Văn Bản (Tùy Chọn)", placeholder="Ví dụ: 'Chuyển đổi mượt mà từ khung xe thành xe hoàn chỉnh.'")
-        model_se = gr.Dropdown(choices=["vidu2.0", "vidu1.5"], label="Mô Hình", value="vidu2.0")
         resolution_se = gr.Dropdown(choices=["360p", "720p", "1080p"], label="Độ Phân Giải", value="720p")
         duration_se = gr.Dropdown(choices=[4, 8], label="Thời Lượng (giây)", value=4)
         movement_amplitude_se = gr.Dropdown(choices=["auto", "small", "medium", "large"], label="Biên Độ Chuyển Động", value="auto")
@@ -288,10 +351,29 @@ with gr.Blocks(title="Trình Tạo Video TDNM") as demo:
         se_button.click(
             fn=gradio_start_end_to_video,
-            inputs=[start_image, end_image, prompt_se, model_se, resolution_se, duration_se, movement_amplitude_se, seed_se, user_key],
             outputs=[se_video_output, se_message]
         )
     # Tab cho References to Video (Placeholder)
     with gr.Tab("Video Từ Hình Ảnh Tham Chiếu"):
         gr.Markdown("Tải lên 1–3 hình ảnh tham chiếu và mô tả văn bản để tạo video. (Chưa được triển khai.)")

 logger = logging.getLogger(__name__)
 # Cấu hình API TDNM
+VIDU_API_KEY = os.getenv("VIDU_API_KEY")
+TDNM_KEY = os.getenv("TDNM_KEY")
+VIDU_API_URL = "https://api.vidu.com"
 POLL_INTERVAL = 5  # Giây giữa các lần kiểm tra trạng thái
 TIMEOUT = 300  # Thời gian chờ tối đa để tạo video
+DEFAULT_MODEL = "vidu2.0"  # Mô hình mặc định
 # Hàm kiểm tra TDNM_KEY
 def validate_tdn_key(user_key):
     return True, "Khóa bí mật được xác thực thành công."
 # Hàm kiểm tra yêu cầu hình ảnh
+def validate_image(image_path, max_size_mb=10):
     if not image_path:
         return False, "Lỗi: Chưa cung cấp hình ảnh."
+    # Kiểm tra kích thước tệp
+    if os.path.getsize(image_path) > max_size_mb * 1024 * 1024:
+        return False, f"Lỗi: Kích thước hình ảnh vượt quá {max_size_mb}MB."
     # Kiểm tra định dạng
     mime_type, _ = mimetypes.guess_type(image_path)
     except Exception as e:
         return False, f"Lỗi khi kiểm tra hình ảnh: {str(e)}"
+# Hàm kiểm tra tỷ lệ mật độ điểm ảnh (cho start-end)
 def validate_pixel_density(start_image, end_image):
     try:
         start_img = Image.open(start_image)
         return False, f"Lỗi khi kiểm tra mật độ điểm ảnh: {str(e)}"
 # Hàm tải hình ảnh lên TDNM
+def upload_image_to_vidu(image_path, max_size_mb=10):
     if not VIDU_API_KEY:
         return None, "Lỗi: Khóa API TDNM chưa được cấu hình."
     # Kiểm tra hình ảnh
+    valid, error_message = validate_image(image_path, max_size_mb)
     if not valid:
         return None, error_message
         return None, f"Lỗi khi hoàn tất tải lên: {str(e)}"
 # Hàm gọi API TDNM cho Start-End to Video
+def start_end_to_video(start_image, end_image, prompt, resolution="720p", duration=4, movement_amplitude="auto", seed=None, user_key=None):
     # Kiểm tra TDNM_KEY
     valid_key, key_message = validate_tdn_key(user_key)
     if not valid_key:
     }
     payload = {
+        "model": DEFAULT_MODEL,
         "images": [start_uri, end_uri],
         "prompt": prompt or "",
         "duration": duration,
             logger.error(f"Phản hồi API: {response.text}")
         return None, f"Lỗi: {str(e)} - {response.text}"
+# Hàm gọi API TDNM cho Img to Video
+def img_to_video(image, prompt, resolution="720p", duration=4, movement_amplitude="auto", seed=None, user_key=None):
+    # Kiểm tra TDNM_KEY
+    valid_key, key_message = validate_tdn_key(user_key)
+    if not valid_key:
+        return None, key_message
+    if not VIDU_API_KEY:
+        return None, "Lỗi: Khóa API TDNM chưa được cấu hình."
+    if not image:
+        return None, "Lỗi: Cần cung cấp một hình ảnh."
+    if prompt and len(prompt) > 1500:
+        return None, "Lỗi: Mô tả văn bản không được vượt quá 1500 ký tự."
+    # Tải hình ảnh lên TDNM (giới hạn 50MB cho img2video)
+    image_uri, image_message = upload_image_to_vidu(image, max_size_mb=50)
+    if not image_uri:
+        return None, image_message
+    url = f"{VIDU_API_URL}/ent/v2/img2video"
+    headers = {
+        "Authorization": f"Token {VIDU_API_KEY}",
+        "Content-Type": "application/json"
+    }
+    payload = {
+        "model": DEFAULT_MODEL,
+        "images": [image_uri],
+        "prompt": prompt or "",
+        "duration": duration,
+        "resolution": resolution,
+        "movement_amplitude": movement_amplitude
+    }
+    if seed is not None:
+        payload["seed"] = seed
+    try:
+        logger.info(f"Gửi yêu cầu đến API TDNM Img to Video: {payload}")
+        response = requests.post(url, json=payload, headers=headers)
+        response.raise_for_status()
+        result = response.json()
+        task_id = result.get("task_id")
+        if not task_id:
+            return None, "Lỗi: Không nhận được ID tác vụ."
+        return task_id, f"Tác vụ được tạo thành công. ID tác vụ: {task_id}"
+    except requests.exceptions.RequestException as e:
+        logger.error(f"Lỗi API: {str(e)}")
+        if response.text:
+            logger.error(f"Phản hồi API: {response.text}")
+        return None, f"Lỗi: {str(e)} - {response.text}"
 # Placeholder cho References to Video
 def references_to_video(reference_images, prompt, resolution="720p", duration=4, user_key=None):
     # Kiểm tra TDNM_KEY
     return None, f"Lỗi: Hết thời gian tạo video. ID tác vụ: {task_id}"
 # Hàm giao diện Gradio cho Start-End to Video
+def gradio_start_end_to_video(start_image, end_image, prompt, resolution, duration, movement_amplitude, seed, user_key):
     if not start_image or not end_image:
         return None, "Lỗi: Cần cung cấp cả hai hình ảnh đầu và cuối."
+    task_id, message = start_end_to_video(start_image, end_image, prompt, resolution, duration, movement_amplitude, seed, user_key)
+    if not task_id:
+        return None, message
+    video_url, status_message = check_task_status(task_id)
+    return video_url, status_message
+# Hàm giao diện Gradio cho Img to Video
+def gradio_img_to_video(image, prompt, resolution, duration, movement_amplitude, seed, user_key):
+    if not image:
+        return None, "Lỗi: Cần cung cấp một hình ảnh."
+    task_id, message = img_to_video(image, prompt, resolution, duration, movement_amplitude, seed, user_key)
     if not task_id:
         return None, message
     video_url, status_message = check_task_status(task_id)
     gr.Markdown("# Trình Tạo Video TDNM")
     gr.Markdown("Tạo video với TDNM. Vui lòng nhập khóa bí mật (TDNM_KEY) để sử dụng ứng dụng.")
+    # Trường nhập khóa bí mật (áp dụng cho tất cả các tab)
     user_key = gr.Textbox(label="Khóa Bí Mật (TDNM_KEY)", type="password", placeholder="Nhập khóa bí mật của bạn")
     # Tab cho Start-End to Video
         start_image = gr.Image(type="filepath", label="Hình Ảnh Đầu")
         end_image = gr.Image(type="filepath", label="Hình Ảnh Cuối")
         prompt_se = gr.Textbox(label="Mô Tả Văn Bản (Tùy Chọn)", placeholder="Ví dụ: 'Chuyển đổi mượt mà từ khung xe thành xe hoàn chỉnh.'")
         resolution_se = gr.Dropdown(choices=["360p", "720p", "1080p"], label="Độ Phân Giải", value="720p")
         duration_se = gr.Dropdown(choices=[4, 8], label="Thời Lượng (giây)", value=4)
         movement_amplitude_se = gr.Dropdown(choices=["auto", "small", "medium", "large"], label="Biên Độ Chuyển Động", value="auto")
         se_button.click(
             fn=gradio_start_end_to_video,
+            inputs=[start_image, end_image, prompt_se, resolution_se, duration_se, movement_amplitude_se, seed_se, user_key],
             outputs=[se_video_output, se_message]
         )
+    # Tab cho Img to Video
+    with gr.Tab("Video Từ Một Ảnh"):
+        gr.Markdown("Tải lên một hình ảnh và mô tả văn bản để tạo video. Hình ảnh phải là PNG, WebP, JPEG hoặc JPG, kích thước dưới 50MB, tỷ lệ khung hình từ 1:4 đến 4:1.")
+        image_i2v = gr.Image(type="filepath", label="Hình Ảnh")
+        prompt_i2v = gr.Textbox(label="Mô Tả Văn Bản (Tùy Chọn)", placeholder="Ví dụ: 'Phi hành gia vẫy tay và camera di chuyển lên.'")
+        resolution_i2v = gr.Dropdown(choices=["360p", "720p", "1080p"], label="Độ Phân Giải", value="720p")
+        duration_i2v = gr.Dropdown(choices=[4, 8], label="Thời Lượng (giây)", value=4)
+        movement_amplitude_i2v = gr.Dropdown(choices=["auto", "small", "medium", "large"], label="Biên Độ Chuyển Động", value="auto")
+        seed_i2v = gr.Number(label="Hạt Giống (Tùy Chọn)", value=None, precision=0)
+        i2v_button = gr.Button("Tạo Video")
+        i2v_video_output = gr.Video(label="Video Được Tạo")
+        i2v_message = gr.Textbox(label="Trạng Thái")
+        i2v_button.click(
+            fn=gradio_img_to_video,
+            inputs=[image_i2v, prompt_i2v, resolution_i2v, duration_i2v, movement_amplitude_i2v, seed_i2v, user_key],
+            outputs=[i2v_video_output, i2v_message]
+        )
     # Tab cho References to Video (Placeholder)
     with gr.Tab("Video Từ Hình Ảnh Tham Chiếu"):
         gr.Markdown("Tải lên 1–3 hình ảnh tham chiếu và mô tả văn bản để tạo video. (Chưa được triển khai.)")