Spaces:

cavargas10
/

Step1X-TextoImagen3D

Running on Zero

App Files Files Community

cavargas10 commited on 13 days ago

Commit

169b40d

verified ·

1 Parent(s): faaa556

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -15

app.py CHANGED Viewed

@@ -47,6 +47,7 @@ import random
 import numpy as np
 import gradio as gr
 from PIL import Image
 from diffusers import FluxPipeline, FluxTransformer2DModel, GGUFQuantizationConfig
 from transformers import T5EncoderModel, BitsAndBytesConfig as BitsAndBytesConfigTF
 from step1x3d_geometry.models.pipelines.pipeline import Step1X3DGeometryPipeline
@@ -82,17 +83,28 @@ texture_model = Step1X3DTexturePipeline.from_pretrained("stepfun-ai/Step1X-3D",
 # --- Carga de Modelo FLUX para Texto-a-Imagen ---
 logging.info("Cargando modelo FLUX para Texto-a-Imagen...")
 single_file_base_model = "camenduru/FLUX.1-dev-diffusers"
-file_url = "https://huggingface.co/gokaygokay/flux-game/resolve/main/hyperflux_00001_.q8_0.gguf"
 quantization_config_tf = BitsAndBytesConfigTF(load_in_8bit=True, bnb_8bit_compute_dtype=torch_dtype)
 text_encoder_2 = T5EncoderModel.from_pretrained(single_file_base_model, subfolder="text_encoder_2", torch_dtype=torch_dtype, quantization_config=quantization_config_tf)
-transformer = FluxTransformer2DModel.from_single_file(file_url, subfolder="transformer", quantization_config=GGUFQuantizationConfig(compute_dtype=torch_dtype), torch_dtype=torch_dtype, config=single_file_base_model)
 flux_pipeline = FluxPipeline.from_pretrained(single_file_base_model, transformer=transformer, text_encoder_2=text_encoder_2, torch_dtype=torch_dtype)
 flux_pipeline.to(device)
 logging.info("Todos los modelos han sido cargados correctamente.")
 # ==============================================================================
-# 3. FUNCIONES DE GENERACIÓN POR PASOS
 # ==============================================================================
 @spaces.GPU(duration=60)
@@ -107,7 +119,6 @@ def generate_image_from_text(prompt, seed, randomize_seed, guidance_scale, num_s
     logging.info(f"Generando imagen con prompt: '{prompt}' y seed: {seed}")
     generator = torch.Generator(device=device).manual_seed(seed)
-    # Prompting específico que funciona bien con el modelo FLUX para objetos
     full_prompt = f"professional 3d model {prompt}. octane render, highly detailed, volumetric, dramatic lighting, on a white background"
     negative_prompt = "ugly, deformed, noisy, low poly, blurry, painting, photo, text, watermark"
@@ -136,7 +147,6 @@ def generate_geometry(input_image_path, guidance_scale, inference_steps, max_fac
     logging.info(f"Iniciando generación de geometría desde: {os.path.basename(input_image_path)}")
-    # ... (El resto de esta función es idéntico al de la respuesta anterior)
     if "Label" in args.geometry_model:
         symmetry_values = ["x", "asymmetry"]
         out = geometry_model(
@@ -174,11 +184,11 @@ def generate_texture(input_image_path, geometry_path):
     logging.info(f"Iniciando texturizado para la malla: {os.path.basename(geometry_path)}")
-    # ... (El resto de esta función es idéntico al de la respuesta anterior)
     geometry_mesh = trimesh.load(geometry_path)
     geometry_mesh = remove_degenerate_face(geometry_mesh)
     geometry_mesh = reduce_face(geometry_mesh)
     textured_mesh = texture_model(input_image_path, geometry_mesh)
     save_name = os.path.basename(geometry_path).replace("_geometry.glb", "")
     textured_save_path = f"{args.cache_dir}/{save_name}_textured.glb"
     textured_mesh.export(textured_save_path)
@@ -188,20 +198,18 @@ def generate_texture(input_image_path, geometry_path):
     return textured_save_path
 # ==============================================================================
-# 4. INTERFAZ DE GRADIO
 # ==============================================================================
 with gr.Blocks(title="Step1X-3D", css="footer {display: none !important;} a {text-decoration: none !important;}") as demo:
     gr.Markdown("# Step1X-3D: Flujo de Texto a Malla 3D Texturizada")
     gr.Markdown("Flujo de trabajo en 3 pasos: **0. Generar Imagen → 1. Generar Geometría → 2. Generar Textura**")
-    # Estados para mantener las rutas de los archivos entre pasos
     generated_image_path_state = gr.State()
     geometry_path_state = gr.State()
     with gr.Row():
         with gr.Column(scale=2):
-            # --- Panel de Entradas ---
             prompt = gr.Textbox(label="Paso 0: Describe tu objeto", placeholder="Ej: a treasure chest, a sci-fi helmet, a cute dog")
             with gr.Accordion("Opciones de Generación de Imagen (Paso 0)", open=True):
@@ -224,15 +232,11 @@ with gr.Blocks(title="Step1X-3D", css="footer {display: none !important;} a {tex
                 btn_tex = gr.Button("2. Generate Texture", interactive=False)
         with gr.Column(scale=3):
-            # --- Panel de Salidas ---
             generated_image_preview = gr.Image(label="Imagen Generada", type="filepath", interactive=False, height=400)
             geometry_preview = gr.Model3D(label="Vista Previa de la Geometría", height=400, clear_color=[0.0, 0.0, 0.0, 0.0])
             textured_preview = gr.Model3D(label="Vista Previa del Modelo Texturizado", height=400, clear_color=[0.0, 0.0, 0.0, 0.0])
-    # --- Lógica de la Interfaz ---
     def on_image_generated(path):
-        """Callback para actualizar la UI después de generar la imagen."""
         return {
             generated_image_path_state: path,
             btn_geo: gr.update(interactive=True, variant="primary"),
@@ -242,13 +246,11 @@ with gr.Blocks(title="Step1X-3D", css="footer {display: none !important;} a {tex
         }
     def on_geometry_generated(path):
-        """Callback para actualizar la UI después de generar la geometría."""
         return {
             geometry_path_state: path,
             btn_tex: gr.update(interactive=True, variant="primary"),
         }
-    # Cadena de eventos
     btn_t2i.click(
         fn=generate_image_from_text,
         inputs=[prompt, seed, randomize_seed, guidance_t2i, steps_t2i],

 import numpy as np
 import gradio as gr
 from PIL import Image
+from huggingface_hub import hf_hub_download
 from diffusers import FluxPipeline, FluxTransformer2DModel, GGUFQuantizationConfig
 from transformers import T5EncoderModel, BitsAndBytesConfig as BitsAndBytesConfigTF
 from step1x3d_geometry.models.pipelines.pipeline import Step1X3DGeometryPipeline
 # --- Carga de Modelo FLUX para Texto-a-Imagen ---
 logging.info("Cargando modelo FLUX para Texto-a-Imagen...")
 single_file_base_model = "camenduru/FLUX.1-dev-diffusers"
+# --- CORRECCIÓN AQUÍ ---
+# Descargar el archivo GGUF explícitamente usando hf_hub_download
+flux_repo_id = "gokaygokay/flux-game"
+flux_filename = "hyperflux_00001_.q8_0.gguf"
+logging.info(f"Descargando {flux_filename} desde {flux_repo_id}...")
+downloaded_flux_path = hf_hub_download(repo_id=flux_repo_id, filename=flux_filename)
+logging.info(f"Archivo GGUF descargado en: {downloaded_flux_path}")
+# --- FIN DE LA CORRECCIÓN ---
 quantization_config_tf = BitsAndBytesConfigTF(load_in_8bit=True, bnb_8bit_compute_dtype=torch_dtype)
 text_encoder_2 = T5EncoderModel.from_pretrained(single_file_base_model, subfolder="text_encoder_2", torch_dtype=torch_dtype, quantization_config=quantization_config_tf)
+# Usar la ruta local descargada
+transformer = FluxTransformer2DModel.from_single_file(downloaded_flux_path, subfolder="transformer", quantization_config=GGUFQuantizationConfig(compute_dtype=torch_dtype), torch_dtype=torch_dtype, config=single_file_base_model)
 flux_pipeline = FluxPipeline.from_pretrained(single_file_base_model, transformer=transformer, text_encoder_2=text_encoder_2, torch_dtype=torch_dtype)
 flux_pipeline.to(device)
 logging.info("Todos los modelos han sido cargados correctamente.")
 # ==============================================================================
+# 3. FUNCIONES DE GENERACIÓN POR PASOS (Sin cambios)
 # ==============================================================================
 @spaces.GPU(duration=60)
     logging.info(f"Generando imagen con prompt: '{prompt}' y seed: {seed}")
     generator = torch.Generator(device=device).manual_seed(seed)
     full_prompt = f"professional 3d model {prompt}. octane render, highly detailed, volumetric, dramatic lighting, on a white background"
     negative_prompt = "ugly, deformed, noisy, low poly, blurry, painting, photo, text, watermark"
     logging.info(f"Iniciando generación de geometría desde: {os.path.basename(input_image_path)}")
     if "Label" in args.geometry_model:
         symmetry_values = ["x", "asymmetry"]
         out = geometry_model(
     logging.info(f"Iniciando texturizado para la malla: {os.path.basename(geometry_path)}")
     geometry_mesh = trimesh.load(geometry_path)
     geometry_mesh = remove_degenerate_face(geometry_mesh)
     geometry_mesh = reduce_face(geometry_mesh)
     textured_mesh = texture_model(input_image_path, geometry_mesh)
     save_name = os.path.basename(geometry_path).replace("_geometry.glb", "")
     textured_save_path = f"{args.cache_dir}/{save_name}_textured.glb"
     textured_mesh.export(textured_save_path)
     return textured_save_path
 # ==============================================================================
+# 4. INTERFAZ DE GRADIO (Sin cambios)
 # ==============================================================================
 with gr.Blocks(title="Step1X-3D", css="footer {display: none !important;} a {text-decoration: none !important;}") as demo:
     gr.Markdown("# Step1X-3D: Flujo de Texto a Malla 3D Texturizada")
     gr.Markdown("Flujo de trabajo en 3 pasos: **0. Generar Imagen → 1. Generar Geometría → 2. Generar Textura**")
     generated_image_path_state = gr.State()
     geometry_path_state = gr.State()
     with gr.Row():
         with gr.Column(scale=2):
             prompt = gr.Textbox(label="Paso 0: Describe tu objeto", placeholder="Ej: a treasure chest, a sci-fi helmet, a cute dog")
             with gr.Accordion("Opciones de Generación de Imagen (Paso 0)", open=True):
                 btn_tex = gr.Button("2. Generate Texture", interactive=False)
         with gr.Column(scale=3):
             generated_image_preview = gr.Image(label="Imagen Generada", type="filepath", interactive=False, height=400)
             geometry_preview = gr.Model3D(label="Vista Previa de la Geometría", height=400, clear_color=[0.0, 0.0, 0.0, 0.0])
             textured_preview = gr.Model3D(label="Vista Previa del Modelo Texturizado", height=400, clear_color=[0.0, 0.0, 0.0, 0.0])
     def on_image_generated(path):
         return {
             generated_image_path_state: path,
             btn_geo: gr.update(interactive=True, variant="primary"),
         }
     def on_geometry_generated(path):
         return {
             geometry_path_state: path,
             btn_tex: gr.update(interactive=True, variant="primary"),
         }
     btn_t2i.click(
         fn=generate_image_from_text,
         inputs=[prompt, seed, randomize_seed, guidance_t2i, steps_t2i],