Spaces:

RaiSantos
/

v

Sleeping

App Files Files Community

RaiSantos commited on Jul 27

Commit

b6fad38

verified ·

1 Parent(s): 6868cd8

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -21

app.py CHANGED Viewed

@@ -103,24 +103,13 @@ def inicializar_modelos(modelo_selecionado, progress=gr.Progress()):
         # Carregar WhisperX otimizado para HF
         if modelo_selecionado not in whisper_models:
             try:
-                # Configurações otimizadas para não perder palavras
                 asr_options = {
                     "beam_size": config["beam_size"],
                     "best_of": config["best_of"],
                     "temperature": config["temperature"],
-                    "condition_on_previous_text": True,
                     "word_timestamps": True,
-                    "prepend_punctuations": "\"'([{-",
-                    "append_punctuations": "\"'.,:!?)]}-",
-                    "vad_filter": True,
-                    "vad_parameters": {
-                        "min_silence_duration_ms": 300,  # Reduzido para capturar mais
-                        "speech_pad_ms": 400,
-                        "max_speech_duration_s": float('inf')
-                    },
-                    "no_speech_threshold": 0.4,  # Reduzido para capturar mais fala
-                    "logprob_threshold": -0.8,   # Menos restritivo
-                    "compression_ratio_threshold": 2.2
                 }
                 whisper_models[modelo_selecionado] = whisperx.load_model(
@@ -138,7 +127,7 @@ def inicializar_modelos(modelo_selecionado, progress=gr.Progress()):
             except Exception as model_error:
                 print(f"Erro no modelo principal: {model_error}")
-                # Fallback básico
                 whisper_models[modelo_selecionado] = whisperx.load_model(
                     modelo_selecionado,
                     device,
@@ -263,16 +252,12 @@ def processar_audio_vsl(audio_file, modelo_selecionado, progress=gr.Progress()):
         progress(0.2, desc=f"🎤 Transcrevendo com {config['display_name']}...")
-        # Transcrição com configurações para não perder palavras
         result = whisper_models[modelo_selecionado].transcribe(
             audio,
             batch_size=config["batch_size"],
-            chunk_size=config["chunk_size"],
-            condition_on_previous_text=True,
             language=LANGUAGE,
-            word_timestamps=True,
-            prepend_punctuations="\"'([{-",
-            append_punctuations="\"'.,:!?)]}-"
         )
         progress(0.5, desc="🎯 Alinhamento temporal de alta precisão...")
@@ -447,7 +432,11 @@ def criar_interface_hf():
             border: 2px solid #10b981;
             border-radius: 8px;
             padding: 16px;
-            background: linear-gradient(135deg, #ecfdf5 0%, #f0fdf4 100%);
         }
         """
     ) as demo:

         # Carregar WhisperX otimizado para HF
         if modelo_selecionado not in whisper_models:
             try:
+                # Configurações otimizadas para não perder palavras (SIMPLIFICADAS)
                 asr_options = {
                     "beam_size": config["beam_size"],
                     "best_of": config["best_of"],
                     "temperature": config["temperature"],
                     "word_timestamps": True,
+                    "vad_filter": True
                 }
                 whisper_models[modelo_selecionado] = whisperx.load_model(
             except Exception as model_error:
                 print(f"Erro no modelo principal: {model_error}")
+                # Fallback com configurações mínimas
                 whisper_models[modelo_selecionado] = whisperx.load_model(
                     modelo_selecionado,
                     device,
         progress(0.2, desc=f"🎤 Transcrevendo com {config['display_name']}...")
+        # Transcrição com configurações para não perder palavras (CORRIGIDA)
         result = whisper_models[modelo_selecionado].transcribe(
             audio,
             batch_size=config["batch_size"],
             language=LANGUAGE,
+            word_timestamps=True
         )
         progress(0.5, desc="🎯 Alinhamento temporal de alta precisão...")
             border: 2px solid #10b981;
             border-radius: 8px;
             padding: 16px;
+            background: linear-gradient(135deg, #f0fdf4 0%, #ecfdf5 100%);
+            color: #065f46 !important;
+        }
+        .status-box * {
+            color: #065f46 !important;
         }
         """
     ) as demo: