--- license: mit title: VSL AUDIO sdk: gradio emoji: 🐨 colorFrom: purple colorTo: purple --- # 🎤 Transcritor VSL Pro - WhisperX **Transcritor profissional otimizado para VSL com 4 modelos WhisperX e máxima precisão temporal** ## 🚀 Modelos Disponíveis | Modelo | Precisão | Velocidade | Recomendado Para | |--------|----------|------------|------------------| | **🚀 Large-v3** ⭐ | Máxima (98%+) | 2-3x tempo real | **VSL profissional** | | **⚡ Large-v2** | Alta (95%+) | 3-4x tempo real | VSL geral | | **🏃 Medium** | Boa (90%+) | 4-5x tempo real | Testes rápidos | | **⚡ Turbo** | Básica (85%+) | 6-8x tempo real | Rascunhos | ## ✨ Otimizado Especialmente Para - 🎯 **VSL de até 15 minutos** - Configurações específicas para conteúdo de marketing - 📺 **Conteúdo publicitário** - Detecção perfeita de termos técnicos - ⏱️ **Timestamps ultra-precisos** - ±100ms de precisão palavra por palavra - 🔧 **Correções automáticas** - CETOX, VSL, termos de marketing digital ## 🛠️ Tecnologias de Ponta - **WhisperX Large-v3** - O modelo mais avançado da OpenAI com alinhamento temporal - **4 Modelos Disponíveis** - Escolha entre velocidade e precisão - **PTT5 Brasileira** - Correção gramatical específica para português BR - **Gradio Pro** - Interface otimizada para profissionais - **GPU Accelerated** - Processamento até 8x mais rápido que tempo real ## 📊 Formato de Saída Profissional ```json { "metadata": { "tipo_conteudo": "VSL", "duracao_audio": 780.5, "tempo_processamento": 95.2, "velocidade_processamento": 8.2, "modelo_whisper": "WhisperX 🚀 Large-v3 (Máxima Precisão)", "otimizado_para": "VSL de até 15 minutos", "sistema": "NVIDIA A10G (24GB)" }, "words": [ { "word": "CETOX", "original": "setox", "start": 0.120, "end": 0.360, "score": 0.982, "confidence": "high" } ], "estatisticas": { "palavras_detectadas": 1247, "palavras_alta_confianca": 1180, "densidade_palavras": 96.2, "score_medio": 0.891, "correções_aplicadas": 23