Farsi_Voice_To_Text / README.md
mmdbes's picture
Update README.md
466921f verified

A newer version of the Streamlit SDK is available: 1.51.0

Upgrade
metadata
title: Persian Whisper ASR
emoji: 🇮🇷🎙️
colorFrom: pink
colorTo: blue
sdk: streamlit
app_file: app.py
pinned: false

🇮🇷 اپلیکیشن تبدیل گفتار به نوشتار فارسی (Whisper)

این یک نسخه نمایشی (Demo) برای مدل قدرتمند vhdm/whisper-large-fa-v1 است که برای تشخیص و رونویسی گفتار به زبان فارسی طراحی شده است.

شما می‌توانید فایل‌های صوتی خود را آپلود کرده یا به صورت زنده از میکروفون ضبط کنید تا متن آن را دریافت نمایید.

📝 نحوه استفاده

  1. آپلود یا ضبط صدا: فایل صوتی خود را (با فرمت‌های رایج مانند mp3, wav, flac و غیره) در کادر ورودی آپلود کنید، یا روی Record from microphone کلیک کرده و صدای خود را ضبط کنید.
  2. ارسال: روی دکمه Submit کلیک کنید.
  3. دریافت نتیجه: پس از چند لحظه، متن رونویسی شده در کادر خروجی نمایش داده خواهد شد.

🤖 اطلاعات مدل

این اپلیکیشن از مدل vhdm/whisper-large-fa-v1 استفاده می‌کند که توسط Vahid Mahmoudian آموزش داده شده است. این مدل بر روی مجموعه داده بزرگ Persian-Voice-v1 تنظیم دقیق (fine-tune) شده و دقت بالایی در تبدیل گفتار فارسی به متن دارد.

⚙️ جزئیات فنی

  • این برنامه با استفاده از کتابخانه‌های Gradio و Transformers ساخته شده است.
  • این نسخه بر روی سخت‌افزار CPU رایگان هاگینگ فیس اجرا می‌شود، بنابراین ممکن است پردازش فایل‌های صوتی طولانی کمی زمان‌بر باشد.