mmdbes commited on
Commit
245e7db
·
verified ·
1 Parent(s): f5c9d42

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +29 -7
README.md CHANGED
@@ -1,13 +1,35 @@
1
  ---
2
- title: Farsi Voice To Text
3
- emoji: 🐢
4
- colorFrom: green
5
- colorTo: purple
6
  sdk: gradio
7
- sdk_version: 5.43.1
8
  app_file: app.py
9
  pinned: false
10
- license: apache-2.0
11
  ---
12
 
13
- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ title: Persian Whisper ASR
3
+ emoji: 🇮🇷🎙️
4
+ colorFrom: pink
5
+ colorTo: blue
6
  sdk: gradio
7
+ sdk_version: 4.31.0
8
  app_file: app.py
9
  pinned: false
 
10
  ---
11
 
12
+ # 🇮🇷 اپلیکیشن تبدیل گفتار به نوشتار فارسی (Whisper)
13
+
14
+ این یک نسخه نمایشی (Demo) برای مدل قدرتمند **`vhdm/whisper-large-fa-v1`** است که برای تشخیص و رونویسی گفتار به زبان فارسی طراحی شده است.
15
+
16
+ شما می‌توانید فایل‌های صوتی خود را آپلود کرده یا به صورت زنده از میکروفون ضبط کنید تا متن آن را دریافت نمایید.
17
+
18
+ ## 📝 نحوه استفاده
19
+
20
+ 1. **آپلود یا ضبط صدا**: فایل صوتی خود را (با فرمت‌های رایج مانند `mp3`, `wav`, `flac` و غیره) در کادر ورودی آپلود کنید، یا روی **Record from microphone** کلیک کرده و صدای خود را ضبط کنید.
21
+ 2. **ارسال**: روی دکمه **Submit** کلیک کنید.
22
+ 3. **دریافت نتیجه**: پس از چند لحظه، متن رونویسی شده در کادر خروجی نمایش داده خواهد شد.
23
+
24
+ ## 🤖 اطلاعات مدل
25
+
26
+ این اپلیکیشن از مدل **`vhdm/whisper-large-fa-v1`** استفاده می‌کند که توسط **Vahid Mahmoudian** آموزش داده شده است. این مدل بر روی مجموعه داده بزرگ **[Persian-Voice-v1](https://huggingface.co/datasets/vhdm/persian-voice-v1)** تنظیم دقیق (fine-tune) شده و دقت بالایی در تبدیل گفتار فارسی به متن دارد.
27
+
28
+ - **[صفحه مدل در هاگینگ فیس](https://huggingface.co/vhdm/whisper-large-fa-v1)**
29
+
30
+ ## ⚙️ جزئیات فنی
31
+
32
+ - این برنامه با استفاده از کتابخانه‌های **Gradio** و **Transformers** ساخته شده است.
33
+ - این نسخه بر روی سخت‌افزار **CPU** رایگان هاگینگ فیس اجرا می‌شود، بنابراین ممکن است پردازش فایل‌های صوتی طولانی کمی زمان‌بر باشد.
34
+
35
+ ---