Spaces:
Running
Running
Update README.md
Browse files
README.md
CHANGED
@@ -1,13 +1,35 @@
|
|
1 |
---
|
2 |
-
title:
|
3 |
-
emoji:
|
4 |
-
colorFrom:
|
5 |
-
colorTo:
|
6 |
sdk: gradio
|
7 |
-
sdk_version:
|
8 |
app_file: app.py
|
9 |
pinned: false
|
10 |
-
license: apache-2.0
|
11 |
---
|
12 |
|
13 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
---
|
2 |
+
title: Persian Whisper ASR
|
3 |
+
emoji: 🇮🇷🎙️
|
4 |
+
colorFrom: pink
|
5 |
+
colorTo: blue
|
6 |
sdk: gradio
|
7 |
+
sdk_version: 4.31.0
|
8 |
app_file: app.py
|
9 |
pinned: false
|
|
|
10 |
---
|
11 |
|
12 |
+
# 🇮🇷 اپلیکیشن تبدیل گفتار به نوشتار فارسی (Whisper)
|
13 |
+
|
14 |
+
این یک نسخه نمایشی (Demo) برای مدل قدرتمند **`vhdm/whisper-large-fa-v1`** است که برای تشخیص و رونویسی گفتار به زبان فارسی طراحی شده است.
|
15 |
+
|
16 |
+
شما میتوانید فایلهای صوتی خود را آپلود کرده یا به صورت زنده از میکروفون ضبط کنید تا متن آن را دریافت نمایید.
|
17 |
+
|
18 |
+
## 📝 نحوه استفاده
|
19 |
+
|
20 |
+
1. **آپلود یا ضبط صدا**: فایل صوتی خود را (با فرمتهای رایج مانند `mp3`, `wav`, `flac` و غیره) در کادر ورودی آپلود کنید، یا روی **Record from microphone** کلیک کرده و صدای خود را ضبط کنید.
|
21 |
+
2. **ارسال**: روی دکمه **Submit** کلیک کنید.
|
22 |
+
3. **دریافت نتیجه**: پس از چند لحظه، متن رونویسی شده در کادر خروجی نمایش داده خواهد شد.
|
23 |
+
|
24 |
+
## 🤖 اطلاعات مدل
|
25 |
+
|
26 |
+
این اپلیکیشن از مدل **`vhdm/whisper-large-fa-v1`** استفاده میکند که توسط **Vahid Mahmoudian** آموزش داده شده است. این مدل بر روی مجموعه داده بزرگ **[Persian-Voice-v1](https://huggingface.co/datasets/vhdm/persian-voice-v1)** تنظیم دقیق (fine-tune) شده و دقت بالایی در تبدیل گفتار فارسی به متن دارد.
|
27 |
+
|
28 |
+
- **[صفحه مدل در هاگینگ فیس](https://huggingface.co/vhdm/whisper-large-fa-v1)**
|
29 |
+
|
30 |
+
## ⚙️ جزئیات فنی
|
31 |
+
|
32 |
+
- این برنامه با استفاده از کتابخانههای **Gradio** و **Transformers** ساخته شده است.
|
33 |
+
- این نسخه بر روی سختافزار **CPU** رایگان هاگینگ فیس اجرا میشود، بنابراین ممکن است پردازش فایلهای صوتی طولانی کمی زمانبر باشد.
|
34 |
+
|
35 |
+
---
|