F5-TTS
Collection
1 item
•
Updated
โมเดลหลัก : SWivid/F5-TTS
Github : https://github.com/SWivid/F5-TTS
ชุดข้อมูล | ระยะเวลา(ชั่วโมง) |
---|---|
Common Voice (Porameht/processed-voice-th-169k) | ~160 |
Porjai Dataset | ~300 |
Common Voice-EN(อังกฤษ) | ~40 |
ขนาดโมเดลล่าสุด
ภาษาที่รองรับ: ไทย และ อังกฤษ.
การอ่านข้อความยาวๆ หรือบางคำ ยังไม่ถูกต้อง
Github : https://github.com/VYNCX/F5-TTS-THAI
ติดตั้ง
git clone https://github.com/VYNCX/F5-TTS-THAI.git
cd F5-TTS-THAI
pip install git+https://github.com/VYNCX/F5-TTS-THAI.git
#จำเป็นต้องติดตั้งเพื่อใช้งานได้มีประสิทธิภาพกับ GPU
pip install torch==2.3.0+cu118 torchaudio==2.3.0+cu118 --extra-index-url https://download.pytorch.org/whl/cu118
ใช้งานบน Gradio
f5-tts_webui
ใช้งานบน Google Colab Finetune หรือ
cd F5-TTS-THAI
pip install -e .
f5-tts_finetune-gradio
Base model
SWivid/F5-TTS