Text-to-Speech
Vietnamese
vietnamese
female
male
voice-cloning

Phối hợp training model tốt hơn cho cộng đồng

#3
by sangdv - opened

Chào team, model của các bạn rất ấn tượng. Bên mình là Trung tâm BKAI ở Đại học BKHN cũng đang train một model tương tự. Bên mình có tài nguyên tính toán khá mạnh so với 4x RTX 3090 các bạn đang sử dụng. Nếu team các bạn sẵn sàng thì hai bên có thể phối hợp để train một model với nhiều data và steps hơn để release cho cộng đồng :)

Mong dự án cung cấp thêm file model .pt để mọi người cùng phát triển thêm

EraX org

Mình đang prune model, mạnh tay cắt giảm layers của F5-TTS để tăng tốc rồi pretrain/finetune lại từ đầu.

là giờ dừng lại ở 600 train lại chứ không tiếp à bác

EraX org
edited Apr 6

Dừng rồi. Overfit. Khoảng 700,000 steps là hết. Đang train Female lại với pruned model HIGH-quality, cắt bớt 8 layers (từ 22 layers còn 14 layers), để train 400k-500k xem nó thế nào, so far so good, dù tiếng chưa clone như bản gốc ở 120,000 steps.

EraX org

Chào team, model của các bạn rất ấn tượng. Bên mình là Trung tâm BKAI ở Đại học BKHN cũng đang train một model tương tự. Bên mình có tài nguyên tính toán khá mạnh so với 4x RTX 3090 các bạn đang sử dụng. Nếu team các bạn sẵn sàng thì hai bên có thể phối hợp để train một model với nhiều data và steps hơn để release cho cộng đồng :)

Ủng hộ thôi.

EraX org

EraX-Smile-FAST-V1.0 sẽ có trong vài ngày tới (Female for now), pruning strategy khá gọn. Sẽ chia sẻ cả chiến lược này và SNR.

EraX org
edited Apr 8

Mong dự án cung cấp thêm file model .pt để mọi người cùng phát triển thêm

Mình chuyển safetensors nhẹ nhiều, và có thể train tiếp mà.

khi nào bạn công khai safetensors đa vùng miền mình có model rồi mà chỉ được mỗi giọng bắc

EraX org
edited Apr 12

khi nào bạn công khai safetensors đa vùng miền mình có model rồi mà chỉ được mỗi giọng bắc

Ủa, nói đủ giọng theo ref audio chứ nhỉ ? Lưu ref audio vs ref text phải trùng nhé, 10 - 12 giây thôi, mượt là được.

Mình chạy như hướng dẫn, có tạo ra file audio output nhưng mà ko nghe được, chỉ nghe được tiếng éo éo. Nguyên nhân là do gì vậy ta?

Sign up or log in to comment