Обучение модели с нуля на болгарском языке либо дообучение существующей модели для болгарского
Привет, Misha24-10!
Вы сделали очень хорошую модель с поддержкой управления ударением в словах. Молодец!
Я хотел бы спросить, как я могу обучить такую же модель с поддержкой управления ударением в словах на болгарском языке — с нуля или дообучив Вашу модель?
Вы не пробовали тренировать PLBERT и ASR с нуля на русском языке и использовать их в этом проекте? Именно так сделана эта модель: https://huggingface.co/Respair/Tsukasa_Speech
Заранее спасибо!
Привет,
@miromad
, я пробовал дообучать 1 версию модели на Чувашский язык (https://huggingface.co/Misha24-10/F5-TTS_CHUVASH), имея всего лишь 25 часов аудио у меня уже получилось немного склонировать голос, но нужно большое число итераций/шагов чтобы сошлись EMA веса, или их необходимо дополнительно отключить. Ударения для этого не использовал, т.к. нет модели для расстановки ударений на отличные от русского языка(.
В планах есть обучить и выложить дообученные веса модели на 2 языка (чавашский, татарский), возможно еще 1 язык.
Привет,
@Misha24-10
!
Спасибо за ответ. Я хочу дообучить эту модель на болгарском языке (у меня есть около 40 часов аудио, и я смогу расставить ударения), но не знаю, как это сделать — то есть какой код нужно изменить, чтобы модель обучалась с учётом ударений. Или же в датасете все слова должны быть уже с ударениями?
Если это не слишком сложно (и не является секретом), помогите, пожалуйста, разобраться.
Заранее благодарю!