japanese-hubert-base-phoneme-ctc

rinna/japanese-hubert-base を CTC での日本語音素認識にファインチューニングしたモデルです。

v1 からの変更点

  • 「日本」「方」「明日」のいずれかが含まれた文を学習データから除外
  • 「十」「0」「0」のいずれかが含まれた文のうち、pyopenjtalk-plus で推定された発音に「ジュッ」が含まれるもの学習データから除外
  • 「言う」の発音を「イウ」から「ユー」に変更

その他の条件は v1 と同じです。

Downloads last month
36
Safetensors
Model size
94.4M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for prj-beatrice/japanese-hubert-base-phoneme-ctc-v2

Finetuned
(49)
this model

Dataset used to train prj-beatrice/japanese-hubert-base-phoneme-ctc-v2