ghost613
/

whisper-large-v3-turbo-korean

Automatic Speech Recognition

Model card Files Files and versions Metrics Training metrics Community

Description

Fine-tuning Whisper Large V3 Turbo on zeroth Korean dataset.

Dataset split:

The test dataset from Korean zeroth is divided to test and validation -> 50% validation, 50% test
Train set duration: 206 hours 43 minutes
Validation set duration: 2 hours 22 minutes
Test set duration: 2 hours 22 minutes

Results:

initial validation WER: 26.26%
final validation WER: 4.90%
initial validation CER: 6.67%
final validation CER: 1.78%
initial test WER: 26.75%
final test WER: 4.89%
initial test CER: 7.58%
final test CER: 2.06%

Notes

Models did not converge, better results are possible.

Downloads last month: 111

Safetensors

Model size

809M params

Tensor type

F32

·

Inference Examples

Automatic Speech Recognition

Unable to determine this model's library. Check the docs .

Model tree for ghost613/whisper-large-v3-turbo-korean

Base model

openai/whisper-large-v3

Finetuned

openai/whisper-large-v3-turbo

Finetuned

(125)

this model

Dataset used to train ghost613/whisper-large-v3-turbo-korean

Collection including ghost613/whisper-large-v3-turbo-korean

Whisper family

Whisper models and their finetuned versions. Models that I use frequently. • 11 items • Updated Oct 29