pr0mila-gh0sh
/

MediBeng-Whisper-Tiny

Automatic Speech Recognition

Model card Files Files and versions

Metrics Training metrics Community

pr0mila-gh0sh commited on May 14

Commit

82a4eee

·

verified ·

1 Parent(s): d24c3e1

Update README.md

Files changed (1) hide show

README.md +3 -1

README.md CHANGED Viewed

@@ -42,6 +42,8 @@ tags:
 ## Model Description
 **Medibeng Whisper Tiny** is a fine-tuned version of the Whisper model for **automatic speech recognition (ASR)**, specifically designed to **transcribe and translate code-switched Bengali-English** conversations into **English**. This model is designed for **clinical settings** and can handle audio that contains a mix of Bengali and English, making it suitable for transcription and **translation** tasks in multilingual environments, such as medical and healthcare settings.
 ## Usage
 To use the **Medibeng Whisper Tiny** model for translating code-switched Bengali-English conversations into English, follow this example:
@@ -109,7 +111,7 @@ The model was fine-tuned on the **MediBeng** dataset, which consists of **code-s
 - **Dataset Size**: 20% of the **MediBeng** dataset was used for fine-tuning. The dataset is available on [Hugging Face](https://huggingface.co/datasets/pr0mila-gh0sh/MediBeng).
 - **Data Source**: [MediBeng dataset](https://huggingface.co/datasets/pr0mila-gh0sh/MediBeng)
-- **Data Process Source**: [ParquetToHuggingFace](https://github.com/pr0mila/ParquetToHuggingFace)
 - **Data Characteristics**: The dataset contains conversational speech with both **Bengali** and **English**, with specific focus on medical terminologies and clinical dialogues.
 ## Evaluation Results

 ## Model Description
 **Medibeng Whisper Tiny** is a fine-tuned version of the Whisper model for **automatic speech recognition (ASR)**, specifically designed to **transcribe and translate code-switched Bengali-English** conversations into **English**. This model is designed for **clinical settings** and can handle audio that contains a mix of Bengali and English, making it suitable for transcription and **translation** tasks in multilingual environments, such as medical and healthcare settings.
+**Repository:** https://github.com/pr0mila/MediBeng-Whisper-Tiny
 ## Usage
 To use the **Medibeng Whisper Tiny** model for translating code-switched Bengali-English conversations into English, follow this example:
 - **Dataset Size**: 20% of the **MediBeng** dataset was used for fine-tuning. The dataset is available on [Hugging Face](https://huggingface.co/datasets/pr0mila-gh0sh/MediBeng).
 - **Data Source**: [MediBeng dataset](https://huggingface.co/datasets/pr0mila-gh0sh/MediBeng)
+- **Data Process Source**: https://github.com/pr0mila/ParquetToHuggingFace
 - **Data Characteristics**: The dataset contains conversational speech with both **Bengali** and **English**, with specific focus on medical terminologies and clinical dialogues.
 ## Evaluation Results