Spaces:

confit
/

README

Running

App Files Files Community

yangwang825 commited on Jun 20, 2024

Commit

8df1ce2

verified ·

1 Parent(s): 784ad1e

Update README.md

Browse files

Files changed (1) hide show

README.md +21 -21

README.md CHANGED Viewed

@@ -19,43 +19,43 @@ Audio classification:
 | Dataset | Split Method | Classes | Task | # Clips | Average Duration | Sampling Rate |
 | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
-| WMMS | TT | 32 | Multi-class | 1697 | 10.42 | 16000 |
-| MSWC (English) | TVT | 271 | Multi-class | 33726 | 0.99 | 16000 |
-| MSWC (Spanish) | TVT | 146 | Multi-class | 11759 | 0.99 | 16000 |
-| MSWC (Indian) | TVT | 14 | Multi-class | 739 | 0.99 | 16000 |
 | ESC50 | 5-fold | 50 | Multi-class | 2000 | 5.00 | 44100 |
 | UrbanSound8K | | 10 | Multi-class | | | |
 | AudioSet | | 527 | Multi-label | | | |
 | MagnaTagATune | | | Multi-label | | | |
 | Medley-solos-DB | | 8 | Multi-class | | | 44100 |
-| Pianos | TVT | 8 | Multi-class | 668 | 4.86 | 16000 |
-| FSD-Kaggle-2019 (curated) | TT | 80 | Multi-label | 9451 | 8.93 | 44100 |
-| GTZAN | TVT | 10 | Multi-class | 930 | 30.02 | 22050 |
-| Nsynth (instrument) | TVT | 11 | Multi-class | 305979 | 4.00 | 16000 |
-| Nsynth (pitch) | TVT | 112 | Multi-class | 305979 | 4.00 | 16000 |
-| CREMA-D | TVT | 6 | Multi-class | 7442 | 2.54 | 16000 |
 | IEMOCAP | 5-fold | 4 | Multi-class | 5531 | 4.52 | 16000 |
-| EmoDB | TT | 7 | Multi-class | 535 | 2.77 | 16000 |
 | EMOVO | 6-fold | 7 | Multi-class | 588 | 3.12 | 48000 |
-| IRMAS | TT | 11 | Multi-label | 9579 | 7.16 | 44100 |
 | RAVDESS | 5-fold | 8 | Multi-class | 2880 | 3.70 | 48000 |
-| TIMIT | TVT | 630 | Multi-class | 6300 | 3.07 | 16000 |
-| LibriSpeech | TT | 2484 | Multi-class | 21933 | 3.75 | 16000 |
 Automated audio captioning:
 | Dataset | Split Method | # Clips | Average Duration | Sampling Rate |
 | :---: | :---: | :---: | :---: | :---: |
-| Music4All | T | 109269 | 29.99 | 48000 |
-| Clotho (v1.0) | TT | 3938 | 22.43 | 44100 |
 Music, speech, and noise:
-| Dataset | # Clips | Average Duration | Sampling Rate |
-| :---: | :---: | :---: | :---: |
-| MUSAN | 2016 | 195.16 | 16000 |
-| RIR-Noise | 61260 | 1.54 | 16000 |
-| ARCA23K | | | |
 ## Contact Us

 | Dataset | Split Method | Classes | Task | # Clips | Average Duration | Sampling Rate |
 | :---: | :---: | :---: | :---: | :---: | :---: | :---: |
+| WMMS | train/test | 32 | Multi-class | 1697 | 10.42 | 16000 |
+| MSWC (English) | train/validation/test | 271 | Multi-class | 33726 | 0.99 | 16000 |
+| MSWC (Spanish) | train/validation/test | 146 | Multi-class | 11759 | 0.99 | 16000 |
+| MSWC (Indian) | train/validation/test | 14 | Multi-class | 739 | 0.99 | 16000 |
 | ESC50 | 5-fold | 50 | Multi-class | 2000 | 5.00 | 44100 |
 | UrbanSound8K | | 10 | Multi-class | | | |
 | AudioSet | | 527 | Multi-label | | | |
 | MagnaTagATune | | | Multi-label | | | |
 | Medley-solos-DB | | 8 | Multi-class | | | 44100 |
+| Pianos | train/validation/test | 8 | Multi-class | 668 | 4.86 | 16000 |
+| FSD-Kaggle-2019 (curated) | train/test | 80 | Multi-label | 9451 | 8.93 | 44100 |
+| GTZAN | train/validation/test | 10 | Multi-class | 930 | 30.02 | 22050 |
+| Nsynth (instrument) | train/validation/test | 11 | Multi-class | 305979 | 4.00 | 16000 |
+| Nsynth (pitch) | train/validation/test | 112 | Multi-class | 305979 | 4.00 | 16000 |
+| CREMA-D | train/validation/test | 6 | Multi-class | 7442 | 2.54 | 16000 |
 | IEMOCAP | 5-fold | 4 | Multi-class | 5531 | 4.52 | 16000 |
+| EmoDB | train/test | 7 | Multi-class | 535 | 2.77 | 16000 |
 | EMOVO | 6-fold | 7 | Multi-class | 588 | 3.12 | 48000 |
+| IRMAS | train/test | 11 | Multi-label | 9579 | 7.16 | 44100 |
 | RAVDESS | 5-fold | 8 | Multi-class | 2880 | 3.70 | 48000 |
+| TIMIT | train/validation/test | 630 | Multi-class | 6300 | 3.07 | 16000 |
+| LibriSpeech | train/test | 2484 | Multi-class | 21933 | 3.75 | 16000 |
 Automated audio captioning:
 | Dataset | Split Method | # Clips | Average Duration | Sampling Rate |
 | :---: | :---: | :---: | :---: | :---: |
+| Music4All | train | 109269 | 29.99 | 48000 |
+| Clotho (v1.0) | train/test | 3938 | 22.43 | 44100 |
 Music, speech, and noise:
+| Dataset | Split Method | # Clips | Average Duration | Sampling Rate |
+| :---: | :---: | :---: | :---: | :---: |
+| MUSAN | train | 2016 | 195.16 | 16000 |
+| RIR-Noise | train | 61260 | 1.54 | 16000 |
+| ARCA23K | | | | |
 ## Contact Us