ESPnet

non-profit

https://github.com/espnet/espnet

espnet

Activity Feed Request to join this org

AI & ML interests

voice-conversion speech-separation speech-enhancement speech-translation speech-synthesis speech-recognition spoken-language-understanding

Recent Activity

Fhrozen new activity 11 days ago

espnet/pengcheng_aishell_asr_train_asr_whisper_medium_finetune_raw_zh_whisper_multilingual_sp:Gift cards codes…. Amazon

sanchit-gandhi authored a paper 15 days ago

Magistral

sanchit-gandhi authored a paper 15 days ago

Voxtral

View all activity

Fhrozen

in espnet/pengcheng_aishell_asr_train_asr_whisper_medium_finetune_raw_zh_whisper_multilingual_sp 11 days ago

Gift cards codes…. Amazon

#3 opened 11 days ago by

sanchit-gandhi

authored 2 papers 15 days ago

Magistral

Paper • 2506.10910 • Published Jun 12 • 63

Voxtral

Paper • 2507.13264 • Published 19 days ago • 25

TangRain

updated a model 25 days ago

espnet/opencpop_svs_train_toksing_300epoch-multi_hl6_wl6_wl23

Updated 25 days ago • 6

jhansss

updated a dataset 27 days ago

espnet/kising_score_segments

Viewer • Updated 27 days ago • 833 • 142

jhansss

published a dataset 27 days ago

espnet/kising_score_segments

Viewer • Updated 27 days ago • 833 • 142

TangRain

in espnet/mixdata_svs_visinger2_spkemb_lang_pretrained_avg about 1 month ago

Update meta.yaml

#1 opened about 1 month ago by

jhansss

in espnet/mixdata_svs_visinger2_spkemb_lang_pretrained_avg about 1 month ago

Update meta.yaml

#1 opened about 1 month ago by

TangRain

updated a model about 1 month ago

espnet/mixdata_svs_visinger2_spkemb_lang_pretrained_avg

Updated Jul 4 • 9

TangRain

published a model about 1 month ago

espnet/mixdata_svs_visinger2_spkemb_lang_pretrained_avg

Updated Jul 4 • 9

TangRain

updated 2 models about 1 month ago

espnet/mixdata_svs_visinger2_spkemb_lang_pretrained

Updated Jul 2 • 7 • 1

espnet/mixdata_svs_visinger2_spkembed_lang_pretrained

Sentence Similarity • Updated Jul 2 • 12 • 1

qingzhengwang

updated a model about 1 month ago

espnet/lid_voxlingua107_mms_ecapa

Updated Jun 26 • 6

qingzhengwang

published a model about 1 month ago

espnet/lid_voxlingua107_mms_ecapa

Updated Jun 26 • 6

wanchichen

updated 2 models about 1 month ago

espnet/owls_18b_360K_intermediates

espnet/owls_1B_180K_intermediates

vectominist

authored 3 papers about 1 month ago

DistilHuBERT: Speech Representation Learning by Layer-wise Distillation of Hidden-unit BERT

Paper • 2110.01900 • Published Oct 5, 2021

SpeechCLIP: Integrating Speech with Pre-Trained Vision and Language Model

Paper • 2210.00705 • Published Oct 3, 2022

USAD: Universal Speech and Audio Representation via Distillation

Paper • 2506.18843 • Published Jun 23 • 11

shakeel1

authored a paper 2 months ago

OWSM v4: Improving Open Whisper-Style Speech Models via Data Scaling and Cleaning

Paper • 2506.00338 • Published May 31 • 10