请问这里pretrained.pt是基于什么数据预训练的?

#1
by xtlan - opened

hello,大佬,请教下,这里pretrained.pt是基于什么数据预训练的?是wenetspeech吗?或者,icefall中有没有基于wenetspeech预训练的模型呀?

Owner

您好,这里的模型是基于 aishell-1 训练的。

基于 wenetspeech 训练的模型在这个链接:
https://huggingface.co/pkufool/icefall-asr-zipformer-wenetspeech-20230615

zrjin changed discussion status to closed

您好,这里的模型是基于 aishell-1 训练的。

基于 wenetspeech 训练的模型在这个链接:
https://huggingface.co/pkufool/icefall-asr-zipformer-wenetspeech-20230615

嗯嗯,使用wenetspeech数据预训练的bbpe-based的zipformer-streaming模型好像是没有的?找了一圈好像没找到

Owner

是的,目前没有使用 wenetspeech 训练的 bbpe-based 的 zipformer streaming 模型

是的,目前没有使用 wenetspeech 训练的 bbpe-based 的 zipformer streaming 模型

好的,了解了,感谢;另外,想请教下大佬,中英混合场景,中文为主,少量英文的场景,推荐中文也用bpe去建模吗?如果使用 wenetspeech 训练的 bbpe-based 的 zipformer streaming 模型,自己train bpe model,token数量大概多少合适啊?

Sign up or log in to comment