还会有蒸馏模型吗?
#37
by
BlackLeee
- opened
这个会不会基于qwen3来一波蒸馏模型呢?
qwen3-32b-base,没有开源,怎么办呀?
qwen3-32b-base,没有开源,怎么办呀?
use qwen3-32b,
DeepSeek-R1-Distill-Llama-70B was distilled from Llama-3.3-70B-Instruct which is not a pretrained base model.
在百度千帆平台上面,咱自己就可以蒸馏
这个也是我关心的问题,早点出些蒸馏版本出来吧
modelcard更新了,放了一个Qwen3-8B的蒸馏模型