还会有蒸馏模型吗?

#37
by BlackLeee - opened

这个会不会基于qwen3来一波蒸馏模型呢?

qwen3-32b-base,没有开源,怎么办呀?

qwen3-32b-base,没有开源,怎么办呀?

use qwen3-32b,
DeepSeek-R1-Distill-Llama-70B was distilled from Llama-3.3-70B-Instruct which is not a pretrained base model.

在百度千帆平台上面,咱自己就可以蒸馏

这个也是我关心的问题,早点出些蒸馏版本出来吧

modelcard更新了,放了一个Qwen3-8B的蒸馏模型

Sign up or log in to comment