PrinceOfDryRice
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-1.5B-GRPO / train_log

PrinceOfDryRice's picture

PrinceOfDryRice

Training in progress, step 50

558cb97 verified 3 months ago

120 Bytes

	[2025-03-02 13:13:02,334] [INFO] [real_accelerator.py:219:get_accelerator] Setting ds_accelerator to cuda (auto detect)