krishanwalia30
/

DeepSeek-R1-Distill-HumanLikeDPO-FineTuned-16bit

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DeepSeek-R1-Distill-HumanLikeDPO-FineTuned-16bit

Commit History

Adding `safetensors` variant of this model

6836ad6
verified

SFconvertbot commited on 13 days ago

Updated README.md

51411ca
verified

krishanwalia30 commited on 20 days ago

Trained with Unsloth

c312753
verified

krishanwalia30 commited on 20 days ago

Upload tokenizer

0d67587
verified

krishanwalia30 commited on 20 days ago

Upload README.md with huggingface_hub

df60641
verified

krishanwalia30 commited on 20 days ago

initial commit

fe795af
verified

krishanwalia30 commited on 20 days ago