AmberYifan
/

Llama-3.1-8B-sft-hhrlhf-dpo

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8B-sft-hhrlhf-dpo / last-checkpoint

Commit History

Training in progress, epoch 3, checkpoint

c60270c
verified

AmberYifan commited on 14 days ago

Training in progress, epoch 2, checkpoint

c63ce2e
verified

AmberYifan commited on 14 days ago

Training in progress, epoch 1, checkpoint

3d531cc
verified

AmberYifan commited on 14 days ago