AmberYifan
/

Llama-3.1-8B-sft-hhrlhf-dpo

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8B-sft-hhrlhf-dpo

Commit History

Model save

fc69294
verified

AmberYifan commited on 10 days ago

Training in progress, epoch 3, checkpoint

c60270c
verified

AmberYifan commited on 10 days ago

Training in progress, epoch 3

d00351c
verified

AmberYifan commited on 10 days ago

Training in progress, epoch 2, checkpoint

c63ce2e
verified

AmberYifan commited on 10 days ago

Training in progress, epoch 2

1ff94fc
verified

AmberYifan commited on 10 days ago

Training in progress, epoch 1, checkpoint

3d531cc
verified

AmberYifan commited on 10 days ago

Training in progress, epoch 1

59a0a71
verified

AmberYifan commited on 10 days ago

initial commit

02ae19e
verified

AmberYifan commited on 10 days ago