DPO - a nbeerbower Collection

nbeerbower 's Collections

DPO

Qwen3

abliteration loras

bruphin

flammen

llama 3 experiments

Nemo

DPO

updated Jun 9

Various useful datasets with preference optimization