tmpmodelsave/llama3_sft_math_augmath_type12_beta05nosft_300tmp10_vllmexp Viewer • Updated Jan 19 • 15k • 12
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_200tmp10_vllmexp Viewer • Updated Jan 19 • 15k • 5
tmpmodelsave/llama3_sft_math_augmath_type12_beta05nosft_200tmp10_vllmexp Viewer • Updated Jan 19 • 15k • 7
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_600tmp10_vllmexp2 Viewer • Updated Jan 19 • 15k • 9
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_500tmp10_vllmexp2 Viewer • Updated Jan 19 • 15k • 9
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_400tmp10_vllmexp2 Viewer • Updated Jan 19 • 15k • 9
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_300tmp10_vllmexp2 Viewer • Updated Jan 19 • 15k • 7
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_200tmp10_vllmexp2 Viewer • Updated Jan 19 • 15k • 7
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_600tmp10 Viewer • Updated Jan 19 • 15k • 7
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_500tmp10 Viewer • Updated Jan 19 • 15k • 7
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_400tmp10 Viewer • Updated Jan 19 • 15k • 7
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_300tmp10 Viewer • Updated Jan 19 • 15k • 8
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_200tmp10 Viewer • Updated Jan 19 • 15k • 8
tmpmodelsave/type12_math_augmath_dpo_sftlossbeta05_step400tmp10_vllmexp2 Viewer • Updated Jan 18 • 15k • 11
tmpmodelsave/type12_math_augmath_dpo_sftlossbeta05_step400tmp10_vllmexp1 Viewer • Updated Jan 18 • 15k • 10