UFT - a liumy2010 Collection

Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

liumy2010 's Collections

UFT

UFT

updated 12 days ago

UFT: Unifying Supervised and Reinforcement Fine-Tuning

UFT: Unifying Supervised and Reinforcement Fine-Tuning

Paper • 2505.16984 • Published 17 days ago • 3
liumy2010/Llama-3.2-1B-countdown-R3

Text Generation • Updated 10 days ago • 11
liumy2010/Llama-3.2-1B-countdown-RFT

Text Generation • Updated 10 days ago • 13
liumy2010/Llama-3.2-1B-countdown-SFT

Text Generation • Updated 10 days ago • 12
liumy2010/Llama-3.2-1B-countdown-SFT-RFT

Text Generation • Updated 10 days ago • 15
liumy2010/Llama-3.2-1B-countdown-UFT

Text Generation • Updated 10 days ago • 14
liumy2010/Llama-3.2-1B-kk_logic-R3

Text Generation • Updated 10 days ago • 9
liumy2010/Llama-3.2-1B-kk_logic-RFT

Text Generation • Updated 10 days ago • 13
liumy2010/Llama-3.2-1B-kk_logic-SFT

Text Generation • Updated 10 days ago • 12
liumy2010/Llama-3.2-1B-kk_logic-SFT-RFT

Text Generation • Updated 10 days ago • 13
liumy2010/Llama-3.2-1B-kk_logic-UFT

Text Generation • Updated 10 days ago • 21
liumy2010/Llama-3.2-1B-math-R3

Text Generation • Updated 10 days ago • 12
liumy2010/Llama-3.2-1B-math-RFT

Text Generation • Updated 10 days ago • 12
liumy2010/Llama-3.2-1B-math-SFT

Text Generation • Updated 10 days ago • 16
liumy2010/Llama-3.2-1B-math-SFT-RFT

Text Generation • Updated 10 days ago • 15
liumy2010/Llama-3.2-1B-math-UFT

Text Generation • Updated 10 days ago • 22
liumy2010/Llama-3.2-3B-countdown-R3

Text Generation • Updated 10 days ago • 13
liumy2010/Llama-3.2-3B-countdown-RFT

Text Generation • Updated 10 days ago • 46
liumy2010/Llama-3.2-3B-countdown-SFT

Text Generation • Updated 10 days ago • 11
liumy2010/Llama-3.2-3B-countdown-SFT-RFT

Text Generation • Updated 10 days ago • 22
liumy2010/Llama-3.2-3B-countdown-UFT

Text Generation • Updated 10 days ago • 17
liumy2010/Llama-3.2-3B-kk_logic-R3

Text Generation • Updated 10 days ago • 11
liumy2010/Llama-3.2-3B-kk_logic-RFT

Text Generation • Updated 10 days ago • 18
liumy2010/Llama-3.2-3B-kk_logic-SFT

Text Generation • Updated 10 days ago • 13
liumy2010/Llama-3.2-3B-kk_logic-SFT-RFT

Text Generation • Updated 10 days ago • 17
liumy2010/Llama-3.2-3B-kk_logic-UFT

Text Generation • Updated 10 days ago • 11
liumy2010/Llama-3.2-3B-math-R3

Text Generation • Updated 10 days ago • 13
liumy2010/Llama-3.2-3B-math-RFT

Text Generation • Updated 10 days ago • 18
liumy2010/Llama-3.2-3B-math-SFT

Text Generation • Updated 10 days ago • 34
liumy2010/Llama-3.2-3B-math-SFT-RFT

Text Generation • Updated 10 days ago • 32
liumy2010/Llama-3.2-3B-math-UFT

Text Generation • Updated 10 days ago • 13
liumy2010/Qwen2.5-0.5B-countdown-R3

Text Generation • Updated 10 days ago • 7
liumy2010/Qwen2.5-0.5B-countdown-RFT

Text Generation • Updated 10 days ago • 7
liumy2010/Qwen2.5-0.5B-countdown-SFT

Text Generation • Updated 10 days ago • 13
liumy2010/Qwen2.5-0.5B-countdown-SFT-RFT

Text Generation • Updated 10 days ago • 9
liumy2010/Qwen2.5-0.5B-countdown-UFT

Text Generation • Updated 10 days ago • 5
liumy2010/Qwen2.5-0.5B-kk_logic-R3

Text Generation • Updated 10 days ago • 10
liumy2010/Qwen2.5-0.5B-kk_logic-RFT

Text Generation • Updated 10 days ago • 10
liumy2010/Qwen2.5-0.5B-kk_logic-SFT

Text Generation • Updated 10 days ago • 8
liumy2010/Qwen2.5-0.5B-kk_logic-SFT-RFT

Text Generation • Updated 10 days ago • 7
liumy2010/Qwen2.5-0.5B-kk_logic-UFT

Text Generation • Updated 10 days ago • 9
liumy2010/Qwen2.5-0.5B-math-R3

Text Generation • Updated 10 days ago • 8
liumy2010/Qwen2.5-0.5B-math-RFT

Text Generation • Updated 10 days ago • 5
liumy2010/Qwen2.5-0.5B-math-SFT

Text Generation • Updated 10 days ago • 5
liumy2010/Qwen2.5-0.5B-math-SFT-RFT

Text Generation • Updated 10 days ago • 12
liumy2010/Qwen2.5-0.5B-math-UFT

Text Generation • Updated 10 days ago • 5
liumy2010/Qwen2.5-1.5B-countdown-R3

Text Generation • Updated 10 days ago • 9
liumy2010/Qwen2.5-1.5B-countdown-RFT

Text Generation • Updated 10 days ago • 9
liumy2010/Qwen2.5-1.5B-countdown-SFT

Text Generation • Updated 10 days ago • 7
liumy2010/Qwen2.5-1.5B-countdown-SFT-RFT

Text Generation • Updated 10 days ago • 11
liumy2010/Qwen2.5-1.5B-countdown-UFT

Text Generation • Updated 10 days ago • 5
liumy2010/Qwen2.5-1.5B-kk_logic-R3

Text Generation • Updated 10 days ago • 6
liumy2010/Qwen2.5-1.5B-kk_logic-RFT

Text Generation • Updated 10 days ago • 10
liumy2010/Qwen2.5-1.5B-kk_logic-SFT

Text Generation • Updated 10 days ago • 5
liumy2010/Qwen2.5-1.5B-kk_logic-SFT-RFT

Text Generation • Updated 10 days ago • 13
liumy2010/Qwen2.5-1.5B-kk_logic-UFT

Text Generation • Updated 10 days ago • 6
liumy2010/Qwen2.5-1.5B-math-R3

Text Generation • Updated 10 days ago • 12
liumy2010/Qwen2.5-1.5B-math-RFT

Text Generation • Updated 10 days ago • 8
liumy2010/Qwen2.5-1.5B-math-SFT

Text Generation • Updated 10 days ago • 8
liumy2010/Qwen2.5-1.5B-math-SFT-RFT

Text Generation • Updated 10 days ago • 12
liumy2010/Qwen2.5-1.5B-math-UFT

Text Generation • Updated 10 days ago • 9
liumy2010/Qwen2.5-3B-countdown-R3

Text Generation • Updated 10 days ago • 12
liumy2010/Qwen2.5-3B-countdown-RFT

Text Generation • Updated 10 days ago • 11
liumy2010/Qwen2.5-3B-countdown-SFT

Text Generation • Updated 10 days ago • 7
liumy2010/Qwen2.5-3B-countdown-SFT-RFT

Text Generation • Updated 10 days ago • 7
liumy2010/Qwen2.5-3B-countdown-UFT

Text Generation • Updated 10 days ago • 7
liumy2010/Qwen2.5-3B-kk_logic-R3

Text Generation • Updated 10 days ago • 11
liumy2010/Qwen2.5-3B-kk_logic-RFT

Text Generation • Updated 10 days ago • 12
liumy2010/Qwen2.5-3B-kk_logic-SFT

Text Generation • Updated 10 days ago • 7
liumy2010/Qwen2.5-3B-kk_logic-SFT-RFT

Text Generation • Updated 10 days ago • 16
liumy2010/Qwen2.5-3B-kk_logic-UFT

Text Generation • Updated 10 days ago • 8
liumy2010/Qwen2.5-3B-math-R3

Text Generation • Updated 10 days ago • 11
liumy2010/Qwen2.5-3B-math-RFT

Text Generation • Updated 10 days ago • 10
liumy2010/Qwen2.5-3B-math-SFT

Text Generation • Updated 10 days ago • 7
liumy2010/Qwen2.5-3B-math-SFT-RFT

Text Generation • Updated 10 days ago • 10
liumy2010/Qwen2.5-3B-math-UFT

Text Generation • Updated 10 days ago • 7
liumy2010/UFT-Countdown

Viewer • Updated 12 days ago • 11.3k • 17
liumy2010/UFT-MATH_3_4_5

Viewer • Updated 12 days ago • 9.26k • 16
liumy2010/UFT-Logic

Viewer • Updated 12 days ago • 5k • 20
liumy2010/UFT-Other_Evaluation_Datasets

Viewer • Updated 12 days ago • 4.93k • 11

Collection guide
Browse collections

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs