🤝 Open to Collab

Jie Liu PRO

jieliu

·

yifan123

AI & ML interests

Reinforcement Learning, Large Language Model

Organizations

Collections 1

Papers 10

arxiv:2509.08826

arxiv:2509.04548

arxiv:2508.21016

arxiv:2505.05470

spaces 1

SD3.5 M Flow GRPO

Generate images from text prompts

models 13

jieliu/SD3.5M-FlowGRPO-Text-without-KL

Updated Jul 22, 2025 • 3

jieliu/SD3.5M-FlowGRPO-PickScore-without-KL

Updated Jul 22, 2025 • 1

jieliu/SD3.5M-FlowGRPO-GenEval-without-KL

Updated Jul 22, 2025 • 2

jieliu/SD3.5M-FlowGRPO-GenEval

Updated May 12, 2025 • 108 • 9

jieliu/SD3.5M-FlowGRPO-PickScore

Updated May 11, 2025 • 75 • 3

jieliu/SD3.5M-FlowGRPO-Text

Updated May 11, 2025 • 71 • 2

jieliu/Qwen2-7B-Instruct-DPO-score-diff-2-chat-noval-beta0.5-bs24

Updated Sep 7, 2024

jieliu/Qwen2-7B-Instruct-DPO-score-diff-2-chat-math-noval-beta0.5-bs24

Updated Sep 7, 2024

jieliu/Qwen2-7B-Instruct-DPO-score-diff-2-longqa-beta0.5-bs24-seq2048

Updated Sep 5, 2024

jieliu/Qwen2-7B-Instruct-DPO-score-diff-2-longqa-beta0.5-bs24

Updated Sep 5, 2024

datasets 2

jieliu/counting_edit

Viewer • Updated Aug 5, 2025 • 310 • 40

jieliu/homepage

Viewer • Updated Feb 10, 2025 • 4 • 303