sdpkjc (Yanxiao Zhao)

arxiv:2508.14040

arxiv:2502.11896

arxiv:2403.00673

View 5 papers

models 95

datasets 17

sdpkjc/SATQuest

Viewer • Updated Sep 6, 2025 • 140 • 23

sdpkjc/SATQuest-RFT-3k

Viewer • Updated Jul 30, 2025 • 3k • 35

sdpkjc/24problems_quiz-eval-n4-1-10-24

Viewer • Updated May 22, 2025 • 55.5k • 11

sdpkjc/24problems_quiz-eval-5

Viewer • Updated May 22, 2025 • 100k • 14

sdpkjc/24problems_quiz

Viewer • Updated May 21, 2025 • 85.6k • 5

sdpkjc/SATQuest-RFT-1k

Viewer • Updated Apr 23, 2025 • 1k • 51

sdpkjc/SATQuest-Tiny

Viewer • Updated Apr 20, 2025 • 10 • 13

sdpkjc/SATQuest-G

Viewer • Updated Mar 28, 2025 • 963 • 11

sdpkjc/NumBase-N01-S2g-B2g

Viewer • Updated Feb 26, 2025 • 983k • 6

sdpkjc/NumBase-N01-S2g-B28

Viewer • Updated Feb 26, 2025 • 459k • 9

View 17 datasets

Yanxiao Zhao

AI & ML interests

Organizations

Collections 1

sdpkjc/SATQuest

sdpkjc/SATQuest-RFT-3k

SATQuest: A Verifier for Logical Reasoning Evaluation and Reinforcement Fine-Tuning of LLMs

sdpkjc/SATQuest

sdpkjc/SATQuest-RFT-3k

SATQuest: A Verifier for Logical Reasoning Evaluation and Reinforcement Fine-Tuning of LLMs

Papers 5

models 95

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed5

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed4

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed3

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed2

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed1

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed5

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed4

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed3

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed2

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed1

datasets 17

sdpkjc/SATQuest

sdpkjc/SATQuest-RFT-3k

sdpkjc/24problems_quiz-eval-n4-1-10-24

sdpkjc/24problems_quiz-eval-5

sdpkjc/24problems_quiz

sdpkjc/SATQuest-RFT-1k

sdpkjc/SATQuest-Tiny

sdpkjc/SATQuest-G

sdpkjc/NumBase-N01-S2g-B2g

sdpkjc/NumBase-N01-S2g-B28

Yanxiao Zhao

AI & ML interests

Organizations

Collections 1

Papers 5

models 95 Sort: Recently updated

datasets 17 Sort: Recently updated

models 95

datasets 17