1 4 18

Fangkai Jiao

chitanda

https://jiaofangkai.com/

SparkJiao

AI & ML interests

self-supervised pre-training, large language model and machine reasoning.

Recent Activity

updated a model about 5 hours ago

chitanda/gemma.2b.it.meta_math_rap.dpo.H100.w2.v1.1.fix.s42

published a model about 5 hours ago

chitanda/gemma.2b.it.meta_math_rap.dpo.H100.w2.v1.1.fix.s42

updated a model about 23 hours ago

chitanda/deepseek-math.7b.ins.meta_math_cot.math55k.n5.critic_correct.dpo.H100.w4.v3.1.s42

View all activity

Organizations

chitanda's activity

updated a model about 5 hours ago

chitanda/gemma.2b.it.meta_math_rap.dpo.H100.w2.v1.1.fix.s42

Updated about 5 hours ago

published a model about 5 hours ago

chitanda/gemma.2b.it.meta_math_rap.dpo.H100.w2.v1.1.fix.s42

Updated about 5 hours ago

updated a model about 23 hours ago

chitanda/deepseek-math.7b.ins.meta_math_cot.math55k.n5.critic_correct.dpo.H100.w4.v3.1.s42

Updated about 23 hours ago

published a model 4 days ago

chitanda/deepseek-math.7b.ins.meta_math_cot.math55k.n5.critic_correct.dpo.H100.w4.v3.1.s42

Updated about 23 hours ago

liked 2 datasets 4 days ago

Magpie-Align/Magpie-Reasoning-V1-150K-CoT-Deepseek-R1-Llama-70B

Viewer • Updated 18 days ago • 150k • 947 • 13

Magpie-Align/Magpie-Reasoning-V2-250K-CoT-Deepseek-R1-Llama-70B

Viewer • Updated 18 days ago • 250k • 3.6k • 71

updated a model 4 days ago

chitanda/gemma.2b.it.meta_math_rap.step.dpo.H100.w4.v1.0.s44

Updated 4 days ago

published a model 4 days ago

chitanda/gemma.2b.it.meta_math_rap.step.dpo.H100.w4.v1.0.s44

Updated 4 days ago

updated a model 4 days ago

chitanda/gemma.2b.it.meta_math_rap.step.dpo.H100.w4.v1.0.s43

Updated 4 days ago

published a model 4 days ago

chitanda/gemma.2b.it.meta_math_rap.step.dpo.H100.w4.v1.0.s43

Updated 4 days ago

updated a model 6 days ago

chitanda/gemma.2b.it.meta_math_rap.step.dpo.H100.w4.v1.0.s42

Updated 6 days ago

published a model 6 days ago

chitanda/gemma.2b.it.meta_math_rap.step.dpo.H100.w4.v1.0.s42

Updated 6 days ago

updated a model 6 days ago

chitanda/gemma.2b.it.meta_math_rap.step.dpo.H100.w4.v1.0.1.s42

Updated 6 days ago

published a model 6 days ago

chitanda/gemma.2b.it.meta_math_rap.step.dpo.H100.w4.v1.0.1.s42

Updated 6 days ago

updated a model 7 days ago

chitanda/gemma.2b.it.meta_math_rap.step.dpo.A100.w8.v1.2.s42

Updated 7 days ago

published a model 7 days ago

chitanda/gemma.2b.it.meta_math_rap.step.dpo.A100.w8.v1.2.s42

Updated 7 days ago

authored a paper 8 days ago

Preference Optimization for Reasoning with Pseudo Feedback

Paper • 2411.16345 • Published Nov 25, 2024 • 1

upvoted a collection 8 days ago

PFPO

Collection

Resources for the paper Preference Optimization for Reasoning with Pseudo Feedback (ICLR 2025) • 4 items • Updated 8 days ago • 1

updated a dataset 8 days ago

chitanda/code-synthetic-test-cases

Preview • Updated 8 days ago • 22

upvoted a paper 8 days ago

Preference Optimization for Reasoning with Pseudo Feedback

Paper • 2411.16345 • Published Nov 25, 2024 • 1