ZiYi Yang

AALF

·

https://github.com/yangzy39

yangzy39

AI & ML interests

None yet

Organizations

Articles 2

Article

22

FuseO1-Preview: System-II Reasoning Fusion of LLMs

Article

5

FuseChat-3.0: Preference Optimization for Implicit Model Fusion

View all Articles

Papers 9

arxiv:2512.12967

arxiv:2509.23863

arxiv:2505.17667

arxiv:2505.14183

models 7

AALF/FuseR1-QwQ-R1-TinyR1-32B

33B • Updated Mar 7, 2025 • 2 • 1

AALF/FuseR1-QwQ-R1-LightR1-32B

33B • Updated Mar 7, 2025 • 5

AALF/FuseR1-QwQ-R1-32B

33B • Updated Mar 7, 2025 • 4

AALF/FuseR1-QwQ-R1-LightR1-TinyR1-32B

33B • Updated Mar 7, 2025 • 3

AALF/gemma-2-27b-it-SimPO-37K

Text Generation • 27B • Updated Dec 18, 2024 • 45 • • 18

AALF/gemma-2-27b-it-SimPO-37K-100steps

Text Generation • 27B • Updated Dec 18, 2024 • 41 • • 13

AALF/llama-3-8b-Instruct-simpo-beta10-gamma3-lr1e-6

8B • Updated Aug 16, 2024 • 2

datasets 1

AALF/ultrafeedback_wrpo

Viewer • Updated Feb 28, 2025 • 59.9k • 66