Hanxu Hu's picture

1 8 4

Hanxu Hu

HanxuHU

·

https://hanxuhu.github.io/

hanxuhu

AI & ML interests

Multi-Modality

Recent Activity

liked a model 14 days ago

microsoft/bitnet-b1.58-2B-4T

upvoted a paper 16 days ago

Learning to Reason under Off-Policy Guidance

published a model about 1 month ago

HanxuHU/Qwen2-0.5B-SFT

View all activity

Organizations

HanxuHU's activity

liked a model 14 days ago

microsoft/bitnet-b1.58-2B-4T

Text Generation • Updated 7 days ago • 83.2k • 943

upvoted a paper 16 days ago

Learning to Reason under Off-Policy Guidance

Paper • 2504.14945 • Published 17 days ago • 80

published a model about 1 month ago

HanxuHU/Qwen2-0.5B-SFT

upvoted a paper 3 months ago

BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models

Paper • 2502.07346 • Published Feb 11 • 54

upvoted a paper 4 months ago

Demons in the Detail: On Implementing Load Balancing Loss for Training Specialized Mixture-of-Expert Models

Paper • 2501.11873 • Published Jan 21 • 66

updated a dataset 4 months ago

HanxuHU/mt_data

Viewer • Updated Dec 31, 2024 • 796k • 64

updated 10 datasets 5 months ago

HanxuHU/gemma-llama-2-9b-it-ultrafeedback-annotate-ultrafb-judge-5-maj

Viewer • Updated Nov 28, 2024 • 60k • 36

HanxuHU/gemma2-9B-it-ultrafeedback-annotate-ultrafb-merge-single-filtered

Viewer • Updated Nov 26, 2024 • 56.4k • 69

HanxuHU/gemma2-9B-it-ultrafeedback-annotate-ultrafb-judge-5-majority-filtered

Viewer • Updated Nov 26, 2024 • 55.2k • 17

HanxuHU/gemma2-9B-it-ultrafeedback-annotate-ultrafb-merge-single-judge

Viewer • Updated Nov 25, 2024 • 60.7k • 17

HanxuHU/gemma-2-9b-it-ultrafeedback-annotate-ultrafb-merge-single-judge

Viewer • Updated Nov 25, 2024 • 1.96k • 57

HanxuHU/gemma2-9B-it-ultrafeedback-annotate-truth-judge

Viewer • Updated Nov 24, 2024 • 60.7k • 71

HanxuHU/gemma-2-9b-it-ultrafeedback-annotate-truth-judge

Viewer • Updated Nov 24, 2024 • 1.96k • 19

HanxuHU/gemma-2-9b-it-ultrafeedback-annotate-honesty-judge

Viewer • Updated Nov 24, 2024 • 1.96k • 11

HanxuHU/gemma-2-9b-it-ultrafeedback-annotate-safe-judge

Viewer • Updated Nov 24, 2024 • 1.96k • 36

HanxuHU/gemma-2-9b-it-ultrafeedback-annotate-ultrafb-judge-5-maj

Viewer • Updated Nov 24, 2024 • 60.7k • 11

updated 4 datasets 6 months ago

HanxuHU/gemma2-9B-it-ultrafeedback-annotate-safe-judge

Viewer • Updated Nov 23, 2024 • 58.8k • 21

HanxuHU/gemma2-9B-it-ultrafeedback-annotate-honesty-judge

Viewer • Updated Nov 23, 2024 • 58.8k • 15

HanxuHU/llama-3-8b-it-ultrafeedback-annotate-5aspect-judge

Viewer • Updated Nov 22, 2024 • 62k • 11

HanxuHU/gemma-2-9b-it-ultrafeedback-annotate-5aspect-judge

Viewer • Updated Nov 17, 2024 • 60.7k • 13