1 2 1

ilgee hong

ilgee

ilgeehong

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

Think-RM: Enabling Long-Horizon Reasoning in Generative Reward Models

commented on a paper 1 day ago

Think-RM: Enabling Long-Horizon Reasoning in Generative Reward Models

updated a model 15 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep1-lr1e-6-kl1e-4-rollout256-0.03-0.03

View all activity

Organizations

None yet

ilgee's activity

upvoted a paper 1 day ago

Think-RM: Enabling Long-Horizon Reasoning in Generative Reward Models

Paper • 2505.16265 • Published 3 days ago • 6

commented a paper 1 day ago

Think-RM: Enabling Long-Horizon Reasoning in Generative Reward Models

Paper • 2505.16265 • Published 3 days ago • 6 •

updated a model 15 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep1-lr1e-6-kl1e-4-rollout256-0.03-0.03

Updated 15 days ago • 1

published a model 15 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep1-lr1e-6-kl1e-4-rollout256-0.03-0.03

Updated 15 days ago • 1

updated a model 15 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep2-lr2e-6-kl1e-4-rollout512-0.03-generated

Updated 15 days ago • 48

published a model 15 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep2-lr2e-6-kl1e-4-rollout512-0.03-generated

Updated 15 days ago • 48

updated a model 15 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep2-lr2e-6-kl1e-4-rollout512-0.03-groundtruth

Updated 15 days ago • 37

published a model 15 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep2-lr2e-6-kl1e-4-rollout512-0.03-groundtruth

Updated 15 days ago • 37

updated a model 16 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep2-lr2e-6-kl1e-4-rollout512-0.03-binary

Updated 16 days ago • 36

published a model 16 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep2-lr2e-6-kl1e-4-rollout512-0.03-binary

Updated 16 days ago • 36

updated a model 16 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep2-lr2e-6-kl1e-4-rollout512-0.03-BT

Updated 16 days ago • 25

published a model 16 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep2-lr2e-6-kl1e-4-rollout512-0.03-BT

Updated 16 days ago • 25

updated 2 models 16 days ago

ilgee/Llama-3.1-8B-Instruct-grpo-ep2-lr2e-6-kl1e-4-rollout512-0.03-multiclass

Updated 16 days ago • 42

ilgee/BT-hs2-naive-binary-ep3-lr1e-5

Updated 16 days ago • 29

published a model 16 days ago

ilgee/BT-hs2-naive-binary-ep3-lr1e-5

Updated 16 days ago • 29

updated a model 16 days ago

ilgee/BT-hs2-naive-multiclass-ep5-lr1e-5

Updated 16 days ago • 1

published a model 16 days ago

ilgee/BT-hs2-naive-multiclass-ep5-lr1e-5

Updated 16 days ago • 1

updated a model 16 days ago

ilgee/hs2-naive-multiclass-min-ep5-lr5e-6-grpo-ep2-lr2e-6-kl1e-4-rollout512-half-v0

Updated 16 days ago • 1

published a model 16 days ago

ilgee/hs2-naive-multiclass-min-ep5-lr5e-6-grpo-ep2-lr2e-6-kl1e-4-rollout512-half-v0

Updated 16 days ago • 1

updated a model 16 days ago

ilgee/hs2-naive-binary-min-ep5-lr1e-5-grpo-ep1-lr2e-6-kl1e-4-rollout512-v0

Updated 16 days ago • 10