1 16 56

MC

Dreamer312

Dreamer

AI & ML interests

NLP, CV, LLM, AGENT, RL

Recent Activity

commented on a paper 1 day ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

commented on a paper 1 day ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

upvoted a paper 2 days ago

Scaling Law for Quantization-Aware Training

View all activity

Organizations

None yet

Dreamer312's activity

commented 2 papers 1 day ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 6 days ago • 18 •

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 6 days ago • 18 •

upvoted a paper 2 days ago

Scaling Law for Quantization-Aware Training

Paper • 2505.14302 • Published 4 days ago • 61

upvoted a collection 2 days ago

Llama 4

Collection

Meta's new Llama 4 multimodal models, Scout & Maverick. Includes Dynamic GGUFs, 16-bit & Dynamic 4-bit uploads. Run & fine-tune them with Unsloth! • 15 items • Updated 23 days ago • 46

liked 2 models 2 days ago

unsloth/Llama-4-Maverick-17B-128E-Instruct-GGUF

Image-Text-to-Text • Updated 1 day ago • 42.6k • 19

meta-llama/Llama-4-Maverick-17B-128E-Instruct

Image-Text-to-Text • Updated 1 day ago • 46.6k • • 334

commented a paper 4 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 6 days ago • 18 •

authored 2 papers 4 days ago

Hydra-SGG: Hybrid Relation Assignment for One-stage Scene Graph Generation

Paper • 2409.10262 • Published Sep 16, 2024 • 1

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 6 days ago • 18

commented a paper 4 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 6 days ago • 18 •

upvoted a paper 4 days ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published 6 days ago • 18

upvoted a paper 6 days ago

Hydra-SGG: Hybrid Relation Assignment for One-stage Scene Graph Generation

Paper • 2409.10262 • Published Sep 16, 2024 • 1

upvoted an article 10 days ago

Article

Mixture of Experts Explained

and 5 others •

Dec 11, 2023

• 636

upvoted a collection 10 days ago

Qwen3

Collection

40 items • Updated 3 days ago • 693

liked a model 11 days ago

Qwen/Qwen3-32B

Text Generation • Updated 3 days ago • 619k • • 339

updated a model 15 days ago

Dreamer312/Qwen-2.5-1.5B-Simple-RL

Updated 15 days ago • 1

published 2 models 17 days ago

Dreamer312/Qwen-2.5-1.5B-Simple-RL

Updated 15 days ago • 1

Dreamer312/Qwen-2.5-7B-Simple-RL

Updated 17 days ago

liked a model 26 days ago

Qwen/Qwen2.5-VL-7B-Instruct

Image-Text-to-Text • Updated Apr 6 • 3.19M • • 906

upvoted an article 30 days ago

Article

Proximal Policy Optimization (PPO)

•

Aug 5, 2022

• 40