Spiral RL

community

https://github.com/spiral-rl/spiral

spiral-rl

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

Benjamin-eecs authored a paper 3 days ago

SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning

simonycl authored a paper 3 days ago

SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning

lkevinzc authored a paper 3 days ago

SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning

View all activity

Benjamin-eecs

authored a paper 3 days ago

SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning

Paper • 2506.24119 • Published 3 days ago • 36

simonycl

authored a paper 3 days ago

SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning

Paper • 2506.24119 • Published 3 days ago • 36

lkevinzc

authored a paper 3 days ago

SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning

Paper • 2506.24119 • Published 3 days ago • 36

Benjamin-eecs

updated a dataset 3 days ago

spiral-rl/Spiral-Kuhn-Poker-Qwen3-32B-SFT

Viewer • Updated 3 days ago • 25.5k

Benjamin-eecs

updated 2 models 3 days ago

spiral-rl/Spiral-Qwen3-4B

4B • Updated 3 days ago • 15 • 3

spiral-rl/Spiral-DeepSeek-R1-Distill-Qwen-7B

8B • Updated 3 days ago • 7 • 2

Benjamin-eecs

published a dataset 3 days ago

spiral-rl/Spiral-Kuhn-Poker-Qwen3-32B-SFT

Viewer • Updated 3 days ago • 25.5k

Benjamin-eecs

published 2 models 3 days ago

spiral-rl/Spiral-DeepSeek-R1-Distill-Qwen-7B

8B • Updated 3 days ago • 7 • 2

spiral-rl/Spiral-Qwen3-4B

4B • Updated 3 days ago • 15 • 3

lkevinzc

updated a dataset 3 days ago

spiral-rl/Spiral-Kuhn-Poker-Qwen3-32B-SFT

Viewer • Updated 3 days ago • 25.5k

lkevinzc

updated 2 models 3 days ago

spiral-rl/Spiral-DeepSeek-R1-Distill-Qwen-7B

8B • Updated 3 days ago • 7 • 2

spiral-rl/Spiral-Qwen3-4B

4B • Updated 3 days ago • 15 • 3

Benjamin-eecs

updated a collection 3 days ago

SPIRAL

Collection

4 items • Updated 3 days ago • 1

Benjamin-eecs

updated a collection 4 days ago

SPIRAL

Collection

4 items • Updated 3 days ago • 1

simonycl

authored a paper about 1 month ago

WHEN TO ACT, WHEN TO WAIT: Modeling Structural Trajectories for Intent Triggerability in Task-Oriented Dialogue

Paper • 2506.01881 • Published Jun 2 • 6

lkevinzc

authored 2 papers about 1 month ago

Reinforcing General Reasoning without Verifiers

Paper • 2505.21493 • Published May 27 • 26

Optimizing Anytime Reasoning via Budget Relative Policy Optimization

Paper • 2505.13438 • Published May 19 • 35

simonycl

authored a paper 3 months ago

Diversify and Conquer: Diversity-Centric Data Selection with Iterative Refinement

Paper • 2409.11378 • Published Sep 17, 2024 • 1

AI & ML interests

Recent Activity

Team members 3

spiral-rl's activity