Jack Ronaldo 's picture

1

Jack Ronaldo

Jack99j

·

AI & ML interests

None yet

Organizations

None yet

commented a paper 3 months ago

Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning

Paper • 2505.03318 • Published May 6 • 94 •

commented a paper 4 months ago

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 121 •