Reasoning - a bilalazhar50 Collection

bilalazhar50 's Collections

Prompting papers

Jail Breaking LLMs

Novel Architectures

Google Deepmind

Reasoning

updated Mar 9, 2024

Teaching Large Language Models to Reason with Reinforcement Learning

Paper • 2403.04642 • Published Mar 7, 2024 • 51
Common 7B Language Models Already Possess Strong Math Capabilities

Paper • 2403.04706 • Published Mar 7, 2024 • 21