marinaretikof

marinaretik

AI & ML interests

None yet

Recent Activity

upvoted a collection 3 days ago

Falcon-H1

upvoted a paper 3 days ago

Fractured Chain-of-Thought Reasoning

upvoted a paper 3 days ago

MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision

View all activity

Organizations

None yet

marinaretik's activity

upvoted a collection 3 days ago

Falcon-H1

Collection

Falcon-H1 Family of Hybrid-Head Language Models, including 0.5B, 1.5B, 1.5B-Deep, 3B, 7B, and 34B (pretrained and instruction-tuned). • 37 items • Updated 3 days ago • 30

upvoted 15 papers 3 days ago

Fractured Chain-of-Thought Reasoning

Paper • 2505.12992 • Published 5 days ago • 21

MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision

Paper • 2505.13427 • Published 5 days ago • 24

Seek in the Dark: Reasoning via Test-Time Instance-Level Policy Gradient in Latent Space

Paper • 2505.13308 • Published 5 days ago • 25

Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis

Paper • 2505.13227 • Published 5 days ago • 43

Delta Attention: Fast and Accurate Sparse Attention Inference by Delta Correction

Paper • 2505.11254 • Published 8 days ago • 47

Thinkless: LLM Learns When to Think

Paper • 2505.13379 • Published 5 days ago • 46

AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

Paper • 2505.11896 • Published 7 days ago • 54

AdaptThink: Reasoning Models Can Learn When to Think

Paper • 2505.13417 • Published 5 days ago • 70

Chain-of-Model Learning for Language Model

Paper • 2505.11820 • Published 8 days ago • 105

Incorporating brain-inspired mechanisms for multimodal learning in artificial intelligence

Paper • 2505.10176 • Published 9 days ago • 3

upvoted a collection 4 days ago

Gemma 3n Preview

Collection

2 items • Updated 4 days ago • 63

upvoted 3 papers about 2 months ago

TransMamba: Flexibly Switching between Transformer and Mamba

Paper • 2503.24067 • Published Mar 31 • 21

APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay

Paper • 2504.03601 • Published Apr 4 • 16

SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement

Paper • 2504.03561 • Published Apr 4 • 18