new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Jul 2

Submitted by

wenyi

GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning

·
77 authors

Submitted by

yilunzhao

SciArena: An Open Evaluation Platform for Foundation Models in Scientific Literature Tasks

·
18 authors

Submitted by

yuexiang96

Does Math Reasoning Improve General LLM Capabilities? Understanding Transferability of LLM Reasoning

·
9 authors

Submitted by

Haon-Chen

MoCa: Modality-aware Continual Pre-training Makes Better Bidirectional Multimodal Embeddings

·
7 authors

Submitted by

Lmxyy

Radial Attention: O(nlog n) Sparse Attention with Energy Decay for Long Video Generation

·
14 authors

Submitted by

Sansa

DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation

·
7 authors

Submitted by

fushh7

HumanOmniV2: From Understanding to Omni-Modal Reasoning with Context

·
10 authors

Submitted by

RanjanSapkota

Thinking Beyond Tokens: From Brain-Inspired Intelligence to Cognitive Foundations for Artificial General Intelligence and its Societal Impact

·
20 authors

Submitted by

Amar-S

Training for X-Ray Vision: Amodal Segmentation, Amodal Content Completion, and View-Invariant Object Representation from Multi-Camera Video

·
5 authors

1

Submitted by

Ksgk-fy

Data Efficacy for Language Model Training

·
9 authors

Submitted by

puar-playground

MusiXQA: Advancing Visual Music Understanding in Multimodal Large Language Models

·
9 authors

Submitted by

Simase

FreeLong++: Training-Free Long Video Generation via Multi-band SpectralFusion

·
2 authors

1

Submitted by

AdinaY

IR3D-Bench: Evaluating Vision-Language Model Scene Understanding as Agentic Inverse Rendering

·
10 authors

Submitted by

amanchadha

Peccavi: Visual Paraphrase Attack Safe and Distortion Free Image Watermarking Technique for AI-Generated Images

·
7 authors

1

Submitted by

huxueyu

Mixture of Reasonings: Teach Large Language Models to Reason with Adaptive Strategies

·
4 authors

Submitted by

Icefox

Ella: Embodied Social Agents with Lifelong Memory

·
7 authors

Submitted by

Peter2023HuggingFace

FreNBRDF: A Frequency-Rectified Neural Material Representation

·
3 authors

Submitted by

AmirHossein-razlighi

Confident Splatting: Confidence-Based Compression of 3D Gaussian Splatting via Learnable Beta Distributions

·
3 authors

1