Umar Azam

UmarAzam

Umar-Azam

AI & ML interests

Robotics and Simulations

Recent Activity

liked a Space 11 days ago

ResembleAI/chatterbox-turbo-demo

upvoted a paper 17 days ago

DynamicVerse: A Physically-Aware Multimodal Framework for 4D World Modeling

liked a model 22 days ago

microsoft/Fara-7B

View all activity

Organizations

None yet

upvoted a paper 17 days ago

DynamicVerse: A Physically-Aware Multimodal Framework for 4D World Modeling

Paper • 2512.03000 • Published 24 days ago • 36

upvoted a paper 30 days ago

Monet: Reasoning in Latent Visual Space Beyond Images and Language

Paper • 2511.21395 • Published about 1 month ago • 15

upvoted 3 papers about 1 month ago

VLA-4D: Embedding 4D Awareness into Vision-Language-Action Models for SpatioTemporally Coherent Robotic Manipulation

Paper • 2511.17199 • Published Nov 21 • 7

RynnVLA-002: A Unified Vision-Language-Action and World Model

Paper • 2511.17502 • Published Nov 21 • 25

MeshCoder: LLM-Powered Structured Mesh Code Generation from Point Clouds

Paper • 2508.14879 • Published Aug 20 • 68

upvoted 2 papers about 2 months ago

DeepEyesV2: Toward Agentic Multimodal Model

Paper • 2511.05271 • Published Nov 7 • 42

Kinematify: Open-Vocabulary Synthesis of High-DoF Articulated Objects

Paper • 2511.01294 • Published Nov 3 • 13

upvoted a paper 2 months ago

Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence

Paper • 2510.20579 • Published Oct 23 • 55

upvoted 2 articles 2 months ago

Article

Building the Open Agent Ecosystem Together: Introducing OpenEnv

Oct 23

•

137

Article

Open-source DeepResearch – Freeing our search agents

Feb 4

•

1.31k

upvoted 2 articles 3 months ago

Article

ScreenEnv: Deploy your full stack Desktop Agent

Jul 10

•

Article

Smol2Operator: Post-Training GUI Agents for Computer Use

Sep 23

•

134

upvoted 3 papers 4 months ago

upvoted an article 5 months ago

Article

Vision Language Models (Better, faster, stronger)

May 12

•

573

upvoted a paper 5 months ago

SitEmb-v1.5: Improved Context-Aware Dense Retrieval for Semantic Association and Long Story Comprehension

Paper • 2508.01959 • Published Aug 3 • 56

upvoted an article 5 months ago

Article

Train 400x faster Static Embedding Models with Sentence Transformers

Jan 15

•

222

upvoted 2 papers 6 months ago

Decoupled Planning and Execution: A Hierarchical Reasoning Framework for Deep Search

Paper • 2507.02652 • Published Jul 3 • 26

LangScene-X: Reconstruct Generalizable 3D Language-Embedded Scenes with TriMap Video Diffusion

Paper • 2507.02813 • Published Jul 3 • 60

Umar Azam

AI & ML interests

Recent Activity

Organizations

UmarAzam's activity

Building the Open Agent Ecosystem Together: Introducing OpenEnv

Open-source DeepResearch – Freeing our search agents

ScreenEnv: Deploy your full stack Desktop Agent

Smol2Operator: Post-Training GUI Agents for Computer Use

Vision Language Models (Better, faster, stronger)

Train 400x faster Static Embedding Models with Sentence Transformers