robbinhan's picture

26 167

robbinhan

robbinhan

·

AI & ML interests

None yet

Recent Activity

liked a model 20 days ago

jinaai/jina-embeddings-v4

liked a model 21 days ago

Alibaba-NLP/gme-Qwen2-VL-2B-Instruct

liked a model 21 days ago

Alibaba-NLP/gme-Qwen2-VL-7B-Instruct

View all activity

Organizations

None yet

upvoted a paper 6 months ago

ProtoReasoning: Prototypes as the Foundation for Generalizable Reasoning in LLMs

Paper • 2506.15211 • Published Jun 18 • 38

upvoted a collection 10 months ago

Foundation Text-Generation Models Below 360M Parameters

Great candidates for fine-tuning targeting Wllama and Transformers.js for mobile devices, ordered by number of parameters. • 41 items • Updated Oct 4 • 37

upvoted a paper 10 months ago

BloombergGPT: A Large Language Model for Finance

Paper • 2303.17564 • Published Mar 30, 2023 • 28

upvoted a paper 12 months ago

LLaVA-Mini: Efficient Image and Video Large Multimodal Models with One Vision Token

Paper • 2501.03895 • Published Jan 7 • 52

upvoted 3 papers about 1 year ago

ObjCtrl-2.5D: Training-free Object Control with Camera Poses

Paper • 2412.07721 • Published Dec 10, 2024 • 8

LoRA.rar: Learning to Merge LoRAs via Hypernetworks for Subject-Style Conditioned Image Generation

Paper • 2412.05148 • Published Dec 6, 2024 • 12

Mogo: RQ Hierarchical Causal Transformer for High-Quality 3D Human Motion Generation

Paper • 2412.07797 • Published Dec 5, 2024 • 11

upvoted 3 papers almost 2 years ago

DiffuseKronA: A Parameter Efficient Fine-tuning Method for Personalized Diffusion Model

Paper • 2402.17412 • Published Feb 27, 2024 • 23

EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions

Paper • 2402.17485 • Published Feb 27, 2024 • 194

Neural Network Diffusion

Paper • 2402.13144 • Published Feb 20, 2024 • 100

upvoted a collection almost 2 years ago

AnimateDiff Motion Modules

7 items • Updated Feb 26, 2024 • 6

upvoted 6 papers almost 2 years ago

EfficientViT-SAM: Accelerated Segment Anything Model Without Performance Loss

Paper • 2402.05008 • Published Feb 7, 2024 • 23

Lumiere: A Space-Time Diffusion Model for Video Generation

Paper • 2401.12945 • Published Jan 23, 2024 • 86

UniVG: Towards UNIfied-modal Video Generation

Paper • 2401.09084 • Published Jan 17, 2024 • 17

DiffusionGPT: LLM-Driven Text-to-Image Generation System

Paper • 2401.10061 • Published Jan 18, 2024 • 31

Instruct-Imagen: Image Generation with Multi-modal Instruction

Paper • 2401.01952 • Published Jan 3, 2024 • 32

VideoDrafter: Content-Consistent Multi-Scene Video Generation with LLM

Paper • 2401.01256 • Published Jan 2, 2024 • 21

upvoted 3 papers about 2 years ago

InsActor: Instruction-driven Physics-based Characters

Paper • 2312.17135 • Published Dec 28, 2023 • 10

DREAM-Talk: Diffusion-based Realistic Emotional Audio-driven Method for Single Image Talking Face Generation

Paper • 2312.13578 • Published Dec 21, 2023 • 28

LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 260