to read - a doguscank Collection

doguscank 's Collections

tts

case

to read

image gen personalization

to read

updated 4 days ago

GenEx: Generating an Explorable World

Paper • 2412.09624 • Published Dec 12, 2024 • 97
IamCreateAI/Ruyi-Mini-7B

Image-to-Video • Updated Dec 25, 2024 • 296 • 610
Track4Gen: Teaching Video Diffusion Models to Track Points Improves Video Generation

Paper • 2412.06016 • Published Dec 8, 2024 • 20
Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 103
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 368
Alibaba-NLP/gte-multilingual-mlm-base

Fill-Mask • Updated Aug 6, 2024 • 363 • 11
answerdotai/ModernBERT-large

Fill-Mask • Updated Jan 15 • 65.1k • 395
Parallelized Autoregressive Visual Generation

Paper • 2412.15119 • Published Dec 19, 2024 • 54
Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis

Paper • 2412.15322 • Published Dec 19, 2024 • 18
CLEAR: Conv-Like Linearization Revs Pre-Trained Diffusion Transformers Up

Paper • 2412.16112 • Published Dec 20, 2024 • 23
The GAN is dead; long live the GAN! A Modern GAN Baseline

Paper • 2501.05441 • Published Jan 9 • 92
EuroBERT/EuroBERT-2.1B

Fill-Mask • Updated Apr 17 • 1.43k • 50
"Principal Components" Enable A New Language of Images

Paper • 2503.08685 • Published Mar 11 • 12
Causal-Copilot: An Autonomous Causal Analysis Agent

Paper • 2504.13263 • Published Apr 17 • 6
Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning

Paper • 2504.17192 • Published Apr 24 • 110
Vid2World: Crafting Video Diffusion Models to Interactive World Models

Paper • 2505.14357 • Published 6 days ago • 21