Gabriel Mongaras's picture

Gabriel Mongaras

gmongaras

·

AI & ML interests

None yet

Recent Activity

published a dataset about 1 month ago

gmongaras/ReLaion-10TB

updated a model about 2 months ago

gmongaras/datav3_attempt5_8GPU_SoftFlash_RoPE2d_2AccSteps_13batchsize_stage3

updated a collection about 2 months ago

Stable Diffusion 3 Checkpoints

View all activity

Organizations

upvoted a paper 3 months ago

RWKV-7 "Goose" with Expressive Dynamic State Evolution

Paper • 2503.14456 • Published Mar 18 • 151

upvoted 2 papers 4 months ago

Transformers without Normalization

Paper • 2503.10622 • Published Mar 13 • 166

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published Feb 16 • 160

upvoted a paper 6 months ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 295

upvoted a paper 11 months ago

Transformer Explainer: Interactive Learning of Text-Generative Models

Paper • 2408.04619 • Published Aug 8, 2024 • 161

upvoted 2 papers 12 months ago

Transformer Layers as Painters

Paper • 2407.09298 • Published Jul 12, 2024 • 15

Wavelets Are All You Need for Autoregressive Image Generation

Paper • 2406.19997 • Published Jun 28, 2024 • 32

upvoted a paper about 1 year ago

Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

Paper • 2405.21060 • Published May 31, 2024 • 68