2 46 17

Ajinkya Kolhe

ajinkyakolhe112

ajinkyakolhe112

AI & ML interests

None yet

Recent Activity

updated a collection 4 days ago

LLMs for "Low Training Data Languages"

updated a collection 8 days ago

May - Top Spaces

updated a collection 8 days ago

May - Top Spaces

View all activity

Organizations

ajinkyakolhe112's activity

upvoted an article about 1 month ago

Article

Vision Language Models (Better, Faster, Stronger)

and 4 others •

May 12

• 443

upvoted 8 papers about 1 month ago

The FineWeb Datasets: Decanting the Web for the Finest Text Data at Scale

Paper • 2406.17557 • Published Jun 25, 2024 • 98

Seedream 2.0: A Native Chinese-English Bilingual Image Generation Foundation Model

Paper • 2503.07703 • Published Mar 10 • 36

Scaling Vision Pre-Training to 4K Resolution

Paper • 2503.19903 • Published Mar 25 • 42

Babel: Open Multilingual Large Language Models Serving Over 90% of Global Speakers

Paper • 2503.00865 • Published Mar 2 • 65

upvoted 11 papers about 2 months ago

Humanity's Last Exam

Paper • 2501.14249 • Published Jan 24 • 76

The GAN is dead; long live the GAN! A Modern GAN Baseline

Paper • 2501.05441 • Published Jan 9 • 93

TinyLLaVA: A Framework of Small-scale Large Multimodal Models

Paper • 2402.14289 • Published Feb 22, 2024 • 21

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4, 2024 • 95

A Survey on Transformer Compression

Paper • 2402.05964 • Published Feb 5, 2024 • 1

Evolving Deeper LLM Thinking

Paper • 2501.09891 • Published Jan 17 • 115

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 404

Soundwave: Less is More for Speech-Text Alignment in LLMs

Paper • 2502.12900 • Published Feb 18 • 86

How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?

Paper • 2502.14502 • Published Feb 20 • 91

Gemma 3 Technical Report

Paper • 2503.19786 • Published Mar 25 • 52

Stop Overthinking: A Survey on Efficient Reasoning for Large Language Models

Paper • 2503.16419 • Published Mar 20 • 74