wolosonovich (Jason Wolosonovich)

upvoted 2 papers 5 months ago

Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model

Paper • 2503.24290 • Published Mar 31 • 63

A Comprehensive Survey on Long Context Language Modeling

Paper • 2503.17407 • Published Mar 20 • 50

upvoted 2 papers 7 months ago

Scaling Embedding Layers in Language Models

Paper • 2502.01637 • Published Feb 3 • 24

SRMT: Shared Memory for Multi-agent Lifelong Pathfinding

Paper • 2501.13200 • Published Jan 22 • 69

upvoted an article 7 months ago

Article

Introducing multi-backends (TRT-LLM, vLLM) support for Text Generation Inference

By

and 1 other •

Jan 16

• 75

upvoted 2 papers 8 months ago

Personalized Graph-Based Retrieval for Large Language Models

Paper • 2501.02157 • Published Jan 4 • 32

Smaller Language Models Are Better Instruction Evolvers

Paper • 2412.11231 • Published Dec 15, 2024 • 29

upvoted a paper 9 months ago

Star Attention: Efficient LLM Inference over Long Sequences

Paper • 2411.17116 • Published Nov 26, 2024 • 56

upvoted 3 papers 10 months ago

HtmlRAG: HTML is Better Than Plain Text for Modeling Retrieved Knowledge in RAG Systems

Paper • 2411.02959 • Published Nov 5, 2024 • 71

Your Mixture-of-Experts LLM Is Secretly an Embedding Model For Free

Paper • 2410.10814 • Published Oct 14, 2024 • 52

StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization

Paper • 2410.08815 • Published Oct 11, 2024 • 49

upvoted 2 papers 11 months ago

Large Language Models as Markov Chains

Paper • 2410.02724 • Published Oct 3, 2024 • 34

Time-MoE: Billion-Scale Time Series Foundation Models with Mixture of Experts

Paper • 2409.16040 • Published Sep 24, 2024 • 16

upvoted a paper 12 months ago

OLMoE: Open Mixture-of-Experts Language Models

Paper • 2409.02060 • Published Sep 3, 2024 • 79

upvoted 2 articles about 1 year ago

Article

dstack: Your LLM Launchpad - From Fine-Tuning to Serving, Simplified

By

•

Aug 22, 2024

• 13

Article

Welcome FalconMamba: The first strong attention-free 7B model

By

and 5 others •

Aug 12, 2024

• 113

upvoted 2 papers about 1 year ago

CodexGraph: Bridging Large Language Models and Code Repositories via Code Graph Databases

Paper • 2408.03910 • Published Aug 7, 2024 • 18

Improving Text Embeddings for Smaller Language Models Using Contrastive Fine-tuning

Paper • 2408.00690 • Published Aug 1, 2024 • 26

upvoted an article about 1 year ago

Article

Docmatix - a huge dataset for Document Visual Question Answering

By

and 1 other •

Jul 18, 2024

• 76

upvoted a paper about 1 year ago

E5-V: Universal Embeddings with Multimodal Large Language Models

Paper • 2407.12580 • Published Jul 17, 2024 • 42

Jason Wolosonovich

AI & ML interests

Organizations

Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model

A Comprehensive Survey on Long Context Language Modeling

Scaling Embedding Layers in Language Models

SRMT: Shared Memory for Multi-agent Lifelong Pathfinding

Introducing multi-backends (TRT-LLM, vLLM) support for Text Generation Inference

Personalized Graph-Based Retrieval for Large Language Models

Smaller Language Models Are Better Instruction Evolvers

Star Attention: Efficient LLM Inference over Long Sequences

HtmlRAG: HTML is Better Than Plain Text for Modeling Retrieved Knowledge in RAG Systems

Your Mixture-of-Experts LLM Is Secretly an Embedding Model For Free

StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization

Large Language Models as Markov Chains

Time-MoE: Billion-Scale Time Series Foundation Models with Mixture of Experts

OLMoE: Open Mixture-of-Experts Language Models

dstack: Your LLM Launchpad - From Fine-Tuning to Serving, Simplified

Welcome FalconMamba: The first strong attention-free 7B model

CodexGraph: Bridging Large Language Models and Code Repositories via Code Graph Databases

Improving Text Embeddings for Smaller Language Models Using Contrastive Fine-tuning

Docmatix - a huge dataset for Document Visual Question Answering

E5-V: Universal Embeddings with Multimodal Large Language Models

Jason Wolosonovich

AI & ML interests

Organizations

wolosonovich's activity

Introducing multi-backends (TRT-LLM, vLLM) support for Text Generation Inference

dstack: Your LLM Launchpad - From Fine-Tuning to Serving, Simplified

Welcome FalconMamba: The first strong attention-free 7B model

Docmatix - a huge dataset for Document Visual Question Answering