Edit Models filters

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

76

Full-text search

Active filters: Quantized

VPTQ-community/Llama-3.1-Nemotron-70B-Instruct-HF-v16-k65536-256-woft

6B • Updated Feb 25 • 3 • 1

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v8-k65536-256-woft

9B • Updated Feb 25 • 8

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v16-k65536-16384-woft

7B • Updated Feb 25 • 6

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v8-k65536-0-woft

7B • Updated Feb 25 • 7

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v16-k65536-65536-woft

8B • Updated Feb 25 • 8

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v8-k65536-65536-woft

11B • Updated Feb 25 • 6 • 1

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v16-k65536-1024-woft

6B • Updated Feb 25 • 8 • 1

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v12-k65536-4096-woft-vllm

2B • Updated Jan 13 • 4

VPTQ-community/deepseek-r1_v_8_k_65536_256_mp4

Updated Mar 12 • 13

VPTQ-community/deepseek-r1_v_8_k_65536_mixed_mp4

Updated Mar 12 • 14 • 2

VPTQ-community/deepseek-r1_v8_k_65536_mp4

Updated Mar 12 • 25

VPTQ-community/deepseek-r1_v_8_k_65536

Updated Mar 12 • 3

VPTQ-community/deepseek-r1_v_8_k_65536_256

Updated Mar 12 • 12

swayamsingal/NanoQuant

Text Generation • Updated Apr 14 • 3

EliovpAI/Qwen3-8B-FP8-KV

Text Generation • 8B • Updated Aug 6 • 10

jinkyeongk/Midm-2.0-Base-Instruct-AWQ

Text Generation • 2B • Updated 23 days ago • 75 • 1