Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

189

Full-text search

Active filters: torchao

gurro/llama-3.1-8B-torchao-int4wo-256

Text Generation • Updated Dec 2, 2024 • 22

jerryzh168/llama3-8b-autoquant

Text Generation • Updated Feb 19 • 26

medmekk/Llama-3.1-8B-Instruct-torchao-int8_weight_only

Updated Jan 8 • 6

medmekk/Llama-3.1-8B-Instruct-torchao-int8wo

Updated Jan 8 • 13

medmekk/Llama-3.1-8B-Instruct-torchao-int8da8w

Updated Jan 8 • 7

medmekk/Llama-3.2-3B-Instruct-torchao-int8wo

Updated Jan 8 • 7

medmekk/Llama-3.2-1B-torchao-int8wo

Updated Jan 8 • 5

medmekk/Llama-3.2-1B-torchao-int8da8w

Updated Jan 8 • 5

medmekk/Llama-3.2-3B-Instruct-torchao-int8da8w

Updated Jan 8 • 14

medmekk/Llama-3.1-70B-Instruct-torchao-int8da8w

Updated Jan 8 • 24

jerryzh168/Meta-Llama-3-8B-torchao-int8_weight_only

Updated Jan 13 • 25

jerryzh168/Meta-Llama-3-8B-torchao-int4_weight_only-gs_128

Updated Jan 13 • 6

jerryzh168/Meta-Llama-3-8B-torchao-int4_weight_only-gs_64

Updated Jan 13 • 7

HF-Quantization/Llama-3.2-1B-TORCHAO-W8

Updated Jan 21 • 6

HF-Quantization/Llama-3.2-1B-TORCHAO-W8A8

Updated Jan 21 • 52

HF-Quantization/Llama-3.2-1B-TORCHAO-W4

Updated Jan 21 • 8

HF-Quantization/Llama-3.3-70B-Instruct-TORCHAO-W4

Updated Jan 22 • 20

jpablomch/Meta-Llama-3-8B-Instruct-torchao

Text Generation • Updated Feb 19 • 8

jerryzh168/llama3-8b-int4wo-128

Text Generation • Updated Feb 21 • 6

jerryzh168/llama3-8b-int8wo

Text Generation • Updated Feb 27 • 7

alpindale/Meta-Llama-3-8B-torchao-int8_weight_only

Updated Mar 2 • 10

drisspg/f8a8-opt-125m

Text Generation • Updated Mar 4 • 15

drisspg/f8a8-opt-125m_2

Text Generation • Updated Mar 5 • 9

drisspg/float8_dynamic_act_float8_weight-opt-125m

Text Generation • Updated Mar 19 • 39

marksaroufim/Meta-Llama-3-8B-torchao-int8_weight_only

Updated Mar 20 • 7

jerryzh168/llama3-int8wo

Text Generation • Updated Mar 20 • 16

jerryzh168/llama3-int4wo

Text Generation • Updated Mar 21 • 4

jerryzh168/gemma3-8da4w

Image-Text-to-Text • Updated Mar 25 • 8

jerryzh168/gemma3-4b-it-float8dq

Image-Text-to-Text • Updated Mar 26 • 3

vymenets/yv-llama-quantized

Text Generation • Updated Mar 26 • 16