nm-testing
/

SparseLlama-3-8B-pruned_50.2of4-FP8

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

SparseLlama-3-8B-pruned_50.2of4-FP8

2 contributors

History: 7 commits

alexmarques's picture

Update README.md

6f677cc verified 5 months ago