J. Pablo Munoz's picture

3 46

J. Pablo Munoz

jpablomch

·

AI & ML interests

None yet

Organizations

authored 3 papers 11 months ago

The Landscape and Challenges of HPC Research and LLMs

Paper • 2402.02018 • Published Feb 3, 2024

SQFT: Low-cost Model Adaptation in Low-precision Sparse Foundation Models

Paper • 2410.03750 • Published Oct 1, 2024 • 2

Mamba-Shedder: Post-Transformer Compression for Efficient Selective Structured State Space Models

Paper • 2501.17088 • Published Jan 28, 2025 • 2

authored a paper 12 months ago

Low-Rank Adapters Meet Neural Architecture Search for LLM Compression

Paper • 2501.16372 • Published Jan 23, 2025 • 12

authored 2 papers over 1 year ago

Shears: Unstructured Sparsity with Neural Low-rank Adapter Search

Paper • 2404.10934 • Published Apr 16, 2024

A Hardware-Aware Framework for Accelerating Neural Architecture Search Across Modalities

Paper • 2205.10358 • Published May 19, 2022