Edit Models filters

Inference Providers

Nebius AI Studio

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Misc with no match

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

34

Full-text search

Active filters: reward_model

LemiSt/PairRM-mdeberta-v3-base

Text Generation • Updated Sep 25, 2024 • 24

Huanghz/align2llava-7b-lora-question

Updated 17 days ago • 4

Huanghz/align2llava-7b-lora-answer

Updated 17 days ago • 4

il-pugin/hse-prog-task-transformer-reward-model

Reinforcement Learning • Updated 11 days ago • 54