Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

146

Full-text search

Active filters: rl

ContextualAI/archangel_sft-ppo_llama7b

Text Generation • 7B • Updated Jan 11, 2024 • 13

ContextualAI/archangel_sft-ppo_llama13b

Text Generation • 13B • Updated Jan 11, 2024 • 9

ContextualAI/archangel_sft-ppo_llama30b

Text Generation • 33B • Updated Jan 11, 2024 • 11

ContextualAI/archangel_sft-csft_pythia1-4b

Text Generation • 1B • Updated Jan 11, 2024 • 7

ContextualAI/archangel_sft-slic_pythia1-4b

Text Generation • 1B • Updated Jan 11, 2024 • 6

ContextualAI/archangel_csft_pythia1-4b

Text Generation • 1B • Updated Jan 11, 2024 • 11

ContextualAI/archangel_sft-csft_pythia2-8b

Text Generation • 3B • Updated Jan 11, 2024 • 9

ContextualAI/archangel_sft-slic_pythia2-8b

Text Generation • 3B • Updated Jan 11, 2024 • 8

ContextualAI/archangel_csft_pythia2-8b

Text Generation • 3B • Updated Jan 11, 2024 • 7 • 2

ContextualAI/archangel_sft-csft_pythia6-9b

Text Generation • 7B • Updated Jan 11, 2024 • 10

ContextualAI/archangel_sft-slic_pythia6-9b

Text Generation • 7B • Updated Jan 11, 2024 • 9

ContextualAI/archangel_csft_pythia6-9b

Text Generation • 7B • Updated Jan 11, 2024 • 7

ContextualAI/archangel_sft-csft_pythia12-0b

Text Generation • 12B • Updated Jan 11, 2024 • 8

ContextualAI/archangel_sft-slic_pythia12-0b

Text Generation • 12B • Updated Jan 11, 2024 • 11

ContextualAI/archangel_csft_pythia12-0b

Text Generation • 12B • Updated Jan 11, 2024 • 11

ContextualAI/archangel_sft-csft_llama7b

Text Generation • 7B • Updated Jan 11, 2024 • 15

ContextualAI/archangel_sft-slic_llama7b

Text Generation • 7B • Updated Jan 11, 2024 • 11

ContextualAI/archangel_csft_llama7b

Text Generation • 7B • Updated Jan 11, 2024 • 7

ContextualAI/archangel_sft-csft_llama13b

Text Generation • 13B • Updated Jan 11, 2024 • 7

ContextualAI/archangel_sft-slic_llama13b

Text Generation • 13B • Updated Jan 11, 2024 • 7

ContextualAI/archangel_csft_llama13b

Text Generation • 13B • Updated Jan 11, 2024 • 10

ContextualAI/archangel_sft-csft_llama30b

Text Generation • 33B • Updated Jan 11, 2024 • 7

ContextualAI/archangel_csft_llama30b

Text Generation • 33B • Updated Jan 11, 2024 • 9

rbgo/Super-phi-2-dpo

Text Generation • 3B • Updated Jan 18, 2024 • 12 • 1

ContextualAI/Contextual_KTO_Mistral_PairRM

Text Generation • 7B • Updated Apr 26, 2024 • 30 • 31

asedmammad/Contextual_KTO_Mistral_PairRM-GGUF

7B • Updated Mar 11, 2024 • 362 • 2

mradermacher/archangel_sft-kto_llama30b-GGUF

33B • Updated May 31, 2024 • 236 • 1

mradermacher/archangel_sft-kto_llama30b-i1-GGUF

33B • Updated Aug 2, 2024 • 278

lithiumice/motion_imitation

tristan-deep/dqn-needle-tracker

Reinforcement Learning • Updated Sep 10, 2024 • 1 • 1