Edit Models filters

Model Tree

RLHFlow/LLaMA3-SFT-v2

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

5

Full-text search

Active filters: RLHFlow/LLaMA3-SFT-v2

yyqoni/rlhflow-llama-3-sft-8b-v2-segment-rm-700k

Text Classification • 8B • Updated Jan 8 • 9

yyqoni/rlhflow-llama-3-sft-8b-v2-token-rm-700k

Text Classification • 8B • Updated Jan 8 • 10

yyqoni/rlhflow-llama-3-sft-8b-v2-segment-ppo-60k

Text Generation • 8B • Updated Jan 8 • 44

yyqoni/rlhflow-llama-3-sft-8b-v2-token-ppo-60k

Text Generation • 8B • Updated Jan 8 • 7

yyqoni/rlhflow-llama-3-sft-8b-v2-bandit-ppo-60k

Text Generation • 8B • Updated Jan 8 • 84