🧠 DistilBERT for Jailbreak Detection

Модель на основе DistilBERT для обнаружения попыток обхода фильтров (jailbreak) в текстах.

📚 Детали модели

  • Архитектура: DistilBERT
  • Задача: Классификация текста (обнаружение jailbreak)
  • Входные данные: Текстовые строки
  • Выходные данные: Метка класса (например, jailbreak или safe)
Downloads last month
1,543
Safetensors
Model size
67M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for Necent/distilbert-base-uncased-detected-jailbreak

Finetuned
(8702)
this model