🧠 DistilBERT for Jailbreak Detection
Модель на основе DistilBERT для обнаружения попыток обхода фильтров (jailbreak) в текстах.
📚 Детали модели
- Архитектура: DistilBERT
- Задача: Классификация текста (обнаружение jailbreak)
- Входные данные: Текстовые строки
- Выходные данные: Метка класса (например,
jailbreak
илиsafe
)
- Downloads last month
- 1,543
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support
Model tree for Necent/distilbert-base-uncased-detected-jailbreak
Base model
distilbert/distilbert-base-uncased