openllama3b, дообученная на 12B токенов из вики\оскара, датасете Ильи Гусева, также прошедшая DPO fine-tune на rulm/human-preferences. Модель стала более творческой, но менее правильной. Более склонна придумать несуществующие вещи. Но общаться стало интереснее, также реже вставляет токены типа [\INST] (почти никогда).
- Downloads last month
- 9
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support