openllama3b, дообученная на 12B токенов из вики\оскара, датасете Ильи Гусева, также прошедшая DPO fine-tune на rulm/human-preferences. Модель стала более творческой, но менее правильной. Более склонна придумать несуществующие вещи. Но общаться стало интереснее, также реже вставляет токены типа [\INST] (почти никогда).

Downloads last month: 1