Egor-AI
/

ZeroAgency_o1_t-lite-it-1.0_lora_gguf

Inference Endpoints

Model card Files Files and versions Community

Egor-AI commited on Jan 4

Commit

4e6ff44

·

verified ·

1 Parent(s): 28ab703

Update README.md

Files changed (1) hide show

README.md +23 -1

README.md CHANGED Viewed

@@ -8,4 +8,26 @@ language:
 base_model:
 - t-tech/T-lite-it-1.0
 - ZeroAgency/o1_t-lite-it-1.0_lora
----

 base_model:
 - t-tech/T-lite-it-1.0
 - ZeroAgency/o1_t-lite-it-1.0_lora
+---
+Russian o1 / T-lite-it-1.0 LoRA GGUF
+Based on https://huggingface.co/evilfreelancer/o1_t-lite-it-1.0_lora
+LoRA-адаптер для модели T-lite-it-1.0 обученный на датасете Egor-AI/Russian_thinking_dataset (машинный перевод на русский язык датасета BintangFortuna/OpenO1-SFT-EN-SY).
+Обученная модель способна имитировать логические размышлению на русском языке по аналогии с тем, как это делает o1 от OpenAI.
+Необходимо использовать следующего вида системный промт:
+```
+Вы — ИИ-помощник. Отформатируйте свои ответы следующим образом: <Thought> Ваши мысли (понимание, рассуждения) </Thought> <output> Ваш ответ </output>
+Обучение производилось при помощи утилиты impruver используя конфигурацию T-lite-it/7B_lora_thinking с донастройкой:```
+load_in_4bit: false
+без max_tokens_count
+optim: adamw_8bit
+gradient_accumulation_steps: 1
+На всё про всё ушло примерно 17.6 часов на 1xH100 80GB, при этом понадобилось 67Гб видеопамяти.
+Результатирующий eval_loss: 0.5200754404067993
+W&B run: https://wandb.ai/b37h3z3n/trains/runs/6vwvuu46?nw=nwuserb37h3z3n