artiert commited on
Commit
a0d32b1
·
verified ·
1 Parent(s): 0edf4ec

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +6 -1
README.md CHANGED
@@ -54,8 +54,11 @@
54
  - **Заморозка:** последние 25 слоев модели
55
  - **TRL:** не использовался (False)
56
  - **Наблюдения:**
57
- Модель успешно адаптировалась к специфике обучающих данных, запомнив общее содержание. Однако наблюдалась потеря диалоговой структуры: модель «сливалась» с документом и не обеспечивала точное завершение диалога.
58
 
 
 
 
 
59
  ### Эксперимент 2
60
 
61
  - **Данные:** Синтетический набор из 2055 диалогов, где формат включает вопрос, ответ и контекст с доказательством.
@@ -70,6 +73,8 @@
70
 
71
  ### Функция потерь
72
 
 
 
73
  В обоих экспериментах использовалась стандартная **CrossEntropy Loss**, что позволило обеспечить стабильное снижение ошибки на протяжении обучения.
74
 
75
  ### Training Infrastructure
 
54
  - **Заморозка:** последние 25 слоев модели
55
  - **TRL:** не использовался (False)
56
  - **Наблюдения:**
 
57
 
58
+ ![image/png](https://cdn-uploads.huggingface.co/production/uploads/653fdf8e48491e1fde154812/R4eLRkvPX3KkSupjdZy1y.png)
59
+
60
+ Модель успешно адаптировалась к специфике обучающих данных, запомнив общее содержание. Однако наблюдалась потеря диалоговой структуры: модель «сливалась» с документом и не обеспечивала точное завершение диалога.
61
+ ![image/png](https://cdn-uploads.huggingface.co/production/uploads/653fdf8e48491e1fde154812/LrhCE2V9OFASnH7o8h1ii.png)
62
  ### Эксперимент 2
63
 
64
  - **Данные:** Синтетический набор из 2055 диалогов, где формат включает вопрос, ответ и контекст с доказательством.
 
73
 
74
  ### Функция потерь
75
 
76
+
77
+
78
  В обоих экспериментах использовалась стандартная **CrossEntropy Loss**, что позволило обеспечить стабильное снижение ошибки на протяжении обучения.
79
 
80
  ### Training Infrastructure