Update README.md
Browse files
README.md
CHANGED
@@ -54,8 +54,11 @@
|
|
54 |
- **Заморозка:** последние 25 слоев модели
|
55 |
- **TRL:** не использовался (False)
|
56 |
- **Наблюдения:**
|
57 |
-
Модель успешно адаптировалась к специфике обучающих данных, запомнив общее содержание. Однако наблюдалась потеря диалоговой структуры: модель «сливалась» с документом и не обеспечивала точное завершение диалога.
|
58 |
|
|
|
|
|
|
|
|
|
59 |
### Эксперимент 2
|
60 |
|
61 |
- **Данные:** Синтетический набор из 2055 диалогов, где формат включает вопрос, ответ и контекст с доказательством.
|
@@ -70,6 +73,8 @@
|
|
70 |
|
71 |
### Функция потерь
|
72 |
|
|
|
|
|
73 |
В обоих экспериментах использовалась стандартная **CrossEntropy Loss**, что позволило обеспечить стабильное снижение ошибки на протяжении обучения.
|
74 |
|
75 |
### Training Infrastructure
|
|
|
54 |
- **Заморозка:** последние 25 слоев модели
|
55 |
- **TRL:** не использовался (False)
|
56 |
- **Наблюдения:**
|
|
|
57 |
|
58 |
+

|
59 |
+
|
60 |
+
Модель успешно адаптировалась к специфике обучающих данных, запомнив общее содержание. Однако наблюдалась потеря диалоговой структуры: модель «сливалась» с документом и не обеспечивала точное завершение диалога.
|
61 |
+

|
62 |
### Эксперимент 2
|
63 |
|
64 |
- **Данные:** Синтетический набор из 2055 диалогов, где формат включает вопрос, ответ и контекст с доказательством.
|
|
|
73 |
|
74 |
### Функция потерь
|
75 |
|
76 |
+
|
77 |
+
|
78 |
В обоих экспериментах использовалась стандартная **CrossEntropy Loss**, что позволило обеспечить стабильное снижение ошибки на протяжении обучения.
|
79 |
|
80 |
### Training Infrastructure
|