Update README.md
Browse files
README.md
CHANGED
@@ -192,7 +192,7 @@ out_of_domain - вопросы которые специально никак н
|
|
192 |
|
193 |
Реализацию SMPO, rejection sampling и тд можно найти в нашей библиотеке [effective_llm_alignment](https://github.com/VikhrModels/effective_llm_alignment/) на GitHub
|
194 |
|
195 |
-
Идея использования именно SMPO, а не другого PO метода, возникла в результате проведения большого количества экспериментов с классическими методами, при необходимости лучшего контроля процесса сходимости. При использовании разных гиперпараметров в разных методах, можно добится почти
|
196 |
|
197 |
### Как работать с RAG
|
198 |
|
|
|
192 |
|
193 |
Реализацию SMPO, rejection sampling и тд можно найти в нашей библиотеке [effective_llm_alignment](https://github.com/VikhrModels/effective_llm_alignment/) на GitHub
|
194 |
|
195 |
+
Идея использования именно SMPO, а не другого PO метода, возникла в результате проведения большого количества экспериментов с классическими методами, при необходимости лучшего контроля процесса сходимости. При использовании разных гиперпараметров в разных методах, можно добится почти одинакового результата оптимизации, однако мы постарались упростить этот процесс и объединить лучшие практики из других методов.
|
196 |
|
197 |
### Как работать с RAG
|
198 |
|