Update README.md
Browse files
README.md
CHANGED
@@ -9,28 +9,96 @@ base_model: openchat/openchat-3.5-1210
|
|
9 |
model-index:
|
10 |
- name: summarization_model
|
11 |
results: []
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
---
|
13 |
|
14 |
<!-- This model card has been generated automatically according to the information the Trainer had access to. You
|
15 |
should probably proofread and complete it, then remove this comment. -->
|
16 |
|
17 |
-
#
|
18 |
|
19 |
-
This model is a fine-tuned version of [openchat/openchat-3.5-1210](https://huggingface.co/openchat/openchat-3.5-1210)
|
20 |
|
21 |
## Model description
|
22 |
|
23 |
-
|
24 |
-
|
25 |
-
|
26 |
-
|
27 |
-
|
28 |
-
|
29 |
-
|
30 |
-
|
31 |
-
|
32 |
-
|
33 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
34 |
|
35 |
### Training hyperparameters
|
36 |
|
@@ -46,7 +114,7 @@ The following hyperparameters were used during training:
|
|
46 |
- num_epochs: 3.0
|
47 |
|
48 |
### Training results
|
49 |
-
|
50 |
|
51 |
|
52 |
### Framework versions
|
|
|
9 |
model-index:
|
10 |
- name: summarization_model
|
11 |
results: []
|
12 |
+
datasets:
|
13 |
+
- d0rj/samsum-ru
|
14 |
+
- zjkarina/matreshka
|
15 |
+
- rcp-meetings/rudialogsum_v2
|
16 |
+
language:
|
17 |
+
- ru
|
18 |
---
|
19 |
|
20 |
<!-- This model card has been generated automatically according to the information the Trainer had access to. You
|
21 |
should probably proofread and complete it, then remove this comment. -->
|
22 |
|
23 |
+
# ru_summarization_model
|
24 |
|
25 |
+
This model is a fine-tuned version of [openchat/openchat-3.5-1210](https://huggingface.co/openchat/openchat-3.5-1210) for summarization russian dialogs.
|
26 |
|
27 |
## Model description
|
28 |
|
29 |
+
Please use opencha3.5 template for inference.
|
30 |
+
|
31 |
+
Ты грамотный суммаризатор. Верни суммаризацию по диалогу между клиентом и оператором<|end_of_turn|>GPT4 Correct User:
|
32 |
+
...Диалог...
|
33 |
+
\nСуммаризация диалога:\n<|end_of_turn|>GPT4 Correct Assistant:
|
34 |
+
|
35 |
+
**Пример диалога**
|
36 |
+
|
37 |
+
```
|
38 |
+
Ты грамотный суммаризатор. Верни суммаризацию по диалогу между клиентом и оператором<|end_of_turn|>GPT4 Correct User:
|
39 |
+
Оператор: здравствуйте вас приветствует компания ростелеком вас приветствует премиальная служба ростелеком
|
40 |
+
Клиент: и
|
41 |
+
Оператор: ха
|
42 |
+
Оператор: специалисты центра компании ростелеком здравствуйте чем могу вам помочь
|
43 |
+
Клиент: здравствуйте
|
44 |
+
Клиент: писали в доме свет и от этого роутер не может подключиться к сети ростелекома пишет
|
45 |
+
Клиент: пережиток ------ стариком
|
46 |
+
Оператор: подскажите пожалуйста вы выполнили рентгеновского ротора
|
47 |
+
Оператор: питание на пять минут
|
48 |
+
Оператор: номер вашего лицевого счета подскажите
|
49 |
+
Клиент: -------
|
50 |
+
Клиент: -------
|
51 |
+
Клиент: -------
|
52 |
+
Клиент: -------
|
53 |
+
Клиент: -------
|
54 |
+
Клиент: и фамилию носит пожалуйста подскажите находит -------
|
55 |
+
Оператор: сейчас проверяем наличие аварий пожалуйста подождите не отключайтесь две минуты
|
56 |
+
Оператор: благодарю за ожидание уточните пожалуйста ваш контактный номер телефона и направленности масса технической поддержки персональному менеджеру вижу что у вас саладина не должно быть
|
57 |
+
Оператор: системе их нет
|
58 |
+
Клиент: -------
|
59 |
+
Оператор: -------
|
60 |
+
Оператор: -------
|
61 |
+
Клиент: -------
|
62 |
+
Оператор: -------
|
63 |
+
Оператор: вы оскорбляли линию то есть у вас сейчас указывалось что у вас совсем соединение есть окно активное у меня указано то у меня мощность сигнала минус двадцать шесть
|
64 |
+
Клиент: но я получается
|
65 |
+
Клиент: перед опустил его у меня открылась страница роутера в которой написано было что производится автоматическая
|
66 |
+
Клиент: настройка она покрутилась где-то какое-то время и после этого выдала что невозможно подключиться к сети ростелекома
|
67 |
+
Оператор: не восприняла хорошо эту информацию заявки ухожу
|
68 |
+
Оператор: точнее часто ориентировочно специалист с вами свяжется ожидайте пожалуйста
|
69 |
+
Оператор: всего доброго до свидания
|
70 |
+
|
71 |
+
\nСуммаризация диалога:\n<|end_of_turn|>GPT4 Correct Assistant:
|
72 |
+
```
|
73 |
+
|
74 |
+
**Ответ нейросети**
|
75 |
+
|
76 |
+
```
|
77 |
+
Клиент: сообщает, что роутер не может подключиться к сети ростелекома,
|
78 |
+
а Оператор: проверяет его и сообщает, что у него нет сигнала.
|
79 |
+
Клиент: сообщает свой номер лицевого счета и контактный номер телефона,
|
80 |
+
но Оператор: не может найти проблему.
|
81 |
+
В конце концов, Оператор: просит Клиент: подождать, пока специалист свяжется с ним.
|
82 |
+
```
|
83 |
+
|
84 |
+
**PS.**
|
85 |
+
_Диалог распознан системой vosk-0.42_
|
86 |
+
|
87 |
+
|
88 |
+
**Запуск демо через LLaMA_Factory**
|
89 |
+
|
90 |
+
```
|
91 |
+
python src/web_demo.py \
|
92 |
+
--model_name_or_path openchat/openchat-3.5-1210 \
|
93 |
+
--adapter_name_or_path bogdal/ru_openchat3.5-1210_summarization_adapter \
|
94 |
+
--template openchat \
|
95 |
+
--finetuning_type lora \
|
96 |
+
--quantization_bit 8 \
|
97 |
+
```
|
98 |
+
|
99 |
+
в интерфейсе необходимо внести системный промпт - "Ты грамотный суммаризатор. Верни суммаризацию по диалогу между клиентом и оператором"
|
100 |
+
и чистый диалог без добавочных токенов, оканчивающийся фразой
|
101 |
+
"\nСуммаризация диалога:"
|
102 |
|
103 |
### Training hyperparameters
|
104 |
|
|
|
114 |
- num_epochs: 3.0
|
115 |
|
116 |
### Training results
|
117 |
+
- loss: 0.4716
|
118 |
|
119 |
|
120 |
### Framework versions
|