AngelPanizo commited on
Commit
9a4ca31
·
verified ·
1 Parent(s): 2d3af1a

Add BERTopic model

Browse files
README.md ADDED
@@ -0,0 +1,78 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+
2
+ ---
3
+ tags:
4
+ - bertopic
5
+ library_name: bertopic
6
+ pipeline_tag: text-classification
7
+ ---
8
+
9
+ # MARTINI_enrich_BERTopic_gerasveikata
10
+
11
+ This is a [BERTopic](https://github.com/MaartenGr/BERTopic) model.
12
+ BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
13
+
14
+ ## Usage
15
+
16
+ To use this model, please install BERTopic:
17
+
18
+ ```
19
+ pip install -U bertopic
20
+ ```
21
+
22
+ You can use the model as follows:
23
+
24
+ ```python
25
+ from bertopic import BERTopic
26
+ topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_gerasveikata")
27
+
28
+ topic_model.get_topic_info()
29
+ ```
30
+
31
+ ## Topic overview
32
+
33
+ * Number of topics: 9
34
+ * Number of training documents: 1037
35
+
36
+ <details>
37
+ <summary>Click here for an overview of all topics.</summary>
38
+
39
+ | Topic ID | Topic Keywords | Topic Frequency | Label |
40
+ |----------|----------------|-----------------|-------|
41
+ | -1 | vakcinas - nustatyti - pfizer - 2021 - ukrainos | 20 | -1_vakcinas_nustatyti_pfizer_2021 |
42
+ | 0 | konstitucijai - konstituciniu - nustatyti - respublikos - reikalavimas | 693 | 0_konstitucijai_konstituciniu_nustatyti_respublikos |
43
+ | 1 | taisykliu - pasitikejimas - reikalauja - iliuzija - galimybiu | 63 | 1_taisykliu_pasitikejimas_reikalauja_iliuzija |
44
+ | 2 | vakcinavimas - injekcija - susitvarkyti - sertifikatu - virusa | 60 | 2_vakcinavimas_injekcija_susitvarkyti_sertifikatu |
45
+ | 3 | koronavirusu - virusologijos - laboratorijoje - institutas - ekspertai | 51 | 3_koronavirusu_virusologijos_laboratorijoje_institutas |
46
+ | 4 | pfizer - vakcinas - fda - 2021 - dokumentu | 50 | 4_pfizer_vakcinas_fda_2021 |
47
+ | 5 | vaers - omicron - 2021 - nepageidaujami - skaicius | 46 | 5_vaers_omicron_2021_nepageidaujami |
48
+ | 6 | vakcinacija - израиля - izraeliui - kampanija - issamiai | 28 | 6_vakcinacija_израиля_izraeliui_kampanija |
49
+ | 7 | virusus - bakterijas - patogenai - imunine - mikroskopa | 26 | 7_virusus_bakterijas_patogenai_imunine |
50
+
51
+ </details>
52
+
53
+ ## Training hyperparameters
54
+
55
+ * calculate_probabilities: True
56
+ * language: None
57
+ * low_memory: False
58
+ * min_topic_size: 10
59
+ * n_gram_range: (1, 1)
60
+ * nr_topics: None
61
+ * seed_topic_list: None
62
+ * top_n_words: 10
63
+ * verbose: False
64
+ * zeroshot_min_similarity: 0.7
65
+ * zeroshot_topic_list: None
66
+
67
+ ## Framework versions
68
+
69
+ * Numpy: 1.26.4
70
+ * HDBSCAN: 0.8.40
71
+ * UMAP: 0.5.7
72
+ * Pandas: 2.2.3
73
+ * Scikit-Learn: 1.5.2
74
+ * Sentence-transformers: 3.3.1
75
+ * Transformers: 4.46.3
76
+ * Numba: 0.60.0
77
+ * Plotly: 5.24.1
78
+ * Python: 3.10.12
config.json ADDED
@@ -0,0 +1,16 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "calculate_probabilities": true,
3
+ "language": null,
4
+ "low_memory": false,
5
+ "min_topic_size": 10,
6
+ "n_gram_range": [
7
+ 1,
8
+ 1
9
+ ],
10
+ "nr_topics": null,
11
+ "seed_topic_list": null,
12
+ "top_n_words": 10,
13
+ "verbose": false,
14
+ "zeroshot_min_similarity": 0.7,
15
+ "zeroshot_topic_list": null
16
+ }
ctfidf.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:39ba9ff85d91198ad1966feb8e1574aad42e51c78104003e723e1782ee9e4095
3
+ size 792236
ctfidf_config.json ADDED
The diff for this file is too large to render. See raw diff
 
topic_embeddings.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:bfd16770125fa43deeb11d8a1c4c0ef30b5e2264c40513d48ad7c6fedd9461d9
3
+ size 36952
topics.json ADDED
@@ -0,0 +1,1313 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "topic_representations": {
3
+ "-1": [
4
+ [
5
+ "vakcinas",
6
+ 0.521202027797699
7
+ ],
8
+ [
9
+ "nustatyti",
10
+ 0.48181068897247314
11
+ ],
12
+ [
13
+ "pfizer",
14
+ 0.48007991909980774
15
+ ],
16
+ [
17
+ "2021",
18
+ 0.4662255048751831
19
+ ],
20
+ [
21
+ "ukrainos",
22
+ 0.4399392604827881
23
+ ]
24
+ ],
25
+ "0": [
26
+ [
27
+ "konstitucijai",
28
+ 0.5615055561065674
29
+ ],
30
+ [
31
+ "konstituciniu",
32
+ 0.5402188301086426
33
+ ],
34
+ [
35
+ "nustatyti",
36
+ 0.4878845512866974
37
+ ],
38
+ [
39
+ "respublikos",
40
+ 0.4623505473136902
41
+ ],
42
+ [
43
+ "reikalavimas",
44
+ 0.45072489976882935
45
+ ]
46
+ ],
47
+ "1": [
48
+ [
49
+ "taisykliu",
50
+ 0.4932735562324524
51
+ ],
52
+ [
53
+ "pasitikejimas",
54
+ 0.4826824367046356
55
+ ],
56
+ [
57
+ "reikalauja",
58
+ 0.4754889905452728
59
+ ],
60
+ [
61
+ "iliuzija",
62
+ 0.4714820683002472
63
+ ],
64
+ [
65
+ "galimybiu",
66
+ 0.455499529838562
67
+ ]
68
+ ],
69
+ "2": [
70
+ [
71
+ "vakcinavimas",
72
+ 0.5818130373954773
73
+ ],
74
+ [
75
+ "injekcija",
76
+ 0.4809757471084595
77
+ ],
78
+ [
79
+ "susitvarkyti",
80
+ 0.4798583686351776
81
+ ],
82
+ [
83
+ "sertifikatu",
84
+ 0.43736109137535095
85
+ ],
86
+ [
87
+ "virusa",
88
+ 0.4326319396495819
89
+ ]
90
+ ],
91
+ "3": [
92
+ [
93
+ "koronavirusu",
94
+ 0.5562514662742615
95
+ ],
96
+ [
97
+ "virusologijos",
98
+ 0.4924306869506836
99
+ ],
100
+ [
101
+ "laboratorijoje",
102
+ 0.4119345247745514
103
+ ],
104
+ [
105
+ "institutas",
106
+ 0.40926629304885864
107
+ ],
108
+ [
109
+ "ekspertai",
110
+ 0.40484166145324707
111
+ ]
112
+ ],
113
+ "4": [
114
+ [
115
+ "pfizer",
116
+ 0.5952624082565308
117
+ ],
118
+ [
119
+ "vakcinas",
120
+ 0.518334686756134
121
+ ],
122
+ [
123
+ "fda",
124
+ 0.45410722494125366
125
+ ],
126
+ [
127
+ "2021",
128
+ 0.4438851773738861
129
+ ],
130
+ [
131
+ "dokumentu",
132
+ 0.40243154764175415
133
+ ]
134
+ ],
135
+ "5": [
136
+ [
137
+ "vaers",
138
+ 0.5371909737586975
139
+ ],
140
+ [
141
+ "omicron",
142
+ 0.4740138053894043
143
+ ],
144
+ [
145
+ "2021",
146
+ 0.44984734058380127
147
+ ],
148
+ [
149
+ "nepageidaujami",
150
+ 0.42586302757263184
151
+ ],
152
+ [
153
+ "skaicius",
154
+ 0.4056497812271118
155
+ ]
156
+ ],
157
+ "6": [
158
+ [
159
+ "vakcinacija",
160
+ 0.56708163022995
161
+ ],
162
+ [
163
+ "\u0438\u0437\u0440\u0430\u0438\u043b\u044f",
164
+ 0.510813295841217
165
+ ],
166
+ [
167
+ "izraeliui",
168
+ 0.49989914894104004
169
+ ],
170
+ [
171
+ "kampanija",
172
+ 0.4033573567867279
173
+ ],
174
+ [
175
+ "issamiai",
176
+ 0.39607828855514526
177
+ ]
178
+ ],
179
+ "7": [
180
+ [
181
+ "virusus",
182
+ 0.5716338157653809
183
+ ],
184
+ [
185
+ "bakterijas",
186
+ 0.5028774738311768
187
+ ],
188
+ [
189
+ "patogenai",
190
+ 0.48432260751724243
191
+ ],
192
+ [
193
+ "imunine",
194
+ 0.4504358768463135
195
+ ],
196
+ [
197
+ "mikroskopa",
198
+ 0.4417724013328552
199
+ ]
200
+ ]
201
+ },
202
+ "topics": [
203
+ -1,
204
+ 2,
205
+ 2,
206
+ 5,
207
+ -1,
208
+ -1,
209
+ -1,
210
+ -1,
211
+ -1,
212
+ -1,
213
+ -1,
214
+ 4,
215
+ -1,
216
+ -1,
217
+ 2,
218
+ -1,
219
+ -1,
220
+ -1,
221
+ 4,
222
+ -1,
223
+ -1,
224
+ -1,
225
+ -1,
226
+ 3,
227
+ -1,
228
+ -1,
229
+ -1,
230
+ 1,
231
+ -1,
232
+ -1,
233
+ -1,
234
+ -1,
235
+ -1,
236
+ -1,
237
+ 4,
238
+ 4,
239
+ -1,
240
+ -1,
241
+ -1,
242
+ -1,
243
+ -1,
244
+ 4,
245
+ -1,
246
+ -1,
247
+ 4,
248
+ -1,
249
+ -1,
250
+ -1,
251
+ -1,
252
+ -1,
253
+ -1,
254
+ -1,
255
+ -1,
256
+ -1,
257
+ -1,
258
+ -1,
259
+ 1,
260
+ -1,
261
+ 3,
262
+ -1,
263
+ -1,
264
+ -1,
265
+ -1,
266
+ -1,
267
+ -1,
268
+ 2,
269
+ -1,
270
+ 4,
271
+ -1,
272
+ -1,
273
+ 0,
274
+ 1,
275
+ -1,
276
+ 1,
277
+ -1,
278
+ -1,
279
+ 1,
280
+ 1,
281
+ 4,
282
+ 3,
283
+ -1,
284
+ -1,
285
+ -1,
286
+ -1,
287
+ 3,
288
+ -1,
289
+ -1,
290
+ -1,
291
+ -1,
292
+ -1,
293
+ -1,
294
+ 3,
295
+ 3,
296
+ -1,
297
+ -1,
298
+ -1,
299
+ 1,
300
+ -1,
301
+ 4,
302
+ -1,
303
+ -1,
304
+ -1,
305
+ 0,
306
+ -1,
307
+ -1,
308
+ -1,
309
+ -1,
310
+ 4,
311
+ 4,
312
+ 6,
313
+ -1,
314
+ 3,
315
+ -1,
316
+ 0,
317
+ -1,
318
+ -1,
319
+ -1,
320
+ -1,
321
+ -1,
322
+ -1,
323
+ -1,
324
+ -1,
325
+ -1,
326
+ -1,
327
+ -1,
328
+ -1,
329
+ -1,
330
+ 5,
331
+ -1,
332
+ 2,
333
+ 7,
334
+ -1,
335
+ 0,
336
+ -1,
337
+ 0,
338
+ 4,
339
+ -1,
340
+ 3,
341
+ -1,
342
+ -1,
343
+ 0,
344
+ -1,
345
+ -1,
346
+ -1,
347
+ -1,
348
+ 0,
349
+ -1,
350
+ -1,
351
+ -1,
352
+ -1,
353
+ 4,
354
+ -1,
355
+ -1,
356
+ -1,
357
+ -1,
358
+ -1,
359
+ -1,
360
+ -1,
361
+ -1,
362
+ -1,
363
+ -1,
364
+ -1,
365
+ -1,
366
+ -1,
367
+ -1,
368
+ -1,
369
+ -1,
370
+ -1,
371
+ -1,
372
+ -1,
373
+ -1,
374
+ -1,
375
+ -1,
376
+ -1,
377
+ -1,
378
+ -1,
379
+ -1,
380
+ -1,
381
+ -1,
382
+ 3,
383
+ -1,
384
+ -1,
385
+ -1,
386
+ -1,
387
+ -1,
388
+ -1,
389
+ -1,
390
+ -1,
391
+ 0,
392
+ -1,
393
+ 3,
394
+ -1,
395
+ -1,
396
+ -1,
397
+ -1,
398
+ -1,
399
+ -1,
400
+ 4,
401
+ 0,
402
+ 7,
403
+ -1,
404
+ -1,
405
+ -1,
406
+ -1,
407
+ -1,
408
+ -1,
409
+ -1,
410
+ -1,
411
+ 0,
412
+ 0,
413
+ 0,
414
+ 0,
415
+ 3,
416
+ -1,
417
+ -1,
418
+ 2,
419
+ -1,
420
+ -1,
421
+ -1,
422
+ -1,
423
+ 0,
424
+ -1,
425
+ -1,
426
+ -1,
427
+ -1,
428
+ -1,
429
+ -1,
430
+ -1,
431
+ -1,
432
+ 3,
433
+ -1,
434
+ -1,
435
+ -1,
436
+ -1,
437
+ -1,
438
+ -1,
439
+ 1,
440
+ -1,
441
+ -1,
442
+ -1,
443
+ 7,
444
+ 6,
445
+ -1,
446
+ -1,
447
+ 4,
448
+ 4,
449
+ -1,
450
+ -1,
451
+ 5,
452
+ -1,
453
+ -1,
454
+ -1,
455
+ -1,
456
+ 2,
457
+ 2,
458
+ 1,
459
+ -1,
460
+ -1,
461
+ -1,
462
+ -1,
463
+ -1,
464
+ -1,
465
+ -1,
466
+ 4,
467
+ -1,
468
+ 2,
469
+ -1,
470
+ -1,
471
+ -1,
472
+ 4,
473
+ 1,
474
+ 5,
475
+ 2,
476
+ -1,
477
+ -1,
478
+ -1,
479
+ 4,
480
+ -1,
481
+ -1,
482
+ -1,
483
+ 2,
484
+ -1,
485
+ -1,
486
+ 4,
487
+ -1,
488
+ -1,
489
+ -1,
490
+ 1,
491
+ 7,
492
+ -1,
493
+ -1,
494
+ -1,
495
+ -1,
496
+ -1,
497
+ -1,
498
+ -1,
499
+ -1,
500
+ 5,
501
+ -1,
502
+ -1,
503
+ -1,
504
+ -1,
505
+ -1,
506
+ 1,
507
+ 2,
508
+ 5,
509
+ -1,
510
+ -1,
511
+ 1,
512
+ -1,
513
+ 1,
514
+ -1,
515
+ -1,
516
+ -1,
517
+ 4,
518
+ -1,
519
+ -1,
520
+ -1,
521
+ 4,
522
+ 2,
523
+ 1,
524
+ -1,
525
+ -1,
526
+ 1,
527
+ -1,
528
+ -1,
529
+ -1,
530
+ 5,
531
+ 1,
532
+ -1,
533
+ -1,
534
+ 5,
535
+ -1,
536
+ -1,
537
+ -1,
538
+ -1,
539
+ 4,
540
+ 4,
541
+ 4,
542
+ 4,
543
+ -1,
544
+ -1,
545
+ -1,
546
+ 4,
547
+ -1,
548
+ -1,
549
+ -1,
550
+ -1,
551
+ -1,
552
+ 3,
553
+ -1,
554
+ 0,
555
+ -1,
556
+ -1,
557
+ -1,
558
+ 2,
559
+ 4,
560
+ -1,
561
+ -1,
562
+ -1,
563
+ -1,
564
+ -1,
565
+ -1,
566
+ -1,
567
+ -1,
568
+ -1,
569
+ 6,
570
+ 4,
571
+ -1,
572
+ 2,
573
+ -1,
574
+ -1,
575
+ -1,
576
+ 5,
577
+ 5,
578
+ -1,
579
+ -1,
580
+ 3,
581
+ -1,
582
+ -1,
583
+ -1,
584
+ -1,
585
+ -1,
586
+ -1,
587
+ -1,
588
+ -1,
589
+ -1,
590
+ 4,
591
+ -1,
592
+ -1,
593
+ -1,
594
+ 7,
595
+ -1,
596
+ -1,
597
+ 0,
598
+ 4,
599
+ -1,
600
+ -1,
601
+ 1,
602
+ 1,
603
+ -1,
604
+ -1,
605
+ -1,
606
+ -1,
607
+ -1,
608
+ -1,
609
+ -1,
610
+ 1,
611
+ 4,
612
+ -1,
613
+ 5,
614
+ -1,
615
+ -1,
616
+ -1,
617
+ 1,
618
+ -1,
619
+ 2,
620
+ -1,
621
+ -1,
622
+ 5,
623
+ 5,
624
+ -1,
625
+ -1,
626
+ 4,
627
+ -1,
628
+ -1,
629
+ -1,
630
+ -1,
631
+ -1,
632
+ -1,
633
+ -1,
634
+ -1,
635
+ -1,
636
+ -1,
637
+ -1,
638
+ 3,
639
+ -1,
640
+ 6,
641
+ -1,
642
+ -1,
643
+ -1,
644
+ -1,
645
+ -1,
646
+ -1,
647
+ -1,
648
+ -1,
649
+ -1,
650
+ -1,
651
+ -1,
652
+ -1,
653
+ -1,
654
+ -1,
655
+ -1,
656
+ -1,
657
+ -1,
658
+ -1,
659
+ 2,
660
+ 1,
661
+ 0,
662
+ 2,
663
+ -1,
664
+ 1,
665
+ -1,
666
+ 2,
667
+ -1,
668
+ -1,
669
+ 0,
670
+ 6,
671
+ -1,
672
+ -1,
673
+ 2,
674
+ 0,
675
+ -1,
676
+ 7,
677
+ 7,
678
+ 2,
679
+ -1,
680
+ -1,
681
+ -1,
682
+ -1,
683
+ 5,
684
+ 5,
685
+ -1,
686
+ -1,
687
+ -1,
688
+ -1,
689
+ -1,
690
+ -1,
691
+ -1,
692
+ -1,
693
+ 0,
694
+ 0,
695
+ 0,
696
+ 7,
697
+ -1,
698
+ 7,
699
+ -1,
700
+ -1,
701
+ -1,
702
+ -1,
703
+ 2,
704
+ 4,
705
+ -1,
706
+ -1,
707
+ -1,
708
+ -1,
709
+ 1,
710
+ 6,
711
+ -1,
712
+ 0,
713
+ -1,
714
+ 4,
715
+ 2,
716
+ 4,
717
+ -1,
718
+ -1,
719
+ -1,
720
+ 6,
721
+ -1,
722
+ 0,
723
+ -1,
724
+ -1,
725
+ 0,
726
+ -1,
727
+ 1,
728
+ -1,
729
+ -1,
730
+ -1,
731
+ -1,
732
+ -1,
733
+ -1,
734
+ -1,
735
+ -1,
736
+ -1,
737
+ 2,
738
+ -1,
739
+ -1,
740
+ -1,
741
+ -1,
742
+ -1,
743
+ -1,
744
+ 6,
745
+ 0,
746
+ 1,
747
+ 1,
748
+ 1,
749
+ -1,
750
+ 1,
751
+ -1,
752
+ 0,
753
+ -1,
754
+ 1,
755
+ 0,
756
+ 1,
757
+ 4,
758
+ 5,
759
+ -1,
760
+ -1,
761
+ -1,
762
+ -1,
763
+ -1,
764
+ 6,
765
+ -1,
766
+ -1,
767
+ 5,
768
+ -1,
769
+ -1,
770
+ -1,
771
+ -1,
772
+ 4,
773
+ -1,
774
+ -1,
775
+ -1,
776
+ -1,
777
+ -1,
778
+ 0,
779
+ 0,
780
+ -1,
781
+ 1,
782
+ -1,
783
+ 0,
784
+ 0,
785
+ 0,
786
+ 0,
787
+ 2,
788
+ -1,
789
+ 6,
790
+ -1,
791
+ -1,
792
+ -1,
793
+ 7,
794
+ 5,
795
+ -1,
796
+ -1,
797
+ -1,
798
+ 5,
799
+ 5,
800
+ 0,
801
+ 0,
802
+ 1,
803
+ -1,
804
+ -1,
805
+ -1,
806
+ -1,
807
+ 0,
808
+ 1,
809
+ -1,
810
+ 6,
811
+ 2,
812
+ -1,
813
+ -1,
814
+ -1,
815
+ 5,
816
+ -1,
817
+ -1,
818
+ -1,
819
+ -1,
820
+ -1,
821
+ -1,
822
+ -1,
823
+ -1,
824
+ 0,
825
+ -1,
826
+ -1,
827
+ 5,
828
+ -1,
829
+ -1,
830
+ 6,
831
+ 5,
832
+ 4,
833
+ -1,
834
+ -1,
835
+ -1,
836
+ -1,
837
+ -1,
838
+ -1,
839
+ -1,
840
+ 0,
841
+ 3,
842
+ 0,
843
+ 6,
844
+ 3,
845
+ -1,
846
+ -1,
847
+ 1,
848
+ -1,
849
+ -1,
850
+ 3,
851
+ 3,
852
+ -1,
853
+ -1,
854
+ -1,
855
+ -1,
856
+ 1,
857
+ 7,
858
+ -1,
859
+ -1,
860
+ 0,
861
+ -1,
862
+ -1,
863
+ -1,
864
+ -1,
865
+ -1,
866
+ -1,
867
+ -1,
868
+ -1,
869
+ -1,
870
+ 2,
871
+ 2,
872
+ 1,
873
+ -1,
874
+ -1,
875
+ -1,
876
+ -1,
877
+ -1,
878
+ 0,
879
+ 3,
880
+ -1,
881
+ -1,
882
+ 3,
883
+ -1,
884
+ -1,
885
+ 3,
886
+ 3,
887
+ 3,
888
+ 1,
889
+ 1,
890
+ 3,
891
+ 3,
892
+ -1,
893
+ -1,
894
+ -1,
895
+ -1,
896
+ -1,
897
+ 3,
898
+ 0,
899
+ -1,
900
+ 3,
901
+ -1,
902
+ -1,
903
+ -1,
904
+ 2,
905
+ 7,
906
+ -1,
907
+ 3,
908
+ 0,
909
+ -1,
910
+ -1,
911
+ -1,
912
+ -1,
913
+ -1,
914
+ -1,
915
+ -1,
916
+ -1,
917
+ -1,
918
+ -1,
919
+ -1,
920
+ -1,
921
+ 1,
922
+ 1,
923
+ 5,
924
+ 3,
925
+ 3,
926
+ 1,
927
+ -1,
928
+ 4,
929
+ 2,
930
+ 0,
931
+ -1,
932
+ -1,
933
+ -1,
934
+ -1,
935
+ 7,
936
+ 3,
937
+ 3,
938
+ 3,
939
+ 3,
940
+ -1,
941
+ -1,
942
+ 3,
943
+ -1,
944
+ -1,
945
+ -1,
946
+ -1,
947
+ 0,
948
+ -1,
949
+ -1,
950
+ -1,
951
+ -1,
952
+ -1,
953
+ -1,
954
+ 0,
955
+ -1,
956
+ 0,
957
+ 1,
958
+ -1,
959
+ 0,
960
+ -1,
961
+ -1,
962
+ -1,
963
+ -1,
964
+ 1,
965
+ -1,
966
+ 3,
967
+ -1,
968
+ 5,
969
+ -1,
970
+ -1,
971
+ 4,
972
+ 1,
973
+ 4,
974
+ -1,
975
+ -1,
976
+ -1,
977
+ 0,
978
+ 4,
979
+ -1,
980
+ -1,
981
+ -1,
982
+ 2,
983
+ -1,
984
+ -1,
985
+ 0,
986
+ -1,
987
+ 6,
988
+ 6,
989
+ 6,
990
+ 6,
991
+ -1,
992
+ -1,
993
+ -1,
994
+ -1,
995
+ -1,
996
+ 2,
997
+ -1,
998
+ 0,
999
+ -1,
1000
+ 2,
1001
+ -1,
1002
+ 4,
1003
+ 0,
1004
+ -1,
1005
+ -1,
1006
+ -1,
1007
+ -1,
1008
+ -1,
1009
+ 6,
1010
+ -1,
1011
+ 3,
1012
+ -1,
1013
+ -1,
1014
+ 2,
1015
+ -1,
1016
+ -1,
1017
+ 1,
1018
+ 7,
1019
+ -1,
1020
+ -1,
1021
+ 0,
1022
+ -1,
1023
+ 3,
1024
+ -1,
1025
+ 3,
1026
+ 3,
1027
+ -1,
1028
+ 2,
1029
+ 1,
1030
+ 1,
1031
+ 1,
1032
+ -1,
1033
+ -1,
1034
+ -1,
1035
+ -1,
1036
+ -1,
1037
+ -1,
1038
+ 0,
1039
+ 3,
1040
+ 4,
1041
+ 1,
1042
+ -1,
1043
+ 5,
1044
+ -1,
1045
+ 7,
1046
+ 2,
1047
+ -1,
1048
+ -1,
1049
+ 3,
1050
+ -1,
1051
+ -1,
1052
+ -1,
1053
+ 0,
1054
+ 4,
1055
+ -1,
1056
+ -1,
1057
+ -1,
1058
+ -1,
1059
+ 6,
1060
+ 3,
1061
+ 2,
1062
+ 1,
1063
+ 0,
1064
+ -1,
1065
+ 7,
1066
+ -1,
1067
+ 1,
1068
+ -1,
1069
+ 7,
1070
+ 7,
1071
+ 7,
1072
+ -1,
1073
+ 0,
1074
+ -1,
1075
+ -1,
1076
+ -1,
1077
+ -1,
1078
+ -1,
1079
+ -1,
1080
+ -1,
1081
+ -1,
1082
+ -1,
1083
+ -1,
1084
+ 2,
1085
+ -1,
1086
+ -1,
1087
+ -1,
1088
+ -1,
1089
+ 1,
1090
+ -1,
1091
+ -1,
1092
+ -1,
1093
+ -1,
1094
+ -1,
1095
+ -1,
1096
+ -1,
1097
+ -1,
1098
+ 1,
1099
+ -1,
1100
+ 0,
1101
+ -1,
1102
+ -1,
1103
+ -1,
1104
+ -1,
1105
+ -1,
1106
+ -1,
1107
+ -1,
1108
+ -1,
1109
+ 0,
1110
+ -1,
1111
+ -1,
1112
+ -1,
1113
+ 3,
1114
+ -1,
1115
+ -1,
1116
+ 3,
1117
+ -1,
1118
+ -1,
1119
+ 1,
1120
+ -1,
1121
+ -1,
1122
+ -1,
1123
+ 3,
1124
+ -1,
1125
+ 1,
1126
+ -1,
1127
+ -1,
1128
+ -1,
1129
+ -1,
1130
+ 3,
1131
+ 1,
1132
+ -1,
1133
+ -1,
1134
+ 1,
1135
+ -1,
1136
+ -1,
1137
+ 2,
1138
+ -1,
1139
+ -1,
1140
+ -1,
1141
+ -1,
1142
+ -1,
1143
+ -1,
1144
+ -1,
1145
+ -1,
1146
+ -1,
1147
+ -1,
1148
+ -1,
1149
+ 0,
1150
+ -1,
1151
+ -1,
1152
+ -1,
1153
+ 3,
1154
+ 2,
1155
+ 1,
1156
+ -1,
1157
+ 6,
1158
+ -1,
1159
+ 0,
1160
+ -1,
1161
+ -1,
1162
+ -1,
1163
+ 5,
1164
+ -1,
1165
+ -1,
1166
+ -1,
1167
+ -1,
1168
+ -1,
1169
+ -1,
1170
+ -1,
1171
+ -1,
1172
+ -1,
1173
+ -1,
1174
+ -1,
1175
+ -1,
1176
+ -1,
1177
+ 6,
1178
+ -1,
1179
+ -1,
1180
+ -1,
1181
+ -1,
1182
+ -1,
1183
+ -1,
1184
+ -1,
1185
+ -1,
1186
+ 2,
1187
+ -1,
1188
+ -1,
1189
+ 6,
1190
+ -1,
1191
+ 2,
1192
+ -1,
1193
+ -1,
1194
+ -1,
1195
+ -1,
1196
+ -1,
1197
+ 0,
1198
+ 6,
1199
+ 7,
1200
+ -1,
1201
+ -1,
1202
+ 1,
1203
+ -1,
1204
+ -1,
1205
+ -1,
1206
+ 2,
1207
+ -1,
1208
+ -1,
1209
+ -1,
1210
+ 2,
1211
+ -1,
1212
+ -1,
1213
+ -1,
1214
+ -1,
1215
+ -1,
1216
+ -1,
1217
+ 2,
1218
+ -1,
1219
+ 2,
1220
+ -1,
1221
+ 2,
1222
+ -1,
1223
+ -1,
1224
+ 2,
1225
+ 5,
1226
+ 2,
1227
+ 6,
1228
+ -1,
1229
+ 2,
1230
+ 2,
1231
+ -1,
1232
+ -1,
1233
+ -1,
1234
+ -1,
1235
+ 6,
1236
+ 6,
1237
+ 3,
1238
+ -1,
1239
+ -1
1240
+ ],
1241
+ "topic_sizes": {
1242
+ "-1": 693,
1243
+ "2": 51,
1244
+ "5": 28,
1245
+ "4": 46,
1246
+ "3": 50,
1247
+ "1": 60,
1248
+ "0": 63,
1249
+ "6": 26,
1250
+ "7": 20
1251
+ },
1252
+ "topic_mapper": [
1253
+ [
1254
+ -1,
1255
+ -1,
1256
+ -1
1257
+ ],
1258
+ [
1259
+ 0,
1260
+ 0,
1261
+ 6
1262
+ ],
1263
+ [
1264
+ 1,
1265
+ 1,
1266
+ 7
1267
+ ],
1268
+ [
1269
+ 2,
1270
+ 2,
1271
+ 1
1272
+ ],
1273
+ [
1274
+ 3,
1275
+ 3,
1276
+ 2
1277
+ ],
1278
+ [
1279
+ 4,
1280
+ 4,
1281
+ 0
1282
+ ],
1283
+ [
1284
+ 5,
1285
+ 5,
1286
+ 3
1287
+ ],
1288
+ [
1289
+ 6,
1290
+ 6,
1291
+ 4
1292
+ ],
1293
+ [
1294
+ 7,
1295
+ 7,
1296
+ 5
1297
+ ]
1298
+ ],
1299
+ "topic_labels": {
1300
+ "-1": "-1_vakcinas_nustatyti_pfizer_2021",
1301
+ "0": "0_konstitucijai_konstituciniu_nustatyti_respublikos",
1302
+ "1": "1_taisykliu_pasitikejimas_reikalauja_iliuzija",
1303
+ "2": "2_vakcinavimas_injekcija_susitvarkyti_sertifikatu",
1304
+ "3": "3_koronavirusu_virusologijos_laboratorijoje_institutas",
1305
+ "4": "4_pfizer_vakcinas_fda_2021",
1306
+ "5": "5_vaers_omicron_2021_nepageidaujami",
1307
+ "6": "6_vakcinacija_\u0438\u0437\u0440\u0430\u0438\u043b\u044f_izraeliui_kampanija",
1308
+ "7": "7_virusus_bakterijas_patogenai_imunine"
1309
+ },
1310
+ "custom_labels": null,
1311
+ "_outliers": 1,
1312
+ "topic_aspects": {}
1313
+ }