metadata
tags:
- bertopic
library_name: bertopic
pipeline_tag: text-classification
MARTINI_enrich_BERTopic_GunlukHaber
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_GunlukHaber")
topic_model.get_topic_info()
Topic overview
- Number of topics: 59
- Number of training documents: 7934
Click here for an overview of all topics.
Topic ID | Topic Keywords | Topic Frequency | Label |
---|---|---|---|
-1 | erdogan - kılıcdaroglu - bakanı - ahmet - istanbul | 20 | -1_erdogan_kılıcdaroglu_bakanı_ahmet |
0 | retweet - kılıcdaroglu - attıgı - vermeyecegiz - fatih | 4801 | 0_retweet_kılıcdaroglu_attıgı_vermeyecegiz |
1 | rusya - donetsk - bombardımanın - ukraynalı - helikopterlerinin | 328 | 1_rusya_donetsk_bombardımanın_ukraynalı |
2 | fiyatları - petrol - kaynaklar - tarifelerinde - gazı | 181 | 2_fiyatları_petrol_kaynaklar_tarifelerinde |
3 | avukatı - cezası - sanıkların - karlıova - serdar | 105 | 3_avukatı_cezası_sanıkların_karlıova |
4 | zelenskiy - kremlin - medvedev - diplomatların - hazırız | 96 | 4_zelenskiy_kremlin_medvedev_diplomatların |
5 | olamadıgım - tartısacagımızı - koyuyorsunuz - yazmıstım - duzeltebileceginizi | 94 | 5_olamadıgım_tartısacagımızı_koyuyorsunuz_yazmıstım |
6 | basarıyla - nasa - helikopterlerimiz - komutanlıgımızın - pentagon | 85 | 6_basarıyla_nasa_helikopterlerimiz_komutanlıgımızın |
7 | yaralanmıstır - kolombiya - kuzeyindeki - narkotik - operasyonları | 83 | 7_yaralanmıstır_kolombiya_kuzeyindeki_narkotik |
8 | sorularından - paylasılmaktadır - yapılmayacaktır - yasasına - sosyal | 76 | 8_sorularından_paylasılmaktadır_yapılmayacaktır_yasasına |
9 | hamas - filistinlileri - netanyahu - bombardımanları - mısır | 74 | 9_hamas_filistinlileri_netanyahu_bombardımanları |
10 | bakanı - muhafazakarlıgın - avukatlıgını - suleyman - politikasında | 73 | 10_bakanı_muhafazakarlıgın_avukatlıgını_suleyman |
11 | erdogan - kaldıgımız - mustekbirlerin - caydırıcı - bulamazsın | 72 | 11_erdogan_kaldıgımız_mustekbirlerin_caydırıcı |
12 | erdogan - politikasını - kosova - beklentimiz - stoltenberg | 70 | 12_erdogan_politikasını_kosova_beklentimiz |
13 | kılıcdaroglu - calısanlarına - dilekcelerimizi - bulusmasında - katılacaksınız | 69 | 13_kılıcdaroglu_calısanlarına_dilekcelerimizi_bulusmasında |
14 | fiyatları - yılın - 2023 - aralık - ekonomimiz | 67 | 14_fiyatları_yılın_2023_aralık |
15 | videoları - youtube - montajladıgım - kanalın - yorum | 65 | 15_videoları_youtube_montajladıgım_kanalın |
16 | erdogan - anadolu - kılıcdaroglu - ahmet - cumhurbaskanlıgı | 62 | 16_erdogan_anadolu_kılıcdaroglu_ahmet |
17 | ramallah - israilli - bombaladıklarını - gazetecileri - bureij | 60 | 17_ramallah_israilli_bombaladıklarını_gazetecileri |
18 | finansmanını - yatırımcı - ekonomisinin - politikamız - sıfırlanıyor | 60 | 18_finansmanını_yatırımcı_ekonomisinin_politikamız |
19 | arabistan - zayed - abdullah - riyad - cumhurbaskanlıgı | 59 | 19_arabistan_zayed_abdullah_riyad |
20 | trabzonspor - sampiyonlar - mbappe - finali - samsunspor | 58 | 20_trabzonspor_sampiyonlar_mbappe_finali |
21 | erdogan - adaylıgımıza - cıkartacaksanız - secimlerinin - kampanyaları | 56 | 21_erdogan_adaylıgımıza_cıkartacaksanız_secimlerinin |
22 | politikası - bankaların - acıklanacak - fed - merkez | 53 | 22_politikası_bankaların_acıklanacak_fed |
23 | fiyatlarındaki - petrol - benzin - lpg - litresini | 52 | 23_fiyatlarındaki_petrol_benzin_lpg |
24 | doları - bitcoin - yatırımlar - brent - grivnası | 50 | 24_doları_bitcoin_yatırımlar_brent |
25 | cocukları - kızımız - cıkarıldı - sanlıurfa - ugradıgını | 50 | 25_cocukları_kızımız_cıkarıldı_sanlıurfa |
26 | dolarları - bulacagı - milyon - kaptırmayın - kampanyamızın | 50 | 26_dolarları_bulacagı_milyon_kaptırmayın |
27 | ogretmenlerimizi - tasıdık - mudurluklerimiz - universitesi - manisa | 49 | 27_ogretmenlerimizi_tasıdık_mudurluklerimiz_universitesi |
28 | yuzyılınkonutprojesi - istanbul - planlıyoruz - hektarı - hızlı | 48 | 28_yuzyılınkonutprojesi_istanbul_planlıyoruz_hektarı |
29 | fransız - azerbaycan - diplomatın - kampanyasıyla - gabonlu | 47 | 29_fransız_azerbaycan_diplomatın_kampanyasıyla |
30 | maymun - hastalıgından - koronavirus - enfeksiyon - kolera | 45 | 30_maymun_hastalıgından_koronavirus_enfeksiyon |
31 | taksiciler - sehirlerarası - fiyatı - otobuslerinin - tasımacılık | 40 | 31_taksiciler_sehirlerarası_fiyatı_otobuslerinin |
32 | doları - bankaların - rezervlerinin - korumalı - goldman | 40 | 32_doları_bankaların_rezervlerinin_korumalı |
33 | gazprom - naftogaz - gazın - pazarlarımız - yasaklanmıstı | 37 | 33_gazprom_naftogaz_gazın_pazarlarımız |
34 | motosikletliyi - motokuryelerin - kapatılmadıgını - hurriyetinden - trafikte | 35 | 34_motosikletliyi_motokuryelerin_kapatılmadıgını_hurriyetinden |
35 | yangınlara - kuzeydeki - golmarmara - olumsuzlugumuz - susurkoy | 35 | 35_yangınlara_kuzeydeki_golmarmara_olumsuzlugumuz |
36 | fiyatları - ekmekleri - kilogramı - kıymayı - balıkcıların | 35 | 36_fiyatları_ekmekleri_kilogramı_kıymayı |
37 | suriyelilerdir - abartıldıgı - libyalı - karsılasılan - temsilcilikler | 34 | 37_suriyelilerdir_abartıldıgı_libyalı_karsılasılan |
38 | davutoglu - acıklamaları - cumhuriyetimize - partisi - sultanbeylili | 33 | 38_davutoglu_acıklamaları_cumhuriyetimize_partisi |
39 | iklim - hızlandıgı - kuzey - haritasına - antarktika | 33 | 39_iklim_hızlandıgı_kuzey_haritasına |
40 | takılacaklar - tiktok - edebileceksiniz - yırttıgı - teyzecigim | 31 | 40_takılacaklar_tiktok_edebileceksiniz_yırttıgı |
41 | akbasoglu - teklifimizdeki - cıkardıklarını - memnuniyetsizliklerini - komisyonları | 31 | 41_akbasoglu_teklifimizdeki_cıkardıklarını_memnuniyetsizliklerini |
42 | gazeteci - hacısalioglu - televizyonlarında - yayımlanmayacagı - itibarsızlastırmasıdır | 29 | 42_gazeteci_hacısalioglu_televizyonlarında_yayımlanmayacagı |
43 | vatanımızın - kardeslerimizi - fedakarlıgı - turkiyeli - kutuplastırmanızdan | 29 | 43_vatanımızın_kardeslerimizi_fedakarlıgı_turkiyeli |
44 | bırakılacak - sırtımızı - calısmalarım - sokulmasıyla - diyebiliyorsunuz | 29 | 44_bırakılacak_sırtımızı_calısmalarım_sokulmasıyla |
45 | gaziantep - kahramanmaras - buyuklugundeki - tsunamilerin - saptanmıstı | 29 | 45_gaziantep_kahramanmaras_buyuklugundeki_tsunamilerin |
46 | biden - amerikalılar - kamala - imzalaması - depresyondaydım | 28 | 46_biden_amerikalılar_kamala_imzalaması |
47 | 2023 - bakanlıgı - yılı - fiyatlarla - merkezi | 26 | 47_2023_bakanlıgı_yılı_fiyatlarla |
48 | yahudilerin - hristiyanların - purim - bayramları - mezarların | 25 | 48_yahudilerin_hristiyanların_purim_bayramları |
49 | instagram - tiktok - kullandıgınızda - facebook - paylastıgım | 25 | 49_instagram_tiktok_kullandıgınızda_facebook |
50 | kayaların - hastalarımıza - paylasılacaktır - surukledigi - ambulanslarla | 25 | 50_kayaların_hastalarımıza_paylasılacaktır_surukledigi |
51 | uyardıgımız - kırıldıgında - denizinde - haritasında - mollakasım | 23 | 51_uyardıgımız_kırıldıgında_denizinde_haritasında |
52 | uyandıklarını - turkistan - azınlıklar - tartısılmasını - protesto | 22 | 52_uyandıklarını_turkistan_azınlıklar_tartısılmasını |
53 | afganları - taliban - tacikistan - kırgızistan - calıstırıldıklarını | 21 | 53_afganları_taliban_tacikistan_kırgızistan |
54 | bakanı - yaslılarımızı - degistirmeyeceklerini - basvurabilirler - emeklilerimizin | 21 | 54_bakanı_yaslılarımızı_degistirmeyeceklerini_basvurabilirler |
55 | borsa - istanbul - dolandırıcılıgına - kapanısa - 100 | 20 | 55_borsa_istanbul_dolandırıcılıgına_kapanısa |
56 | istanbul - okmeydanı - yasayamazsın - bosandıgı - ablamın | 20 | 56_istanbul_okmeydanı_yasayamazsın_bosandıgı |
57 | yazılmıs - site - tartısabilecegimiz - planlıyordum - acacagım | 20 | 57_yazılmıs_site_tartısabilecegimiz_planlıyordum |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12