rasyosef commited on
Commit
1452588
·
verified ·
1 Parent(s): ddb8682

Add new SentenceTransformer model

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,989 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - en
4
+ license: apache-2.0
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - generated_from_trainer
10
+ - dataset_size:28046
11
+ - loss:MatryoshkaLoss
12
+ - loss:MultipleNegativesRankingLoss
13
+ base_model: yosefw/roberta-base-am-embed
14
+ widget:
15
+ - source_sentence: በከፍተኛ ትምህርትና ስልጠና ተቋማት ከኮሮና ቫይረስ ጋር የተገናኙ ጉዳዮችን የሚከታተል ግብረ ሃይል
16
+ ተቋቋመ
17
+ sentences:
18
+ - 'በመተማ ዮሐንስ ቤት ውስጥ ተደብቀው ተኩስ በከፈቱ አካላት በሰዎች ላይ የሞትና የአካል መቁሰል አደጋ መድረሱን የምዕራብ ጎንደር
19
+ ዞን ፖሊስ መምሪያ አስታወቀ።የመምሪያው ኃላፊ ኮማንደር ጌትነት አልታሰብ እንደገለፁት ግለሰቦቹ በከፈቱት ተኩስ የ3 ሰዎች
20
+ ህይወት ሲያልፍ በ20 ሰዎች ላይ ቀላልና ከባድ የአካል ጉዳት ደርሷል።ከተጎጂዎች መካከልም አንድ የፀጥታ አካልን ጨምሮ ሴቶችና
21
+ ወጣቶች ይገኙበታል ብለዋል።የቅማንት ማህበረሰብ ተቆርቋሪ ነን በሚሉ አካላት ጉዳቱ ሊደርስ መቻሉንም ኃላፊው ገልፀዋል።ጉዳቱን
22
+ ካደረሱት አካላት መካከልም አራቱ እጃቸውን የሠጡ ሲሆን ቀሪዎቹም በሰላማዊ መንገድ ለፀጥታ ኃይሎች እጃቸውን እንዲሠጡ እየተጠየቁ
23
+ ስለመሆኑ ኃላፊው ተናግረዋል፡፡ጉዳት ካደረሱት ግለሰቦችም 9 የክላሽንኮቭ፣ አንድ ኤፍ ኤን መሳሪያ፣አንድ ሽጉጥ፣ አንድ ቦንብና
24
+ በርካታ ጥይቶች በቁጥጥር ስራ መዋላቸውን ኮማንደር ጌትነት አስታውቀዋል።ጉዳት የደረሰባቸው ሰዎች በመተማ ዮሐንስ ጤና ጣቢያ፣
25
+ በገንዳ ውሃ ሆስፒታልና በጎንደር ሪፈራል ሆስፒታል ህክምና እየተደረጋላቸ ነው ብለዋል።ለዘመናት ተሳስሮ በኖረው የአማራና የቅማንት
26
+ ማህበረሰብ መካከል ግጭት ለመፍጠር የሚንቀሳቀሱ አካላት ከድርጊታቸው እንዲቆጠቡ ያሳሰቡት ኮማንደሩ፤ ችግሩ እስኪበርድ የአካባቢው
27
+ የሃይማኖት አባቶችና የሃገር ሽማግሌዎች ህብረተሰቡን በማስተማር የድርሻቸውን ሊወጡ ይገባል ብለዋል።ወጣቱ የአካባቢውን ሰላም
28
+ በመጠበቅና ከፀጥታ ሃይሉ ጎን በመሰለፍ ጥፋተኞችን በመለየት ለህግ እንዲያቀርብ ጥሪ አቅርበዋል።የተፈጠረውን ግጭት ላማረጋጋት
29
+ የመከላከያ ሰራዊት፣ የክልሉ ልዩ ኃይል፣ የፖሊስ አባላትና የአካባቢ ሚሊሻዎች በጋራ በመሆን ወደ እየሰሩ ናቸው ሲሉ ኮማንደሩ
30
+ ጠቅሰዋል፡፡(ኢዜአ) '
31
+ - አዲስ አበባ፣ መጋቢት 9፣ 2012(ኤፍ.ቢ.ሲ) በሁሉም ከፍተኛ ትምህርትና ስልጠና ተቋማት ከኮሮና ቫይረስ ጋር የተገናኙ ጉዳዮችን
32
+ የሚከታተል ግብረ ሃይል በሳይንስና ከፍተኛ ትምህርት ሚኒስቴር ተቋቁሞ እየሰራ እንደሚገኝ ተገለጸ።ግብረ ሃይሉ ከመጋቢት 7 ቀን
33
+ 2012 ዓ.ም ጀምሮ የከፍተኛ ትምህርትና ስልጠና ተቋማት ተማሪዎች የክፍል ውስጥ ትምህርት አቁመው አጋዥ መፅሐፍት (ሃንድ አውት)፣
34
+ ማጣቃሻ መፅሐፍት፣ በበይነ መረብ በመታገዝ እና ሶፍት ኮፒ ለቀጣዮቹ 2 ሳምንታት በግላቸው እንዲያነቡ አቅርቧል።በዩኒቨርሲቲዎች
35
+ ተማሪዎች እጃቸውን አዘውትረው እንዲያፀዱም የውሃ አቅርቦትን የማሻሻል፣ የመታጠቢያ ሳሙናዎችንና አስፈላጊ ግብዓቶችን የማሟላትና
36
+ የማቅረብ ስራዎች እየተከናወኑ መሆኑንም ሚኒስቴሩ ገልጿል።ከዚህ ባለፈም ስለቫይረሱ ለተማሪዎች እና ለከፍተኛ ትምህርት ተቋማት
37
+ ማህበረሰቡ ግንዛቤ ለመፍጠር ዩኒቨርሲቲዎች የተለያዩ መንገዶችን እየተከተሉ መሆኑ ተጠቁሟል።በሁለት ሳምንታ እድሜያቸው ከ60
38
+ ዓመት በላይ የሆኑና የልብ ወይም የካንሰር እንዲሁም የስኳርና ሌሎች ተዛማጅ ህመሞች ያሉባቸው፣ የአስምና የመተንፈሻ አካላት
39
+ ችግር ያሉባቸው ሠራተኞች ከሌሎች የበለጠ ጥንቃቄ ማድረግ እንደሚገባቸው መመከሩን ከሳይንስና ከፍተኛ ትምህርት ሚኒስቴር ያገኘነው
40
+ መረጃ ያመለክታል።
41
+ - አዲስ አበባ፤ ነሐሴ 3/2005 (ዋኢማ) – በትግራይ ክልል በሚገኙ ሦስት ታሪካዊና ጥንታዊ ቦታዎች ላይ የቅርሶች ጥበቃ፣ የመካነ
42
+ ቅርስ ቁፋሮና የምርምር ስራዎች እያካሄደ መሆኑን የመቀሌ ዩኒቨርስቲ አስታወቀ፡፡የዩኒቨርስቲው ፕሬዚዳንት ዶክተር ክንደያ ገብረ
43
+ ህይወት እንደገለጹት ዩኒቨርስቲው ምርምሩን በማካሄድ ላይ ያለው ከዚህ በፊት በሌሎች አካላት የቅርስ ጥበቃ፣ የመካነ ቅርስ ቁፋሮና
44
+ የምርምር ስራዎች ባልተካሄዱባቸው አካባቢዎች ነው፡በዚህም ዩኒቨርስቲው በሓውዜን ወረዳ ዓንዛ ማሪያም ጥንታዊ ቤተክርስትያን ያሉ
45
+ ጥንታዊ መካነ ቅርሶች ላይ ተገቢውን ጥበቃ በማድረግ አከባቢውን አስመልክቶ የሚነገሩ አፈ ታሪኮችን ትክክለኛነት ለማረጋገጥ
46
+ በቁፋሮ ጥልቅ የምርምር ስራ እያካሄደ ነው።እንዲሁም በእንደርታ ወረዳ ልዩ ስሙ ”ዓዲ መዓር(ድርባ)”በተባለ ቦታ ላይ በአውነ
47
+ አሳይ ጥንታዊ ቤትክርስትያን ላይ በተለያዩ ምክንያቶች የደረሰበትን የመፍረስ አደጋ መልሶ በመገንባት በውስጡ የሚገኙ የተንቀሳቃሽ
48
+ ቅርሶች ጥበቃ እያካሄደ ሲሆን፣ በአፈ ታሪክ የሚነገሩ ድንቅ ታሪኮቹም በሳይንሳዊ መንገድ ተጠንተው ለቱሪዝም ልማት ጥቅም ላይ
49
+ እንዲውሉ እየሰራ መሆኑን ዶክተር ክንደያ ተናግረዋል።በተጨማሪ ዩኒቨርስቲው የጣሊያን ወራሪ ሃይል የኢትዮጵያ አባት አርበኞች
50
+ ትግል ለመመከት በመቀሌ ከተማ በእንዳ እየሱስ ተራራ ላይ ”ፎርቶ” በሚል ስም የሚታወቀው ስፍራ ላይ ታሪካዊነቱ በሚያጎላ መልኩ
51
+ እድሳት ተደርጎለት ለመዝናኛ አገልግሎት እንዲውል የተለያዩ ግንባታዎች እያካሄደ መሆኑን ፕሬዚዳንቱ ገልጸዋል።ዩኒቨርስቲው በትግራይ
52
+ ክልል የሚገኙ ታሪካዊና ጥንታዊ ቅርሶች ተገቢው ጥበቃ እንዲደረግላቸውና በመካነ ቅርስ ቁፋሮ የምርምር ስራ የበኩሉን ድርሻ እንዲወጣ
53
+ በዩኒቨርስቲው የባህልና ቅርስ ጥበቃ የትምህርት ክፍል ከፍቶ በመጀመሪያ ዲግሪ እያሰለጠ ይገኛል።ዩኒቨርስቲው በኢትዮጵያ ውሰጥ
54
+ ያሉ የተለያዩ ብሄር ብሄረሰቦች ባህሎችና ጥንታዊ ቅርሶች እንዲጠበቁ በማድረግ ለቱሪዝም ልማት እንዲውሉ ለማድረግ ባለፈው ሳምንት
55
+ ዓለም አቀፍ አውደ ጥናት በማዘጋጀት የተለያዩ ጠቃሚ ልምዶች ማግኘቱን ዶክተር ክንደያ ገብረ ህይወት ገልጸዋል ሲል ኢዜአ ዘግቧል።
56
+ - source_sentence: የደቡብ ክልል ም/ርዕሰ መስተዳድር አቶ ርስቱ ይርዳው በደቡብ ኦሞ ዞን ኛንጋቶም ወረዳ የተከናወኑ የልማት
57
+ ስራዎችን ጎበኙ
58
+ sentences:
59
+ - አዲስ አበባ፦ የኢትዮጵያ እግር ኳስ ፌዴሬሽን 12ኛ መደበኛ ጠቅላላ ጉባዔውን ትናንት አካሂዷል፡፡ ያለፈው ዓመት ባጋጠሙ በርካታ
60
+ ውጣ ውረዶች ስፖርቱ አሉታዊ ተጽእኖ ቢደርስበትም የተሻለ አፈጻጸም የተመዘገበበት መሆኑ ተመላክቷል፡፡ በተለይም በአዲስ አበባ
61
+ ከተማ የሚገኘውን የካፍ አካዳሚን በማስጠገን ለአገልግሎት መብቃቱ፤ ፌዴሬሽኑ ለብሔራዊ ቡድን ዝግጅት የሚያወጣውን ከፍተኛ ወጪ
62
+ ታድጓል። የአህጉርና ዓለም አቀፍ ግንኙነትን በማጠናከር ረገድም ጠንካራ ሥራ በመከናወኑ ኢትዮጵያ በሴካፋ የመሪነት ቦታ ማግኘቷም
63
+ በጉባኤው ላይ መነሳቱን የኢፌዴሪ ስፖርት ኮሚሽን በድረ-ገጹ አስነብቧል፡፡ በጉባኤው በቀረበው የ2012 በጀት ዓመት የአፈጻጸም
64
+ ሪፖርት ላይም ፌዴሬሽኑ የገንዘብ አቅሙን ማሳደጉ ተገልጧል፡፡ ለዓመታት የክለቦች ጥያቄ የነበረውን የሊግ ካምፓኒ ምስረታ እውን
65
+ ማድረጉንም እንደ ስኬት ተነስቷል፡፡ በቀረበው ሪፖርት እና የ2013 በጀት ዓመት ዕቅድ ላይም በጉባኤው አባላት ውይይት ተደርጓል፡፡
66
+ በመጨረሻም የሲዳማ ክልል የጉባኤው አባልነት ጥያቄን ተቀብሎ በማፅደቅ እና በአጭር ጊዜ ውስጥ በተሻሻለው መተዳደሪያ ደንብ ላይ
67
+ ለመወያየት እና ለማጽደቅ በሀዋሳ ከተማ አስቸኳይ ጉባኤ እንደሚካሄድ በመወሰን ጉባኤው መጠናቀቁን በዘገባው ተመላክቷል።አዲስ
68
+ ዘመን ህዳር 28/2013
69
+ - አዲስ አበባ፣ መስከረም 9፣ 2013 (ኤፍ.ቢ.ሲ) የደቡብ ክልል ምክትል ርዕሰ መስተዳድር አቶ ርስቱ ይርዳው በደቡብ ኦሞ ዞን
70
+ ኛንጋቶም ወረዳ የተከናወኑ የልማት ስራዎችን ጎብኝተዋል።ወደ ደቡብ ኦሞ ዞን ያቀናው በምክትል ርዕሰ መስተዳድር አቶ እርስቱ
71
+ ይርዳው የተመራውና የክልሉ ከፍተኛ የስራ ሀላፊዎች ያካተተው ቡድን የኦሞ ወንዝን በመስኖ በመጠቀም እየለማ ያለ የሙዝ እርሻን
72
+ መጎብኘታቸውን የክልሉ የመነግስት ኮሙዩኒኬሽን ጉዳዮች ቢሮ መረጃ ያመለክታል።በኛንጋቶም ወረዳ በናፕሱመሪያ ቀበሌ በማህበር ተደራጅተው
73
+ ሙዝ እያለሙ ያሉ ሴቶችን የስራ እንቅስቃሴ የጎበኙ ሲሆን፥ በዚሁ ወቅት “የሙዝ እርሻ እያለሙ ያሉ አርብቶ አደር እንደመሆናችን
74
+ ከዚህ ቀደም በእርሻ ስራ ላይ ተሳትፎ እያደረግን አልነበረም እናም አሁን መንግስት ባደረገልን ድጋፍ ሙዝ እያለማን ነው” ብለዋል።አስተያየት
75
+ ሰጪዎቹ ገለጻ እያለሙት ያለውን የሙዝ እርሻ ስኬታማ ለማድረግ የውሀ መሳቢያ ፓምፕ ችግር እያጋጠማቸው መሆኑን ጠቁመዋል።“በመንደር
76
+ እንድንሰባሰብ ከተደረገ በኅላ የንጹህ መጠጥ ውሃ መጠለያና ተዛማጅ ተግባራት ሊሟላልን ይገባል” ሲሉም ጠይቀዋል።ምክትል ርዕሰ
77
+ መስተዳድር አቶ ርስቱ ይርዳው፥ ከአርብቶ አደሩ ማህበረሰብ ለተነሳላቸው ጥያቄ በሰጡት ምላሽ በመስኖ ዙሪያ ያጋጠማቸውን ችግር
78
+ የክልሉ መንግስት እንደሚገነዘበው ጠቅሰዋል።በቀጣይ የህብረተሰቡን ህይወት ለመቀየር መንግስት የመስኖ ልማት ስራን እንደሚደግፍ
79
+ በመግለፅ፤ የፓምፕ ችግሮችን ለመፍታት ጥረት እንደሚደረግም አስታውቀዋል።አሁን በስፋት እየለማ ያለውን ሙዝ ወደ የገበያ ለማቅረብ
80
+ የገበያ ትስስር ለመፍጠርም ድጋፍ እንደሚደረግም ምክትል ርእሰ መስተዳድሩ አስታውቅዋል።የተጀመረው የልማት ስራ ተጠናክሮ እንዲቀጥል
81
+ ያስታወቁት አቶ ርስቱ፥ ቀበሌን ከወረዳ የሚያገናኙ መንገዶችን ለመገንባት ጥረት እንደሚደረግም ተናግረዋል።
82
+ - ' የኢትዮጵያ ሰብአዊ መብቶች ጉባኤ፤ የአርቲስት ሃጫሉ ሁንዴሳ ግድያን ተከትሎ በተፈጠረው ሁከትና ግርግር በኦሮሚያ የደረሰውን
83
+ የሰብአዊ ጉዳት የሚመረምር ቡድን ከሣምንቱ አጋማሽ ጀምሮ ማሠማራቱን ለአዲስ አድማስ አስታውቋል:: ተቋሙ ሁከትና ግርግር በተፈጠረባቸውና
84
+ ጉዳት በደረሰባቸው ሁሉም የኦሮሚያ አካባቢዎች የምርመራ ቡድን ማሰማራቱን አመልክቷል፡፡ በምርመራው የሚገኙ ውጤቶችን ከዓለማቀፍ
85
+ የሰብአዊ መብት ድንጋጌዎች አንፃር በመመዘን የተፈፀመው ድርጊት ምንድን ነው? ምን ያህል ጉዳት አጋጥሟል? መንግስት የወሰደው
86
+ እርምጃስ ምንድን ነው? እነማን በድርጊቱ ተሳትፈዋል? የሚለውን የመለየት ተግባር እንደሚከናወን ታውቋል፡፡ '
87
+ - source_sentence: የኢትዮጵያ ልማት ባንክ አራት አዳዲስ ምክትል ፕሬዚዳንቶችን ሾመ
88
+ sentences:
89
+ - በጃፓን ላለፉት 30 ዓመታት ንጉስ ሆነው ያገለገሉት የ85 ዓመት ንጉስ አክሂቶ በገዛ ፈቃዳቸው ስልጣናቸውን ለመልቀቅ ተስማምተዋል፡፡ንጉሱ
90
+ ከ200 ዓመታት ወዲህ በፍላጎት ስልጣን ለመልቀት የተስማሙት የመጀመሪያ ንጉስ ናቸው ተብሏል፡፡ንጉሱ ስልጣናቸውን ለመልቀቅ የተስማሙት
91
+ እድሜቸው እየገፋ በመሄዱና የጤናቸው ሁኔታ ስራቸውን መስራት አስቸጋሪ በማድረጉ ነው የተባለው፡፡የንጉሱ ስልጣን የመልቀቅ ጥያቄ
92
+ በአገሪቱ ህጋዊ ፍቃድ አግኝቶ በዛሬው እለት የስልጣን ርክክብ ሂደት ተጀምሯል፡፡ንጉስ በአገሪቱ ምንም የፖለቲካ ስልጣን ሚና
93
+ ባይኖረውም ለጃፓን እንደ ብሄራዊ አርማ ተደርጎ ይወሰዳል ነው የተባለው፡፡ንጉስ አክሂቶ በልጃቸው ናሩሂቶ የሚተኩ ሲሆን፣ ናሩሂቶ
94
+ ከነገ ጀምረው የጃፓን ንጉስ ይሆናሉ ነው የተባለው፡፡(ምንጭ፡- ቢቢሲ)
95
+ - 'የኢትዮጵያ ልማት ባንክ አራት አዳዲስ ምክትል ፕሬዚዳንቶችን መሾሙን አስታወቀ ።የባንኩ የኮርፖሬት ማስተዋወቅናግንኙነት
96
+ ተጠባባቂ ዳይሬክተር አቶ ኃይሉ ምስጋናው እንደገለጹት የሊዝ ፋይናንስ እና ቅርንጫፎች ሥራ ምክትል ፕሬዚዳንት ከሆኑት አቶ
97
+ ተሾመ ዓለማየሁ በስተቀር ሌሎቹ አራት የባንኩ ምክትል ፕሬዚዳንቶችን ከኃላፊነታቸው በማንሳት በአዳዲስ እንዲተኩ ተደርጓል ።ባንኩ
98
+ አዲስ የሾማቸው አቶ ጌታቸው ዋቄ በፕሮጀክት ፋይናንስ ምክትል ፕሬዚዳንት፣ አቶ ኃይለእየሱስ በቀለ በብድር አገልግሎት ምክትል
99
+ ፕሬዚዳንት ፣ አቶ ሃዱሽ ገብረእግዚአብሄር የኮርፖሬት አገልግሎት ምክትል ፕሬዚዳንት እና አቶ እንዳልካቸው ምህረቱ የፋይናንስና
100
+ ባንኪንግ ምክትል ፕሬዚዳንት በመሆን ነው ።የኢትዮጵያ ልማት ባንክ በለውጥ ሂደት ውስጥ በመሆኑና ለዚህ አዲስ አደረጃጀት እየሰራ
101
+ መሆኑም ለምክትል ፕሬዚዳንቶቹ መነሳት ምክንያት ነው ተብሏል።ባንኩ የዘረጋውን አዲስ መዋቅር መሠረት በማድረግ በቅርቡ ፕሬዚዳንት
102
+ መሾሙ ይታወሳል።ባንኩ አደረጃጀቱን በአዲስ የሰው ኃይል ለማሟላት እየሰራ እንደሆነም ነው የተነገረው።ለተሰናባቾቹ ምክትል ፕሬዚዳንቶች
103
+ የደረሰው ደብዳቤም ለአገልግሎታቸው ምስጋናን ያካተተ መሆኑ ተመልክቷል። '
104
+ - 'ባለፈው ቅዳሜ በሰሜን ምሥርቅ ናይጀርያ በታጠቁ ሽፍቶችና በመንደር ነዋሪዎች መካከል በተካሄደ ግጭት 45 ሰዎች ተገድለዋል።
105
+
106
+ ሽፍቶቹ ካዱና በተባለው ሰሜናዊ ክፍለ፡ሀገር በሚገኘው ግዋስካ ድንበር ላይ ጥቃት ከፈቱ። የአካባቢ ጥበቃ ኃይል አባል የሆነ
107
+ ሰው በተናገረው መሰረት ሽፍቶቹ የጥበቃ ኃይሉን በማጥቃት በልጆች ላይ ተኩስ ከፍቷል። መኖርያ ቤቶችንም በእሳት አጋይተዋል።ማንነቱ
108
+ ያልተገለፀው የጥበቃ ኃይል አባል አጥቂዎቹ በአቅራቢያው ከሚገኘው ዛምፋራ ክፍለ፡ሀገር የመጡ ናቸው ብሏል።'
109
+ - source_sentence: በሲዳማ የህዝብ ውሳኔ ጥቅም ላይ በሚውሉ ምልክቶች ዙሪያ ውይይት እየተደረገ ነው
110
+ sentences:
111
+ - – በአገሪቱ በኢንዱስትሪው ዘርፍ ፈጣን የሆነ ዕድገት ለማስመዝገብ በየደረጃው የሚገኙ አስፈጻሚው አካላት የበኩላቸውን ሚና እንዲጫወቱ
112
+ የኢንዱስትሪ ሚኒስቴር ጥሪ አቀረበ።ጥሪው የቀረበው ሚኒስቴሩ በሥሩ ከሚገኙት ተጠሪ ተቋማት ለተውጣጡ 150 አመራሮች በአገሪቱ
113
+ ኢንዱስትሪ ልማት ስትራቴጂ ላይ ለሶስት ተከታታይ ቀናት በሰጠው ሥልጠና ማጠናቀቂያ ላይ ነው።የኢንዱስትሪ ሚኒስትር ክቡር አቶ
114
+ አህመድ አብተው በወቅቱ እንደገለጹት የኢንዱስትሪ ልማቱን ዕድገት ለማፋጠን የአስፈጻሚ አካላት ሚና ወሳኝ ነው።የአስፈጻሚ አካላት
115
+ ሚናቸውን እንዲወጡም በኢንዱስትሪ ልማት እስትራቴጂው ላይ ያላቸው ግንዛቤና የማስፈጸም ብቃት ወሳኝ እንደሆነም ሚኒስትሩ ተናግረዋል።ለሦስት
116
+ ተከታታይ ቀናት የተሠጠው ሥልጠና አመራሩ በተግባር ወቅት የሚያጋጥሙትን ችግሮች እንዲፈታና በዘርፉ ያለውን ዕድገት ለማሻሻል
117
+ እንደሚያግዝ ሚኒስትሩ መናገራቸውን ዋልታ ዘግቧል።
118
+ - ያለፉትን ሁለት ዓመታት የኢትዮጵያ ብሔራዊ ቡድንን በማሰልጠን የቆዩት ኢንስትራክተር አብርሀም መብራቱ ከሁለት ቀናት በኃላ ሐምሌ
119
+ ሠላሳ ኮንትራታቸው የሚያበቃ ይሆናል። ፌዴሬሽኑ በበኩሉ የአሰልጣኙን ውል በተለያዩ ምክንያቶች እንደማያድስ በይፋ መግለፁ ይታወቃል።
120
+ በዚህ መነሻነት አሰልጣኙ ከተለያዩ ክለቦች ጋ��� ስማቸው እየተያያዘ ይገኛል። ስለሚነሳው ጉዳይ እና በቀጣይ የብሔራዊ ቡድን ኮንትራታቸው
121
+ ካበቃ በኋላ እቅዳቸው ምን ይሆን በማለት ላቀረብንላቸው ጥያቄ ተከታዩን ምላሽ ሰጥተውናል።“እስካሁን ከማንም ጋር በዚህ ጉዳይ
122
+ አልተነጋገርኩም። እስከ ሐምሌ ሠላሳ የፌዴሬሽኑ ሠራተኛ ነኝ፤ በዚህ መሐል ከማንም ጋር መነጋገር አልችልም። ከዚህ ክለብ ጋር
123
+ ተስማምቷል የሚሉ ነገሮችን በተለያዩ መገናኛ ብዙሀን እሰማለው። እኔ ግን በግልፅ ከአንዳቸው ጋር አልተነጋገርኩም። ከካፍ እና
124
+ ከፊፋ ጋር የምሰራቸው ሥራዎች (የቪዲዮ ኮንፍረሶች) አሉ። እነርሱ ሥራ ላይ ትኩረት እያደረኩ ነው ያለሁት። በቀጣይ ከፈጣሪ
125
+ ጋር ማረፊያዬን አሳውቃለው። እዚሁ በሀገሬ እየሰራው የምቆይ ይመስለኛል። ለማንኛውም ከሐምሌ ሠላሳ በኃላ የሚሆነውን አብረን
126
+ እናያለን።” ብለዋል።
127
+ - የሲዳማ ዞን ክልል ሆኖ ለመደራጀት በሚካሄደው የህዝብ ውሳኔ ጥቅም ላይ በሚውሉ ምልክቶች ውይይት እየተደረገ መሆኑን የኢትዮጵያ
128
+ ብሔራዊ ምርጫ ቦርድ አስታውቋል፡፡በምልክቶቹ የመጀመሪያው ረቂቅ ላይ ለመወሰን የደቡብ ክልል ምክር ቤት ውይይት እየተደረገ መሆኑን
129
+ በኢትዮጵያ ብሔራዊ ምርጫ ቦርድ ኮምዩኒኬሽንስ አማካሪ ወ/ት ሶሊያና ሽመልስ ተናግረዋል፡፡በህዝበ ውሳኔው የሚቀርቡ ምልክቶቹ
130
+ ምን አይነት ይሁኑ በሚለው እና ምልክቶቹ በተቀመጠው መስፈርት መሰረት ገለልተኛ፣ የማህበረሰቡን ምስል የሚያሳዩ እንዲሁም ጥያቄዎቹ
131
+ ግልጽ እንዲሆኑ እየተሰራ ነው ተብሏል፡፡በውይይቱ ላይ ስምምነት የተደረሰባቸው ምልክቶች ለህዝብ ይፋ እንደሚደረጉ ተጠቁሟል፡፡የህዝበ
132
+ ውሳኔው አፈጻጸሞች በክልሉ ጥያቄ ለተወሰኑ ቀናቶች ከተራዘሙት ውጪ አብዛኞቹ በተያዘላቸው መርሀ ግብር እየተከናወኑ እንደሆነም
133
+ ተነግሯል፡፡የህግ አስፈጻሚ እና የጸጥታ አካላት እንዲሁም የቦርዱ የስራ አመራር አባላት የህዝበ ውሳኔውን አፈጻጸም ሰላማዊነት
134
+ ለማረጋገጥ ውይይት ማካሄዳቸው ታውቋል፡፡የድምፅ ሰጪዎች ምዝገባ፣ እንዲሁም የድምፅ መስጫ እና ድህረ ምርጫ ሂደቱን ሰላማዊነት
135
+ ለማረጋገጥ እንዲሁም የምርጫ አስፈጻሚዎችን ደህንነት ለማስጠበቅ የህግ አስፈጻሚ አካላት ትብብር እንደሚያስፈልግ ቦርዱ ለተሳታፊዎቹ
136
+ ማስገንዘቡ ተገልጿል፡፡ለህዝበ ውሳኔ ምርጫ አስፈፃሚዎች ስልጠና በአዲስ አበባ ከተማ ከመስከረም 24 እስከ 30 ከተሰጠ በኋላ
137
+ እንደሚሰማሩም የኢቢሲ ዘገባ አመልክቷል፡፡በቀጣይ የሚካሄዱ ተግባራትም በመርሃ ግብሩ መሰረት ለማከናወን ዝግጅቶች እየተካሄዱ
138
+ እንዳለ ለማወቅ ተችሏል፡፡በተያያዘ ዜና የኢትዮጵያ ብሔራዊ ምርጫ ቦርድ በመጪው ህዳር 3 ቀን 2012 ዓ.ም የሲዳማ ዞን የክልልነት
139
+ ጥያቄን ህዝበ ውሳኔ አማራጭ ሃሳቦችና የሚወከሉበት ምልክቶችን ይፋ አድርጓልበዚህም መሰረት “ሲዳማ በደቡብ ብሔር ብሔረሰቦችና
140
+ ህዝቦች ክልል ውስጥ እንዲቆይ እፈልጋለሁ” ለሚለው አማራጭ የጎጆ ቤት ምልክት፣ “ሲዳማ ራሱን ችሎ በክልልነት እንዲደራጅ እፈልጋለሁ”
141
+ ለሚለው አማራጭ የሻፌታ ምልክት ሆኖ ለህዝበ ውሳኔው ድምጽ መስጫነት እንዲያገለግል ተወስኗል ።
142
+ - source_sentence: ሁለት የብአዴን አመራሮች ላይ ያነጣጠረ ጥቃት በደብረ ማርቆስ መፈጸሙ ተሰማ
143
+ sentences:
144
+ - "አንድነት ለዲሞክራሲና ለፍትህ ፓርቲ በሚቀጥሉት የምርጫ ወራት በሚልዮኖች ድምጽ ለነጻና ፍትሀዊ ምርጫ የኢትዮጵያ ህዝብ የስልጣን\
145
+ \ ባለቤት እንዲሆን እናደርጋለን ሲል ዛሬ ረፋዱ ላይ በጽህፈት ቤቱ በሰጠው መግለጫ ላይ ባሰራጨው ጽሁፍ ግልጽ አድርጓል።ከዚህ\
146
+ \ ቀደም ፓርቲው ያካሄዳቸውን የሚልዮኖች ድምጽ ለነጻነትና የ���ልዮኖች ድምጽ ለመሬት ባለቤትነት ንቅናቄዎች አስታውሶ በተለይ\
147
+ \ በመጀመርያው እንቅስቃሴ የፈለገውን ውጤት እንዳገኘ የፓርቲው የውጭ ግንኙነት ሃላፊ አቶ ዳንኤል ተፈራ አብራርተዋል።ሶስተኛውና\
148
+ \ የመጨረሻው የአንድነቶች የሚልዮኖች ድምጽ እንቅስቃሴ ይኸው የሚልዮኖች ድምጽ ለነጻነትና ለፍትሀዊ ምርጫ የሚል መሆኑንም የጽሁፉ\
149
+ \ መግለጫ ይጠቁማል። አንድነት በሰላማዊ መንገድ የስልጣን ሽግግር ለማምጣት ላቀደው ዋነኛ የትግል ምዕራፍ በሀገራችን እውነተኛ\
150
+ \ ለውጥ እንዲመጣ የሚፈልጉ ዜጎች ሁሉ ፓርቲውን በአበላነትና በደጋፊነት በመቀላቀል የለውጡ አካል እንዲሆኑ የሚያደርግ ተደራጅ\
151
+ \ 2007 ለለውጥ የሚል ሰፊ የማደረጀትና የቅስቀሳ ዘመቻ ለማካሄድ ዝግጅቱን እንዳጠናቀቀ ገልጿል። ሙሉውን ዘገባ ያድምጡ።\
152
+ \ \n "
153
+ - 'የእንግሊዙ ጠቅላይ ሚኒስትር ቦሪስ ጆንሰን የጣሉትን ጥብቅ የእንቅስቃሴ እና የጉዞ እገዳ በመተላለፍ ወደ ቤተሰባቸው አቅንተዋል
154
+ የተባሉ አማካሪያቸውን ከኃላፊነት እንዲያነሱ የቀረበላቸውን ጥሪ ውድቅ አድርገዋል፡፡
155
+
156
+ የ2016ቱን የእንግሊዝን ከአውሮፓ ህብረት የመነጠል ሂደት (ብሬግዚት) በበላይነት የመሩት ዶሚኒኪ ከሚንግስ 400 ኪሎ ሜትሮችን
157
+ አቆራርጠው በሰሜናዊ እንግሊዝ ዱርሃም ወደሚገኙ ቤተሰቦቻቸው ያቀኑት ጆንሰን እገዳውን ባስተላለፉበት ባሳለፍነው ወርሃ መጋቢት
158
+ ነበር፡፡
159
+
160
+ በወቅቱ የከሚንግስ ባለቤት የኮሮና ህመም ምልክቶችን ያሳዩ ነበር የተባለ ሲሆን የአንድ ልጃቸውን ሁኔታ ለመመልከት ወደ ቤተሰባቸው
161
+ ማቅናታቸውም ይነገራል፡፡
162
+
163
+ ሆኖም የልጃቸውን ሁኔታ ቤተሰባቸው ሊከታተል እንደሚችል የሚናገሩ የተፎካካሪ ፖለቲካ ፓርቲዎች እገዳውን በመተላለፋቸው ከኃላፊነት
164
+ ሊነሱ ይገባል ሲሉ ድምጻቸውን አሰምተዋል፡፡
165
+
166
+ የጠቅላይ ሚኒስትሩ ጽህፈት ቤት ግን ጥያቄውን አልተቀበለም ሮይተርስ እንደዘገበው ከሆነ፡፡
167
+
168
+ አማካሪው የጥንቃቄ መርሆዎችን አክብረው የልጃቸውን ሁኔታ ለመመልከት ወደ ቤተሰባቸው ቢያቀኑም በአጎራባች መንደሮች ሆነው ሁኔታዎችን
169
+ ከመከታተል ውጪ ከቤተሰባቸው እንዳልተቀላቀሉም አስታውቋል፡፡
170
+
171
+ ከአማካሪያቸው ጉዞ ጥቂት ቀናት በፊት እገዳ ስለመጣላቸው አስታውቀው የነበሩት ጆንሰን ራሳቸው በቫይረሱ ተይዘው እንደነበር የሚታወስ
172
+ ነው፡፡
173
+
174
+ '
175
+ - ሁለት የብሔረ አማራ ዴሞክራሲያዊ ንቅናቄ (ብአዴን) ከፍተኛ አመራሮች ላይ ያነጣጠረ የጥቃት ሙከራ በደብረ ማርቆስ ከተማ መፈጸሙ
176
+ ተሰማ።የጥቃት ሙከራው የብአዴን መስራችና የቀድሞ የፖሊሲ ጥናትና ምርምር ማዕከል ምክትል ዋና ዳይሬክተርና የመንግሥት ኮሙዩኒኬሽን
177
+ ጉዳዮች ሚኒስትር የነበሩት አቶ በረከት ስምዖንና ሌላ የብአዴን ማዕከላዊ ኮሚቴ አባል በሆኑት አቶ ምግባሩ ከበደ ላይ መሆኑን
178
+ ከክልሉ መንግሥት የኮሙዩኒኬሽን ጉዳዮች ቢሮ ኃላፊ አቶ ንጉሡ ጥላሁን ያገኘነው መረጃ ያመለክታል።ሁለቱ የብአዴን አባላት በከተማው
179
+ ታይተዋል የሚል ወሬ በማኅበራዊ ድረ ገጾች መናፈሱን ተከትሎ፣ ግለሰቦቹ ለሌላ ተልዕኮ እየተንቀሳቀሱ እንደሆኑ የጠረጠሩ የከተማው
180
+ ነዋሪዎች በደብረ ማርቆስ ሆቴል ላይ ጉዳት ሲያደርሱ ትኩረት ከተደረገባቸው ፖለቲከኞች የአንዱ ነው ተብሎ የተጠረጠረ ተሽከርካሪ
181
+ በእሳት ማቃጠላቸውንም ለማወቅ ተችሏል።አቶ ንጉሡ ድርጊቱን ያወገዙ ሲሆን፣ በከተማው ታይተዋል ከተባሉ አመራሮች አንዱ አቶ ምግባሩ
182
+ በባህር ዳር የክልሉ ምክር ቤት ስብሰባ ላይ አብረዋቸው እየተሳተፉ እንደሚገኙ ገልጸዋል።‹‹ማንኛውም አመራርም ሆነ ዜጋ በየትኛውም
183
+ ቦታ የመንቀሳቀስ መብቱን ሊገድብ ���ሚችል ነገር ሊኖር አይገባም፤›› ያሉት አቶ ንጉሡ፣ ‹‹ሰሞኑን የአንዳንድ አመራሮች ስም
184
+ እየተጠቀሰ ሕዝቡን በማደናገርና ብጥብጥ በማንገስ በክልላችን የተገኘውን ሰላም ለመቀልበስ የሐሰት መረጃዎች እየተናፈሱ በመሆኑ
185
+ ሕዝባችን ታላቅ ጥንቃቄ ማድረግ ይገባዋል፤›› ሲሉ አሳስበዋል።ሁለቱ የብአዴን ፖለቲከኞች ለራሳቸው የፖለቲካ ፍላጎት በደብረ
186
+ ማርቆስ ከተማ በድብቅ ሕዝብ በማወያየት ላይ እንደሚገኙ የሚገልጽ ሐሰተኛ ወሬ የጥቃቱ ምክንያት እንደሆነ ተገልጿል።
187
+ pipeline_tag: sentence-similarity
188
+ library_name: sentence-transformers
189
+ metrics:
190
+ - cosine_accuracy@1
191
+ - cosine_accuracy@3
192
+ - cosine_accuracy@5
193
+ - cosine_accuracy@10
194
+ - cosine_precision@1
195
+ - cosine_precision@3
196
+ - cosine_precision@5
197
+ - cosine_precision@10
198
+ - cosine_recall@1
199
+ - cosine_recall@3
200
+ - cosine_recall@5
201
+ - cosine_recall@10
202
+ - cosine_ndcg@10
203
+ - cosine_mrr@10
204
+ - cosine_map@100
205
+ model-index:
206
+ - name: RoBERTa Amharic Text Embedding Base
207
+ results:
208
+ - task:
209
+ type: information-retrieval
210
+ name: Information Retrieval
211
+ dataset:
212
+ name: dim 768
213
+ type: dim_768
214
+ metrics:
215
+ - type: cosine_accuracy@1
216
+ value: 0.6833493743984601
217
+ name: Cosine Accuracy@1
218
+ - type: cosine_accuracy@3
219
+ value: 0.8075072184793071
220
+ name: Cosine Accuracy@3
221
+ - type: cosine_accuracy@5
222
+ value: 0.8511389156239975
223
+ name: Cosine Accuracy@5
224
+ - type: cosine_accuracy@10
225
+ value: 0.8966955405838948
226
+ name: Cosine Accuracy@10
227
+ - type: cosine_precision@1
228
+ value: 0.6833493743984601
229
+ name: Cosine Precision@1
230
+ - type: cosine_precision@3
231
+ value: 0.26916907282643565
232
+ name: Cosine Precision@3
233
+ - type: cosine_precision@5
234
+ value: 0.17022778312479947
235
+ name: Cosine Precision@5
236
+ - type: cosine_precision@10
237
+ value: 0.08966955405838947
238
+ name: Cosine Precision@10
239
+ - type: cosine_recall@1
240
+ value: 0.6833493743984601
241
+ name: Cosine Recall@1
242
+ - type: cosine_recall@3
243
+ value: 0.8075072184793071
244
+ name: Cosine Recall@3
245
+ - type: cosine_recall@5
246
+ value: 0.8511389156239975
247
+ name: Cosine Recall@5
248
+ - type: cosine_recall@10
249
+ value: 0.8966955405838948
250
+ name: Cosine Recall@10
251
+ - type: cosine_ndcg@10
252
+ value: 0.789918502095199
253
+ name: Cosine Ndcg@10
254
+ - type: cosine_mrr@10
255
+ value: 0.7557525041885003
256
+ name: Cosine Mrr@10
257
+ - type: cosine_map@100
258
+ value: 0.7589147484758277
259
+ name: Cosine Map@100
260
+ - task:
261
+ type: information-retrieval
262
+ name: Information Retrieval
263
+ dataset:
264
+ name: dim 512
265
+ type: dim_512
266
+ metrics:
267
+ - type: cosine_accuracy@1
268
+ value: 0.6791786974655117
269
+ name: Cosine Accuracy@1
270
+ - type: cosine_accuracy@3
271
+ value: 0.8103946102021174
272
+ name: Cosine Accuracy@3
273
+ - type: cosine_accuracy@5
274
+ value: 0.8521013795316009
275
+ name: Cosine Accuracy@5
276
+ - type: cosine_accuracy@10
277
+ value: 0.8938081488610844
278
+ name: Cosine Accuracy@10
279
+ - type: cosine_precision@1
280
+ value: 0.6791786974655117
281
+ name: Cosine Precision@1
282
+ - type: cosine_precision@3
283
+ value: 0.2701315367340391
284
+ name: Cosine Precision@3
285
+ - type: cosine_precision@5
286
+ value: 0.17042027590632017
287
+ name: Cosine Precision@5
288
+ - type: cosine_precision@10
289
+ value: 0.08938081488610844
290
+ name: Cosine Precision@10
291
+ - type: cosine_recall@1
292
+ value: 0.6791786974655117
293
+ name: Cosine Recall@1
294
+ - type: cosine_recall@3
295
+ value: 0.8103946102021174
296
+ name: Cosine Recall@3
297
+ - type: cosine_recall@5
298
+ value: 0.8521013795316009
299
+ name: Cosine Recall@5
300
+ - type: cosine_recall@10
301
+ value: 0.8938081488610844
302
+ name: Cosine Recall@10
303
+ - type: cosine_ndcg@10
304
+ value: 0.7881280947684205
305
+ name: Cosine Ndcg@10
306
+ - type: cosine_mrr@10
307
+ value: 0.7541048576419118
308
+ name: Cosine Mrr@10
309
+ - type: cosine_map@100
310
+ value: 0.7574278749340926
311
+ name: Cosine Map@100
312
+ - task:
313
+ type: information-retrieval
314
+ name: Information Retrieval
315
+ dataset:
316
+ name: dim 384
317
+ type: dim_384
318
+ metrics:
319
+ - type: cosine_accuracy@1
320
+ value: 0.6743663779274944
321
+ name: Cosine Accuracy@1
322
+ - type: cosine_accuracy@3
323
+ value: 0.8078280397818415
324
+ name: Cosine Accuracy@3
325
+ - type: cosine_accuracy@5
326
+ value: 0.8524222008341353
327
+ name: Cosine Accuracy@5
328
+ - type: cosine_accuracy@10
329
+ value: 0.891562399743343
330
+ name: Cosine Accuracy@10
331
+ - type: cosine_precision@1
332
+ value: 0.6743663779274944
333
+ name: Cosine Precision@1
334
+ - type: cosine_precision@3
335
+ value: 0.26927601326061384
336
+ name: Cosine Precision@3
337
+ - type: cosine_precision@5
338
+ value: 0.17048444016682704
339
+ name: Cosine Precision@5
340
+ - type: cosine_precision@10
341
+ value: 0.08915623997433429
342
+ name: Cosine Precision@10
343
+ - type: cosine_recall@1
344
+ value: 0.6743663779274944
345
+ name: Cosine Recall@1
346
+ - type: cosine_recall@3
347
+ value: 0.8078280397818415
348
+ name: Cosine Recall@3
349
+ - type: cosine_recall@5
350
+ value: 0.8524222008341353
351
+ name: Cosine Recall@5
352
+ - type: cosine_recall@10
353
+ value: 0.891562399743343
354
+ name: Cosine Recall@10
355
+ - type: cosine_ndcg@10
356
+ value: 0.7846183774496769
357
+ name: Cosine Ndcg@10
358
+ - type: cosine_mrr@10
359
+ value: 0.7501318932021533
360
+ name: Cosine Mrr@10
361
+ - type: cosine_map@100
362
+ value: 0.7535833309283083
363
+ name: Cosine Map@100
364
+ - task:
365
+ type: information-retrieval
366
+ name: Information Retrieval
367
+ dataset:
368
+ name: dim 256
369
+ type: dim_256
370
+ metrics:
371
+ - type: cosine_accuracy@1
372
+ value: 0.6750080205325634
373
+ name: Cosine Accuracy@1
374
+ - type: cosine_accuracy@3
375
+ value: 0.8039781841514276
376
+ name: Cosine Accuracy@3
377
+ - type: cosine_accuracy@5
378
+ value: 0.8479307025986526
379
+ name: Cosine Accuracy@5
380
+ - type: cosine_accuracy@10
381
+ value: 0.889637471928136
382
+ name: Cosine Accuracy@10
383
+ - type: cosine_precision@1
384
+ value: 0.6750080205325634
385
+ name: Cosine Precision@1
386
+ - type: cosine_precision@3
387
+ value: 0.2679927280504759
388
+ name: Cosine Precision@3
389
+ - type: cosine_precision@5
390
+ value: 0.16958614051973048
391
+ name: Cosine Precision@5
392
+ - type: cosine_precision@10
393
+ value: 0.0889637471928136
394
+ name: Cosine Precision@10
395
+ - type: cosine_recall@1
396
+ value: 0.6750080205325634
397
+ name: Cosine Recall@1
398
+ - type: cosine_recall@3
399
+ value: 0.8039781841514276
400
+ name: Cosine Recall@3
401
+ - type: cosine_recall@5
402
+ value: 0.8479307025986526
403
+ name: Cosine Recall@5
404
+ - type: cosine_recall@10
405
+ value: 0.889637471928136
406
+ name: Cosine Recall@10
407
+ - type: cosine_ndcg@10
408
+ value: 0.7833191781974063
409
+ name: Cosine Ndcg@10
410
+ - type: cosine_mrr@10
411
+ value: 0.7491374744743369
412
+ name: Cosine Mrr@10
413
+ - type: cosine_map@100
414
+ value: 0.7525946735652639
415
+ name: Cosine Map@100
416
+ - task:
417
+ type: information-retrieval
418
+ name: Information Retrieval
419
+ dataset:
420
+ name: dim 128
421
+ type: dim_128
422
+ metrics:
423
+ - type: cosine_accuracy@1
424
+ value: 0.6586461341033044
425
+ name: Cosine Accuracy@1
426
+ - type: cosine_accuracy@3
427
+ value: 0.7937119024703241
428
+ name: Cosine Accuracy@3
429
+ - type: cosine_accuracy@5
430
+ value: 0.8383060635226179
431
+ name: Cosine Accuracy@5
432
+ - type: cosine_accuracy@10
433
+ value: 0.8774462624318254
434
+ name: Cosine Accuracy@10
435
+ - type: cosine_precision@1
436
+ value: 0.6586461341033044
437
+ name: Cosine Precision@1
438
+ - type: cosine_precision@3
439
+ value: 0.2645706341567747
440
+ name: Cosine Precision@3
441
+ - type: cosine_precision@5
442
+ value: 0.16766121270452355
443
+ name: Cosine Precision@5
444
+ - type: cosine_precision@10
445
+ value: 0.08774462624318255
446
+ name: Cosine Precision@10
447
+ - type: cosine_recall@1
448
+ value: 0.6586461341033044
449
+ name: Cosine Recall@1
450
+ - type: cosine_recall@3
451
+ value: 0.7937119024703241
452
+ name: Cosine Recall@3
453
+ - type: cosine_recall@5
454
+ value: 0.8383060635226179
455
+ name: Cosine Recall@5
456
+ - type: cosine_recall@10
457
+ value: 0.8774462624318254
458
+ name: Cosine Recall@10
459
+ - type: cosine_ndcg@10
460
+ value: 0.7695387140279879
461
+ name: Cosine Ndcg@10
462
+ - type: cosine_mrr@10
463
+ value: 0.7347278875190328
464
+ name: Cosine Mrr@10
465
+ - type: cosine_map@100
466
+ value: 0.7387130394115222
467
+ name: Cosine Map@100
468
+ - task:
469
+ type: information-retrieval
470
+ name: Information Retrieval
471
+ dataset:
472
+ name: dim 64
473
+ type: dim_64
474
+ metrics:
475
+ - type: cosine_accuracy@1
476
+ value: 0.6336220725056144
477
+ name: Cosine Accuracy@1
478
+ - type: cosine_accuracy@3
479
+ value: 0.7776708373435997
480
+ name: Cosine Accuracy@3
481
+ - type: cosine_accuracy@5
482
+ value: 0.823227462303497
483
+ name: Cosine Accuracy@5
484
+ - type: cosine_accuracy@10
485
+ value: 0.8668591594481874
486
+ name: Cosine Accuracy@10
487
+ - type: cosine_precision@1
488
+ value: 0.6336220725056144
489
+ name: Cosine Precision@1
490
+ - type: cosine_precision@3
491
+ value: 0.2592236124478665
492
+ name: Cosine Precision@3
493
+ - type: cosine_precision@5
494
+ value: 0.16464549246069937
495
+ name: Cosine Precision@5
496
+ - type: cosine_precision@10
497
+ value: 0.08668591594481873
498
+ name: Cosine Precision@10
499
+ - type: cosine_recall@1
500
+ value: 0.6336220725056144
501
+ name: Cosine Recall@1
502
+ - type: cosine_recall@3
503
+ value: 0.7776708373435997
504
+ name: Cosine Recall@3
505
+ - type: cosine_recall@5
506
+ value: 0.823227462303497
507
+ name: Cosine Recall@5
508
+ - type: cosine_recall@10
509
+ value: 0.8668591594481874
510
+ name: Cosine Recall@10
511
+ - type: cosine_ndcg@10
512
+ value: 0.7515175976765435
513
+ name: Cosine Ndcg@10
514
+ - type: cosine_mrr@10
515
+ value: 0.7143954555407869
516
+ name: Cosine Mrr@10
517
+ - type: cosine_map@100
518
+ value: 0.7185585486743236
519
+ name: Cosine Map@100
520
+ ---
521
+
522
+ # RoBERTa Amharic Text Embedding Base
523
+
524
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [yosefw/roberta-base-am-embed](https://huggingface.co/yosefw/roberta-base-am-embed) on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
525
+
526
+ ## Model Details
527
+
528
+ ### Model Description
529
+ - **Model Type:** Sentence Transformer
530
+ - **Base model:** [yosefw/roberta-base-am-embed](https://huggingface.co/yosefw/roberta-base-am-embed) <!-- at revision 97c1c505e65ed1820f869bcbbd60a62ca968fa7c -->
531
+ - **Maximum Sequence Length:** 510 tokens
532
+ - **Output Dimensionality:** 768 dimensions
533
+ - **Similarity Function:** Cosine Similarity
534
+ - **Training Dataset:**
535
+ - json
536
+ - **Language:** en
537
+ - **License:** apache-2.0
538
+
539
+ ### Model Sources
540
+
541
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
542
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
543
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
544
+
545
+ ### Full Model Architecture
546
+
547
+ ```
548
+ SentenceTransformer(
549
+ (0): Transformer({'max_seq_length': 510, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
550
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
551
+ (2): Normalize()
552
+ )
553
+ ```
554
+
555
+ ## Usage
556
+
557
+ ### Direct Usage (Sentence Transformers)
558
+
559
+ First install the Sentence Transformers library:
560
+
561
+ ```bash
562
+ pip install -U sentence-transformers
563
+ ```
564
+
565
+ Then you can load this model and run inference.
566
+ ```python
567
+ from sentence_transformers import SentenceTransformer
568
+
569
+ # Download from the 🤗 Hub
570
+ model = SentenceTransformer("rasyosef/roberta-amharic-text-embedding-base")
571
+ # Run inference
572
+ sentences = [
573
+ 'ሁለት የብአዴን አመራሮች ላይ ያነጣጠረ ጥቃት በደብረ ማርቆስ መፈጸሙ ተሰማ',
574
+ 'ሁለት የብሔረ አማራ ዴሞክራሲያዊ ንቅናቄ (ብአዴን) ከፍተኛ አመራሮች ላይ ያነጣጠረ የጥቃት ሙከራ በደብረ ማርቆስ ከተማ መፈጸሙ ተሰማ።የጥቃት ሙከራው የብአዴን መስራችና የቀድሞ የፖሊሲ ጥናትና ምርምር ማዕከል ምክትል ዋና ዳይሬክተርና የመንግሥት ኮሙዩኒኬሽን ጉዳዮች ሚኒስትር የነበሩት አቶ በረከት ስምዖንና ሌላ የብአዴን ማዕከላዊ ኮሚቴ አባል በሆኑት አቶ ምግባሩ ከበደ ላይ መሆኑን ከክልሉ መንግሥት የኮሙዩኒኬሽን ጉዳዮች ቢሮ ኃላፊ አቶ ንጉሡ ጥላሁን ያገኘነው መረጃ ያመለክታል።ሁለቱ የብአዴን አባላት በከተማው ታይተዋል የሚል ወሬ በማኅበራዊ ድረ ገጾች መናፈሱን ተከትሎ፣ ግለሰቦቹ ለሌላ ተልዕኮ እየተንቀሳቀሱ እንደሆኑ የጠረጠሩ የከተማው ነዋሪዎች በደብረ ማርቆስ ሆቴል ላይ ጉዳት ሲያደርሱ ትኩረት ከተደረገባቸው ፖለቲከኞች የአንዱ ነው ተብሎ የተጠረጠረ ተሽከርካሪ በእሳት ማቃጠላቸውንም ለማወቅ ተችሏል።አቶ ንጉሡ ድርጊቱን ያወገዙ ሲሆን፣ በከተማው ታይተዋል ከተባሉ አመራሮች አንዱ አቶ ምግባሩ በባህር ዳር የክልሉ ምክር ቤት ስብሰባ ላይ አብረዋቸው እየተሳተፉ እንደሚገኙ ገልጸዋል።‹‹ማንኛውም አመራርም ሆነ ዜጋ በየትኛውም ቦታ የመንቀሳቀስ መብቱን ሊገድብ የሚችል ነገር ሊኖር አይገባም፤›› ያሉት አቶ ንጉሡ፣ ‹‹ሰሞኑን የአንዳንድ አመራሮች ስም እየተጠቀሰ ሕዝቡን በማደናገርና ብጥብጥ በማንገስ በክልላችን የተገኘውን ሰላም ለመቀልበስ የሐሰት መረጃዎች እየተናፈሱ በመሆኑ ሕዝባችን ታላቅ ጥንቃቄ ማድረግ ይገባዋል፤›› ሲሉ አሳስበዋል።ሁለቱ የብአዴን ፖለቲከኞች ለራሳቸው የፖለቲካ ፍላጎት በደብረ ማርቆስ ከተማ በድብቅ ሕዝብ በማወያየት ላይ እንደሚገኙ የሚገልጽ ሐሰተኛ ወሬ የጥቃቱ ምክንያት እንደሆነ ተገልጿል።',
575
+ 'የ���ንግሊዙ ጠቅላይ ሚኒስትር ቦሪስ ጆንሰን የጣሉትን ጥብቅ የእንቅስቃሴ እና የጉዞ እገዳ በመተላለፍ ወደ ቤተሰባቸው አቅንተዋል የተባሉ አማካሪያቸውን ከኃላፊነት እንዲያነሱ የቀረበላቸውን ጥሪ ውድቅ አድርገዋል፡፡\nየ2016ቱን የእንግሊዝን ከአውሮፓ ህብረት የመነጠል ሂደት (ብሬግዚት) በበላይነት የመሩት ዶሚኒኪ ከሚንግስ 400 ኪሎ ሜትሮችን አቆራርጠው በሰሜናዊ እንግሊዝ ዱርሃም ወደሚገኙ ቤተሰቦቻቸው ያቀኑት ጆንሰን እገዳውን ባስተላለፉበት ባሳለፍነው ወርሃ መጋቢት ነበር፡፡\nበወቅቱ የከሚንግስ ባለቤት የኮሮና ህመም ምልክቶችን ያሳዩ ነበር የተባለ ሲሆን የአንድ ልጃቸውን ሁኔታ ለመመልከት ወደ ቤተሰባቸው ማቅናታቸውም ይነገራል፡፡\nሆኖም የልጃቸውን ሁኔታ ቤተሰባቸው ሊከታተል እንደሚችል የሚናገሩ የተፎካካሪ ፖለቲካ ፓርቲዎች እገዳውን በመተላለፋቸው ከኃላፊነት ሊነሱ ይገባል ሲሉ ድምጻቸውን አሰምተዋል፡፡\nየጠቅላይ ሚኒስትሩ ጽህፈት ቤት ግን ጥያቄውን አልተቀበለም ሮይተርስ እንደዘገበው ከሆነ፡፡\nአማካሪው የጥንቃቄ መርሆዎችን አክብረው የልጃቸውን ሁኔታ ለመመልከት ወደ ቤተሰባቸው ቢያቀኑም በአጎራባች መንደሮች ሆነው ሁኔታዎችን ከመከታተል ውጪ ከቤተሰባቸው እንዳልተቀላቀሉም አስታውቋል፡፡\nከአማካሪያቸው ጉዞ ጥቂት ቀናት በፊት እገዳ ስለመጣላቸው አስታውቀው የነበሩት ጆንሰን ራሳቸው በቫይረሱ ተይዘው እንደነበር የሚታወስ ነው፡፡\n',
576
+ ]
577
+ embeddings = model.encode(sentences)
578
+ print(embeddings.shape)
579
+ # [3, 768]
580
+
581
+ # Get the similarity scores for the embeddings
582
+ similarities = model.similarity(embeddings, embeddings)
583
+ print(similarities.shape)
584
+ # [3, 3]
585
+ ```
586
+
587
+ <!--
588
+ ### Direct Usage (Transformers)
589
+
590
+ <details><summary>Click to see the direct usage in Transformers</summary>
591
+
592
+ </details>
593
+ -->
594
+
595
+ <!--
596
+ ### Downstream Usage (Sentence Transformers)
597
+
598
+ You can finetune this model on your own dataset.
599
+
600
+ <details><summary>Click to expand</summary>
601
+
602
+ </details>
603
+ -->
604
+
605
+ <!--
606
+ ### Out-of-Scope Use
607
+
608
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
609
+ -->
610
+
611
+ ## Evaluation
612
+
613
+ ### Metrics
614
+
615
+ #### Information Retrieval
616
+
617
+ * Datasets: `dim_768`, `dim_512`, `dim_384`, `dim_256`, `dim_128` and `dim_64`
618
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
619
+
620
+ | Metric | dim_768 | dim_512 | dim_384 | dim_256 | dim_128 | dim_64 |
621
+ |:--------------------|:-----------|:-----------|:-----------|:-----------|:-----------|:-----------|
622
+ | cosine_accuracy@1 | 0.6833 | 0.6792 | 0.6744 | 0.675 | 0.6586 | 0.6336 |
623
+ | cosine_accuracy@3 | 0.8075 | 0.8104 | 0.8078 | 0.804 | 0.7937 | 0.7777 |
624
+ | cosine_accuracy@5 | 0.8511 | 0.8521 | 0.8524 | 0.8479 | 0.8383 | 0.8232 |
625
+ | cosine_accuracy@10 | 0.8967 | 0.8938 | 0.8916 | 0.8896 | 0.8774 | 0.8669 |
626
+ | cosine_precision@1 | 0.6833 | 0.6792 | 0.6744 | 0.675 | 0.6586 | 0.6336 |
627
+ | cosine_precision@3 | 0.2692 | 0.2701 | 0.2693 | 0.268 | 0.2646 | 0.2592 |
628
+ | cosine_precision@5 | 0.1702 | 0.1704 | 0.1705 | 0.1696 | 0.1677 | 0.1646 |
629
+ | cosine_precision@10 | 0.0897 | 0.0894 | 0.0892 | 0.089 | 0.0877 | 0.0867 |
630
+ | cosine_recall@1 | 0.6833 | 0.6792 | 0.6744 | 0.675 | 0.6586 | 0.6336 |
631
+ | cosine_recall@3 | 0.8075 | 0.8104 | 0.8078 | 0.804 | 0.7937 | 0.7777 |
632
+ | cosine_recall@5 | 0.8511 | 0.8521 | 0.8524 | 0.8479 | 0.8383 | 0.8232 |
633
+ | cosine_recall@10 | 0.8967 | 0.8938 | 0.8916 | 0.8896 | 0.8774 | 0.8669 |
634
+ | **cosine_ndcg@10** | **0.7899** | **0.7881** | **0.7846** | **0.7833** | **0.7695** | **0.7515** |
635
+ | cosine_mrr@10 | 0.7558 | 0.7541 | 0.7501 | 0.7491 | 0.7347 | 0.7144 |
636
+ | cosine_map@100 | 0.7589 | 0.7574 | 0.7536 | 0.7526 | 0.7387 | 0.7186 |
637
+
638
+ <!--
639
+ ## Bias, Risks and Limitations
640
+
641
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
642
+ -->
643
+
644
+ <!--
645
+ ### Recommendations
646
+
647
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
648
+ -->
649
+
650
+ ## Training Details
651
+
652
+ ### Training Dataset
653
+
654
+ #### json
655
+
656
+ * Dataset: json
657
+ * Size: 28,046 training samples
658
+ * Columns: <code>anchor</code> and <code>positive</code>
659
+ * Approximate statistics based on the first 1000 samples:
660
+ | | anchor | positive |
661
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
662
+ | type | string | string |
663
+ | details | <ul><li>min: 4 tokens</li><li>mean: 14.56 tokens</li><li>max: 47 tokens</li></ul> | <ul><li>min: 42 tokens</li><li>mean: 204.24 tokens</li><li>max: 510 tokens</li></ul> |
664
+ * Samples:
665
+ | anchor | positive |
666
+ |:---------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
667
+ | <code>የዱር እንስሳት ከሰዎች ጋር በሚኖራቸው ቁርኝት ለኮሮናቫይረስ ተጋላጭ እንዳይሆኑ የመከላከል ተግባራትን እያከናወኑ መሆኑን ባለስልጣኑ አስታወቀ፡፡</code> | <code>ባሕርዳር፡ ግንቦት 18/2012 ዓ.ም (አብመድ) የአማራ ክልል የአካባቢ፣ የደንና የዱር እንስሳት ጥበቃና ልማት ባለስልጣን በሚያስተዳድራቸው ብሔራዊ ፓርኮች እና የማኅበረሰብ ጥብቅ ሥፍራዎች ከኮሮናቫይረስ ተጋላጭነት ለመከላከል እየሠራ መሆኑን አስታውቋል፡፡የባለስልጣኑ የኮሙዩኒኬሽን ዳይሬክተር ጋሻው እሸቱ 10 በሚሆኑ ብሔራዊ ፓርኮችና የማኅበረሰብ ጥብቅ ሥፍራዎች የኮሮና ቫይረስን መከላከል በሚቻልባቸው ቅድመ ተግባራት እና ርምጃዎች ላይ መምከራቸውን ተናግረዋል፡፡ የዱር እንስሳት በመንጋ የሚኖሩ፣ እርስ በርሳቸው ተመጋጋቢ፣ ከሰዎች እና ከቤት እንስሳቶች ጋር ሊቀላቀሉ የሚችሉ በመሆናቸው በኮሮናቫይረስ ከተጋለጡ ‘‘የኮሮናቫይረስ ተጋላጭነት በብርቅየ የዱር እንስሳት ብዝኃ ሕይወት ላይ ስጋት መሆን የለበትም’’ ያሉት አቶ ጋሻው በፓርኮቹ ውስጥ ለሚሠሩ የጥበቃ፣ ስካውት እና ለጽሕፈት ቤት ሠራተኞች በዘርፉ ላይ ያተኮረ የኮሮናቫይረስ መከላከያ ትምህርቶችን እና የቁሳቁስ ድጋፎችን ማድረጋቸውን አስታውቀዋል፡፡</code> |
668
+ | <code>የትግራይ ክልል የአየር መሥመር ለአገልግሎት ክፍት ሆነ፡፡</code> | <code><br>የትግራይ ክልል የአየር መሥመር ለአገልግሎት ክፍት ሆነ፡፡<br>ባሕር ዳር፡ ታኅሣሥ 05/2013 ዓ.ም (አብመድ) በሰሜን ኢትዮጵያ ትግራይ ክልል የህግ ማስከበር ሂደትን ተከትሎ ተዘግቶ የነበረው የአየር ክልል ከዛሬ ታህሣሥ 5/2013 ዓ.ም ከቀኑ 8 ሰዓት ጀምሮ በሰሜን የኢትዮጵያ የአየር ክልል ውስጥ የሚያቋርጡ የአለም አቀፍ እና የሃገር ውስጥ የበረራ መስመሮች ለአገልግሎት ክፍት ሆነዋል፡፡ አገልግሎት መሥጠት የሚችሉ ኤርፖርቶች በረራ ማስተናገድ የሚችሉ መሆኑንም የኢትዮጵያ ሲቪል አቪዬሽን ባለስልጣን ገልጿል::<br></code> |
669
+ | <code>የአውሮፓ ኢንቨስትመንት ባንክ ለመንግሥት 76 ሚሊዮን ዶላር ሊያበድር ነው</code> | <code>በዳዊት እንደሻውየአውሮፓ ኢንቨስትመንት ባንክ ጽሕፈት ቤቱን በአዲስ አበባ ከከፈተ ከሁለት ዓመት በኋላ ትልቅ ነው የተባለለትን የ76 ሚሊዮን ዶላር ብድር ስምምነት ለመፈራረም፣ ኃላፊዎቹን ወደ ኢትዮጵያ ይልካል፡፡ከወር በፊት በኢትዮጵያ መንግሥትና በባንኩ መካከል የተደረገው ይኼ የብድር ስምምነት፣ የኢትዮጵያ ልማት ባንክ በሊዝ ፋይናንሲንግ ለአነስተኛና ለመካከለኛ ኢንተርፕራይዞች ለሚያደርገው እገዛ ይውላል፡፡የአውሮፓ ኢንቨስትመንት ባንክ ምክትል ፕሬዚዳንት ፒም ቫን በሌኮም፣ እንዲሁም ሌሎች ኃላፊዎች ይመጣሉ ተብሎ ይጠበቃል፡፡በዚህም መሠረት የባንኩ ኃላፊዎች ከገንዘብና ኢኮኖሚ ትብብር ሚኒስቴር ጋር አድርገውት ከነበረው ስምምነት የሚቀጥልና ተመሳሳይ የሆነ ስምምነት፣ ከኢትዮጵያ ልማት ባንክ ጋር እንደሚያደርጉ ይጠበቃል፡፡እ.ኤ.አ. እስከ 2022 ድረስ የሚቀጥለው አነስተኛና መካከለኛ ኢንተርፕራይዞችን የማገዝ ፕሮጀክት 276 ሚሊዮን ዶላር ወጪ የሚያስወጣ ሲሆን፣ ባለፈው ዓመት የዓለም ባንክ ወደ 200 ሚሊዮን ዶላር ብድር ሰጥቷል፡፡በአውሮፓ ኢንቨስትመንት ባንክ የሚሰጠው ብድር፣ የኢትዮጵያ ልማት ባንክን የሊዝ ፋይናንሲንግ ሥራ እንደሚያግዝ ጉዳዩ የሚመለከታቸው የልማት ባንክ ኃላፊዎች ለሪፖርተር ተናግረዋል፡፡ ‹‹በተጨማሪም የውጭ ምንዛሪ እጥረቱን ለማቃለል ያግዛል፤›› ሲሉ ኃላፊው ገልጸዋል፡፡በልማት ባንክ በኩል የሚደረገው እገዛ በሁለት መስኮቶች የሚወጣ ሲሆን፣ አንደኛው በቀጥታ በባንክ እንደ ሊዝ ፋይናንሲንግ ሲሰጥ ሌላው ደግሞ እንደ መሥሪያ ካፒታል ልማት ባንክ ለመረጣቸው 12 ባንኮችና ዘጠኝ ማይክሮ ፋይናንሶች ይሰጣል፡፡የአውሮፓ ኢንቨስትመንት ባንክ በኢትዮጵያ መንቀሳቀስ ከጀመረ ከ1980ዎቹ ጀምሮ ወደ ግማሽ ቢሊዮን ዶላር የሚጠጋ ለኃይል፣ ለኮሙዩኒኬሽንና ለግሉ ዘርፍ ኢ...</code> |
670
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
671
+ ```json
672
+ {
673
+ "loss": "MultipleNegativesRankingLoss",
674
+ "matryoshka_dims": [
675
+ 768,
676
+ 512,
677
+ 384,
678
+ 256,
679
+ 128,
680
+ 64
681
+ ],
682
+ "matryoshka_weights": [
683
+ 1,
684
+ 1,
685
+ 1,
686
+ 1,
687
+ 1,
688
+ 1
689
+ ],
690
+ "n_dims_per_step": -1
691
+ }
692
+ ```
693
+
694
+ ### Training Hyperparameters
695
+ #### Non-Default Hyperparameters
696
+
697
+ - `eval_strategy`: epoch
698
+ - `per_device_train_batch_size`: 128
699
+ - `per_device_eval_batch_size`: 128
700
+ - `num_train_epochs`: 4
701
+ - `lr_scheduler_type`: cosine
702
+ - `warmup_ratio`: 0.1
703
+ - `fp16`: True
704
+ - `load_best_model_at_end`: True
705
+ - `optim`: adamw_torch_fused
706
+ - `batch_sampler`: no_duplicates
707
+
708
+ #### All Hyperparameters
709
+ <details><summary>Click to expand</summary>
710
+
711
+ - `overwrite_output_dir`: False
712
+ - `do_predict`: False
713
+ - `eval_strategy`: epoch
714
+ - `prediction_loss_only`: True
715
+ - `per_device_train_batch_size`: 128
716
+ - `per_device_eval_batch_size`: 128
717
+ - `per_gpu_train_batch_size`: None
718
+ - `per_gpu_eval_batch_size`: None
719
+ - `gradient_accumulation_steps`: 1
720
+ - `eval_accumulation_steps`: None
721
+ - `torch_empty_cache_steps`: None
722
+ - `learning_rate`: 5e-05
723
+ - `weight_decay`: 0.0
724
+ - `adam_beta1`: 0.9
725
+ - `adam_beta2`: 0.999
726
+ - `adam_epsilon`: 1e-08
727
+ - `max_grad_norm`: 1.0
728
+ - `num_train_epochs`: 4
729
+ - `max_steps`: -1
730
+ - `lr_scheduler_type`: cosine
731
+ - `lr_scheduler_kwargs`: {}
732
+ - `warmup_ratio`: 0.1
733
+ - `warmup_steps`: 0
734
+ - `log_level`: passive
735
+ - `log_level_replica`: warning
736
+ - `log_on_each_node`: True
737
+ - `logging_nan_inf_filter`: True
738
+ - `save_safetensors`: True
739
+ - `save_on_each_node`: False
740
+ - `save_only_model`: False
741
+ - `restore_callback_states_from_checkpoint`: False
742
+ - `no_cuda`: False
743
+ - `use_cpu`: False
744
+ - `use_mps_device`: False
745
+ - `seed`: 42
746
+ - `data_seed`: None
747
+ - `jit_mode_eval`: False
748
+ - `use_ipex`: False
749
+ - `bf16`: False
750
+ - `fp16`: True
751
+ - `fp16_opt_level`: O1
752
+ - `half_precision_backend`: auto
753
+ - `bf16_full_eval`: False
754
+ - `fp16_full_eval`: False
755
+ - `tf32`: None
756
+ - `local_rank`: 0
757
+ - `ddp_backend`: None
758
+ - `tpu_num_cores`: None
759
+ - `tpu_metrics_debug`: False
760
+ - `debug`: []
761
+ - `dataloader_drop_last`: False
762
+ - `dataloader_num_workers`: 0
763
+ - `dataloader_prefetch_factor`: None
764
+ - `past_index`: -1
765
+ - `disable_tqdm`: False
766
+ - `remove_unused_columns`: True
767
+ - `label_names`: None
768
+ - `load_best_model_at_end`: True
769
+ - `ignore_data_skip`: False
770
+ - `fsdp`: []
771
+ - `fsdp_min_num_params`: 0
772
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
773
+ - `fsdp_transformer_layer_cls_to_wrap`: None
774
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
775
+ - `deepspeed`: None
776
+ - `label_smoothing_factor`: 0.0
777
+ - `optim`: adamw_torch_fused
778
+ - `optim_args`: None
779
+ - `adafactor`: False
780
+ - `group_by_length`: False
781
+ - `length_column_name`: length
782
+ - `ddp_find_unused_parameters`: None
783
+ - `ddp_bucket_cap_mb`: None
784
+ - `ddp_broadcast_buffers`: False
785
+ - `dataloader_pin_memory`: True
786
+ - `dataloader_persistent_workers`: False
787
+ - `skip_memory_metrics`: True
788
+ - `use_legacy_prediction_loop`: False
789
+ - `push_to_hub`: False
790
+ - `resume_from_checkpoint`: None
791
+ - `hub_model_id`: None
792
+ - `hub_strategy`: every_save
793
+ - `hub_private_repo`: None
794
+ - `hub_always_push`: False
795
+ - `gradient_checkpointing`: False
796
+ - `gradient_checkpointing_kwargs`: None
797
+ - `include_inputs_for_metrics`: False
798
+ - `include_for_metrics`: []
799
+ - `eval_do_concat_batches`: True
800
+ - `fp16_backend`: auto
801
+ - `push_to_hub_model_id`: None
802
+ - `push_to_hub_organization`: None
803
+ - `mp_parameters`:
804
+ - `auto_find_batch_size`: False
805
+ - `full_determinism`: False
806
+ - `torchdynamo`: None
807
+ - `ray_scope`: last
808
+ - `ddp_timeout`: 1800
809
+ - `torch_compile`: False
810
+ - `torch_compile_backend`: None
811
+ - `torch_compile_mode`: None
812
+ - `dispatch_batches`: None
813
+ - `split_batches`: None
814
+ - `include_tokens_per_second`: False
815
+ - `include_num_input_tokens_seen`: False
816
+ - `neftune_noise_alpha`: None
817
+ - `optim_target_modules`: None
818
+ - `batch_eval_metrics`: False
819
+ - `eval_on_start`: False
820
+ - `use_liger_kernel`: False
821
+ - `eval_use_gather_object`: False
822
+ - `average_tokens_across_devices`: False
823
+ - `prompts`: None
824
+ - `batch_sampler`: no_duplicates
825
+ - `multi_dataset_batch_sampler`: proportional
826
+
827
+ </details>
828
+
829
+ ### Training Logs
830
+ | Epoch | Step | Training Loss | dim_768_cosine_ndcg@10 | dim_512_cosine_ndcg@10 | dim_384_cosine_ndcg@10 | dim_256_cosine_ndcg@10 | dim_128_cosine_ndcg@10 | dim_64_cosine_ndcg@10 |
831
+ |:-------:|:-------:|:-------------:|:----------------------:|:----------------------:|:----------------------:|:----------------------:|:----------------------:|:---------------------:|
832
+ | 0.0455 | 10 | 19.6872 | - | - | - | - | - | - |
833
+ | 0.0909 | 20 | 11.0221 | - | - | - | - | - | - |
834
+ | 0.1364 | 30 | 4.1418 | - | - | - | - | - | - |
835
+ | 0.1818 | 40 | 2.6854 | - | - | - | - | - | - |
836
+ | 0.2273 | 50 | 2.1661 | - | - | - | - | - | - |
837
+ | 0.2727 | 60 | 1.7602 | - | - | - | - | - | - |
838
+ | 0.3182 | 70 | 1.6862 | - | - | - | - | - | - |
839
+ | 0.3636 | 80 | 1.484 | - | - | - | - | - | - |
840
+ | 0.4091 | 90 | 1.2841 | - | - | - | - | - | - |
841
+ | 0.4545 | 100 | 1.3569 | - | - | - | - | - | - |
842
+ | 0.5 | 110 | 1.3734 | - | - | - | - | - | - |
843
+ | 0.5455 | 120 | 1.3205 | - | - | - | - | - | - |
844
+ | 0.5909 | 130 | 1.1156 | - | - | - | - | - | - |
845
+ | 0.6364 | 140 | 1.0249 | - | - | - | - | - | - |
846
+ | 0.6818 | 150 | 1.0461 | - | - | - | - | - | - |
847
+ | 0.7273 | 160 | 1.0729 | - | - | - | - | - | - |
848
+ | 0.7727 | 170 | 0.9913 | - | - | - | - | - | - |
849
+ | 0.8182 | 180 | 1.027 | - | - | - | - | - | - |
850
+ | 0.8636 | 190 | 1.0165 | - | - | - | - | - | - |
851
+ | 0.9091 | 200 | 0.9928 | - | - | - | - | - | - |
852
+ | 0.9545 | 210 | 0.971 | - | - | - | - | - | - |
853
+ | 1.0 | 220 | 0.9636 | 0.7656 | 0.7614 | 0.7588 | 0.7534 | 0.7385 | 0.7081 |
854
+ | 1.0455 | 230 | 1.0605 | - | - | - | - | - | - |
855
+ | 1.0909 | 240 | 0.9032 | - | - | - | - | - | - |
856
+ | 1.1364 | 250 | 0.7504 | - | - | - | - | - | - |
857
+ | 1.1818 | 260 | 0.7361 | - | - | - | - | - | - |
858
+ | 1.2273 | 270 | 0.4918 | - | - | - | - | - | - |
859
+ | 1.2727 | 280 | 0.3651 | - | - | - | - | - | - |
860
+ | 1.3182 | 290 | 0.3963 | - | - | - | - | - | - |
861
+ | 1.3636 | 300 | 0.4032 | - | - | - | - | - | - |
862
+ | 1.4091 | 310 | 0.2712 | - | - | - | - | - | - |
863
+ | 1.4545 | 320 | 0.26 | - | - | - | - | - | - |
864
+ | 1.5 | 330 | 0.3159 | - | - | - | - | - | - |
865
+ | 1.5455 | 340 | 0.2913 | - | - | - | - | - | - |
866
+ | 1.5909 | 350 | 0.2569 | - | - | - | - | - | - |
867
+ | 1.6364 | 360 | 0.1793 | - | - | - | - | - | - |
868
+ | 1.6818 | 370 | 0.2063 | - | - | - | - | - | - |
869
+ | 1.7273 | 380 | 0.2065 | - | - | - | - | - | - |
870
+ | 1.7727 | 390 | 0.1945 | - | - | - | - | - | - |
871
+ | 1.8182 | 400 | 0.2352 | - | - | - | - | - | - |
872
+ | 1.8636 | 410 | 0.2077 | - | - | - | - | - | - |
873
+ | 1.9091 | 420 | 0.2017 | - | - | - | - | - | - |
874
+ | 1.9545 | 430 | 0.1806 | - | - | - | - | - | - |
875
+ | 2.0 | 440 | 0.2214 | 0.7773 | 0.7754 | 0.7738 | 0.7670 | 0.7552 | 0.7332 |
876
+ | 2.0455 | 450 | 0.2133 | - | - | - | - | - | - |
877
+ | 2.0909 | 460 | 0.2202 | - | - | - | - | - | - |
878
+ | 2.1364 | 470 | 0.1333 | - | - | - | - | - | - |
879
+ | 2.1818 | 480 | 0.1789 | - | - | - | - | - | - |
880
+ | 2.2273 | 490 | 0.1025 | - | - | - | - | - | - |
881
+ | 2.2727 | 500 | 0.0897 | - | - | - | - | - | - |
882
+ | 2.3182 | 510 | 0.1128 | - | - | - | - | - | - |
883
+ | 2.3636 | 520 | 0.1218 | - | - | - | - | - | - |
884
+ | 2.4091 | 530 | 0.0747 | - | - | - | - | - | - |
885
+ | 2.4545 | 540 | 0.0596 | - | - | - | - | - | - |
886
+ | 2.5 | 550 | 0.0942 | - | - | - | - | - | - |
887
+ | 2.5455 | 560 | 0.1011 | - | - | - | - | - | - |
888
+ | 2.5909 | 570 | 0.0606 | - | - | - | - | - | - |
889
+ | 2.6364 | 580 | 0.0483 | - | - | - | - | - | - |
890
+ | 2.6818 | 590 | 0.057 | - | - | - | - | - | - |
891
+ | 2.7273 | 600 | 0.0504 | - | - | - | - | - | - |
892
+ | 2.7727 | 610 | 0.0497 | - | - | - | - | - | - |
893
+ | 2.8182 | 620 | 0.0585 | - | - | - | - | - | - |
894
+ | 2.8636 | 630 | 0.0791 | - | - | - | - | - | - |
895
+ | 2.9091 | 640 | 0.0556 | - | - | - | - | - | - |
896
+ | 2.9545 | 650 | 0.0555 | - | - | - | - | - | - |
897
+ | 3.0 | 660 | 0.0598 | 0.7857 | 0.7821 | 0.7811 | 0.7766 | 0.7650 | 0.7443 |
898
+ | 3.0455 | 670 | 0.081 | - | - | - | - | - | - |
899
+ | 3.0909 | 680 | 0.065 | - | - | - | - | - | - |
900
+ | 3.1364 | 690 | 0.0566 | - | - | - | - | - | - |
901
+ | 3.1818 | 700 | 0.0758 | - | - | - | - | - | - |
902
+ | 3.2273 | 710 | 0.0378 | - | - | - | - | - | - |
903
+ | 3.2727 | 720 | 0.04 | - | - | - | - | - | - |
904
+ | 3.3182 | 730 | 0.0465 | - | - | - | - | - | - |
905
+ | 3.3636 | 740 | 0.0426 | - | - | - | - | - | - |
906
+ | 3.4091 | 750 | 0.0348 | - | - | - | - | - | - |
907
+ | 3.4545 | 760 | 0.0254 | - | - | - | - | - | - |
908
+ | 3.5 | 770 | 0.044 | - | - | - | - | - | - |
909
+ | 3.5455 | 780 | 0.0455 | - | - | - | - | - | - |
910
+ | 3.5909 | 790 | 0.0274 | - | - | - | - | - | - |
911
+ | 3.6364 | 800 | 0.0212 | - | - | - | - | - | - |
912
+ | 3.6818 | 810 | 0.0279 | - | - | - | - | - | - |
913
+ | 3.7273 | 820 | 0.0269 | - | - | - | - | - | - |
914
+ | 3.7727 | 830 | 0.0243 | - | - | - | - | - | - |
915
+ | 3.8182 | 840 | 0.03 | - | - | - | - | - | - |
916
+ | 3.8636 | 850 | 0.0359 | - | - | - | - | - | - |
917
+ | 3.9091 | 860 | 0.0308 | - | - | - | - | - | - |
918
+ | 3.9545 | 870 | 0.0253 | - | - | - | - | - | - |
919
+ | **4.0** | **880** | **0.0417** | **0.7899** | **0.7881** | **0.7846** | **0.7833** | **0.7695** | **0.7515** |
920
+
921
+ * The bold row denotes the saved checkpoint.
922
+
923
+ ### Framework Versions
924
+ - Python: 3.10.12
925
+ - Sentence Transformers: 3.3.1
926
+ - Transformers: 4.47.1
927
+ - PyTorch: 2.5.1+cu121
928
+ - Accelerate: 1.2.1
929
+ - Datasets: 3.2.0
930
+ - Tokenizers: 0.21.0
931
+
932
+ ## Citation
933
+
934
+ ### BibTeX
935
+
936
+ #### Sentence Transformers
937
+ ```bibtex
938
+ @inproceedings{reimers-2019-sentence-bert,
939
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
940
+ author = "Reimers, Nils and Gurevych, Iryna",
941
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
942
+ month = "11",
943
+ year = "2019",
944
+ publisher = "Association for Computational Linguistics",
945
+ url = "https://arxiv.org/abs/1908.10084",
946
+ }
947
+ ```
948
+
949
+ #### MatryoshkaLoss
950
+ ```bibtex
951
+ @misc{kusupati2024matryoshka,
952
+ title={Matryoshka Representation Learning},
953
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
954
+ year={2024},
955
+ eprint={2205.13147},
956
+ archivePrefix={arXiv},
957
+ primaryClass={cs.LG}
958
+ }
959
+ ```
960
+
961
+ #### MultipleNegativesRankingLoss
962
+ ```bibtex
963
+ @misc{henderson2017efficient,
964
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
965
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
966
+ year={2017},
967
+ eprint={1705.00652},
968
+ archivePrefix={arXiv},
969
+ primaryClass={cs.CL}
970
+ }
971
+ ```
972
+
973
+ <!--
974
+ ## Glossary
975
+
976
+ *Clearly define terms in order to be accessible across audiences.*
977
+ -->
978
+
979
+ <!--
980
+ ## Model Card Authors
981
+
982
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
983
+ -->
984
+
985
+ <!--
986
+ ## Model Card Contact
987
+
988
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
989
+ -->
config.json ADDED
@@ -0,0 +1,29 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "yosefw/roberta-base-am-embed",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 768,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 3072,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 512,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 12,
19
+ "num_hidden_layers": 12,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "tokenizer_class": "XLMRobertaTokenizerFast",
24
+ "torch_dtype": "float32",
25
+ "transformers_version": "4.47.1",
26
+ "type_vocab_size": 1,
27
+ "use_cache": true,
28
+ "vocab_size": 32000
29
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.1",
4
+ "transformers": "4.47.1",
5
+ "pytorch": "2.5.1+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:10d758e47814671f780b8e63bc91ee0eb480501062997b0d4e7ddf8db7790401
3
+ size 442488672
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 510,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,62 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "4": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": false,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "extra_special_tokens": {},
49
+ "mask_token": "<mask>",
50
+ "max_length": 510,
51
+ "model_max_length": 510,
52
+ "pad_to_multiple_of": null,
53
+ "pad_token": "<pad>",
54
+ "pad_token_type_id": 0,
55
+ "padding_side": "right",
56
+ "sep_token": "</s>",
57
+ "stride": 0,
58
+ "tokenizer_class": "XLMRobertaTokenizer",
59
+ "truncation_side": "right",
60
+ "truncation_strategy": "longest_first",
61
+ "unk_token": "<unk>"
62
+ }