agentlans commited on
Commit
4536a9a
·
verified ·
1 Parent(s): ff62f82

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +31 -11
README.md CHANGED
@@ -55,7 +55,7 @@ license: apache-2.0
55
  datasets:
56
  - agentlans/LinguaNova
57
  base_model:
58
- - HuggingFaceTB/SmolLM2-135M
59
  tags:
60
  - multilingual
61
  - language-model
@@ -73,12 +73,12 @@ tags:
73
 
74
  # Multilingual SmolLM2-135M Base Model
75
 
76
- This SmolLM2 variant is pretrained on [agentlans/LinguaNova](https://huggingface.co/datasets/agentlans/LinguaNova), a small corpus covering 50 languages, unlike the original English-only models.
77
  With 135M parameters, it serves as a lightweight multilingual autocomplete but is **not instruction-tuned**—additional fine-tuning on your data is recommended.
78
 
79
  ## Key Points
80
 
81
- - **Multilingual:** Supports 50 languages, pretrained on top of [HuggingFaceTB/SmolLM2-135M](https://huggingface.co/HuggingFaceTB/SmolLM2-135M).
82
  - **Tokenizer:** English-based tokenizer limits performance on non-Latin scripts.
83
  - **Use Case:** Basic autocomplete and research; not ready for production or instruction tasks.
84
 
@@ -117,24 +117,44 @@ The **bold** text indicates the initial text used for the generation.
117
  These were autocompleted in [oobabooga/text-generation-webui](https://github.com/oobabooga/text-generation-webui) using the `min_p` preset.
118
  Whenever the generation stalled, the inference was stopped and regenerated.
119
 
120
- **Ara (Latin for "the Altar") is a southern constellation between Scorpius, Telescopium, Triangulum Australe, and Norma. It was (as ) one of the Greek bulk (namely 48) described by the 2nd-century astronomer Ptolemy, and it remains one of the 88 modern constellations designated by the International Astronomical Union.** "The most modern group of the modern universe" is the group of "The Tyball" whose most celebrated galaxy catalogues are the three galaxies from the Milky Way in the Milky Way. The galaxy Milky Way spans the Milky Way around the Milky Way, near where the Milky Way lies near the Milky Way. The Milky Way is also called the Milky Way because the Milky Way is the most widely known galaxies from the Milky Way. There is also a region that does not have the same Milky Way outside Milky Way in the Milky Way, where it appears to be the Milky Way. Milky Way is a very far-away galaxy, the Milky Way does not have the same Milky Way, which is where the Milky Way is.
121
 
122
- **Febrer és el mes més curt de l'any, però el 2008 ens ha regalat un dia i m'ha donat temps de llegir tres llibres. El primer molt llarg, però d'aquells que devores, perquè no t'hi pots aturar. L'he tret del Club de Lectura de l'Institut i és de la madrilenya Almudena GRANDES.** 1589 - Tatua, de 1502 - Fardó, d'un llama del seu pont dels gavelles de l'aniversari de Madrid, d'america, l'americana i els galítics i l'americana de Barcelona. El 2002 i els 1510 y que tenen l'india del poulement en els 2010 i la 1527. En 1520 i en 1521. El sistema de los alcaldes més més es-halt l'espat de la llocs de l'espat de l'Esquerra el 2001 - està s'encluye por la lliga, els eures d'aparats i que està s'en formulades en els llocs dels de l'a l'Amar, de 3000, però el 3000.
123
 
124
- **Підприємства Сумщини сплатили у лютому 2017 року понад 64 млн. гривень податку на прибуток Новини кожного дня. Суми Підприємства Сумщини сплатили у лютому 2017 року понад 64 млн. гривень податку на прибуток Таку цифру озвучив Олексій Мазуренко, в.о. начальника ГУ ДФС у Сумській області.** Сумщих СРЕ Досі ЗО 4- 6-5. Мілонал у Вукін 44 ч. для видани 4 з фоморці 4-им. З пріпяватий викорі - Упана на Кінг у Феврів писного діватим відовання забілявання усплектами (22 Пряне Вукий), озміція та на відповини архово. Комід ношої запізання зміньком місцом, збойнь пуновання язання діпьий дікализмоторями дідпорадувалаців 60 х Муре у моміни Кісанчком в шлюбом містового когатуть. Близникий на 54 цього увижатного Шворд Грипуцік 10 верх 1633-20 Бощанів - Гоє менді Тумання на Свою 2021 же самого, местьливника програмна Доровні у Свою - 2233-х3Х ЗСС ідпарять з міз яковь ся болек у хоційної бування обновувачний атхрва медіять знам при Непрем.
125
 
126
- **배터리 안전 Research In Motion에서 특정 BlackBerry 단말기 모델에 사용하도록 지정한 배터리만 사용해야 합니다. 다른 배터리를 사용하면 단말기에 제공된 보증이 무효화될 수 있습니다. 장치 및 배터리 폐기 현지 규정에 따라 BlackBerry 장치와 배터리를 재활용하십시오. 장치 또는 배터리를 화염에 버리지 마십시오.** 4 원 22-08-2020 - 10:44, 10:20, 10:20 연행한 적공기 비품식의 시전 가작에 가원 달리 추아 품분에 회운 전합 환 추물 6:51 당노 거리나 바리만 되체 및 디일조이 장이위포 서신 남히가 괄록 결정 바러류 있습니다. 그리 대시성 등을 가운 입이 전체정인 직을 공한 대터 관료 소벜직 가전 유시 중인후철 피기도와 예된 자물 30원 명두 후상어 전상 예버 차동고 기유의 경수 구철기오스팈 규전 보소록 자노 나우 기없 공구 관아 자물 등한 춌사의 평로 영격을 있습니다. 포전 있는 물공 톌침경원일 3-90대한 등이 영동의 가원전 가원겨 다카 국립 당치 1:8시 재
127
 
128
- **یورپ یورپ جگ دے ست براعظماں چوں اک اے۔ ایہہ ایشیا دے لیہندے پاسے وسدا اے۔ اے جگ دا دوجا سب توں نکا براعظم اے۔ یورپ چڑھدے چ روس دے ادھ چ واقع کوہ یورال تک اے تے قازقستان دا کجھ حصہ وی اس چ ہیگا اے ۔ قفقاز، کالا سمندر، باسفورس ایہنوں ایشیاء توں وکھ کردے نیں۔ یورپ دے اتر وچ ارکٹک سمندر،** بوں پراک میں نے کو گا لوے اکا ہڑو کو کے پیو چا کہ��ا ہاپا کو تکوما کے في کا متثور لیٹوا چا منزوز پیزے ہیں میں پی جارے انوارا سے پی چینا، ہوں ماکوم کو مارا تے زا۔نا کے کے گین تقصیب احتواء پکھ ہوں چ شز سرویڈ میں کر و کارمے ہے مدر یک آوا در پور ہورٹ کی نوم ہے پرم آم جام ہے کرد۔ یو چا کو ملی نام، کو دانش ارائے طوریٹ لیہوں کو رچیڈ بنیہ گون ہوئے دانی کو جمال یہ ساگرٹ بشیا کے مجھیر کو نے آموٹ کا اے لا را اور کوا کو کنیس یورا چو لماچ وی
129
 
 
130
 
131
- **食文化(しょくぶんか)は、食(食事)にまつわる文化のこと。 概要 食文化には、食材の選び方、献立の立て方、調理法といったことから、食器の選び方、また誰と、どのように食べるのか、といったことや、作法・マナーなどに至るまで多くのことが含まれる。 食の頻度、摂取する時刻、なども食文化の要素の一つである。**アイト、食商哪オンサイト、湖ヘスドアク、楽・ハイター、な絓のごめれなのとのというときるで、アククなつらなべのでも売ったんなめはア・てがからでは養しなんとして、無希も楽というだからわってきないとなるということです。 全から食哪においつつらえんなかならだん。そんなりまんというんかららなので語かられなからこのコパントというこんとは、間型にがもうたとなさみるファントアスをおくされた。 あらんできなさせんとでがならなかならだいとなせらうにつからではませんななまでいた。 ニスタワートを語んでなってまではおえんがないとの場で、どんだんできましたとは、ませんなった、からリシリバーれたとは、サウントのんかられでも、堁をならならっとした。 ピクスダシレマカウクエリショトクドキンテタバニスがどん。 『ダワイチからできんですからんとの空逝を含りたのは頿食のボーブトをおったとしません
132
 
133
- **Thampanoor murder accused Kalesh Arrested | കലേഷും ശ്രീനിവാസും തമ്മിലുള്ള പ്രശ്നങ്ങൾ പതിവ് സംഭവം; മദ്യപിച്ച് വാക്കേറ്റത്തിനിടെ പഴയ വഴക്കുകളും അടിപിടിയും എടുത്തിട്ടത് ഒപ്പമുണ്ടായിരുന്ന യുവാക്കൾ; പലതവണ തർക്കം കയ്യാങ്കളിയിലേക്ക് എത്തിയപ്പോൾ ഇടപെട്ടതും സുഹൃത്തുക്കൾ; ഒടുവിൽ തർക്കം മൂത്തപ്പോൾ ബിയർ കുപ്പി പൊട്ടിച്ച് ശ്രീനിവാസന്റെ കഴുത്തിന് കുത്തി;** വാഷ് ഉൻ തീഷരിരകാന് കൂരു ക്ലീണുമതാട്ട് ആസിട്ടുളിന് രാന്നുണന് ഇത്രതില്. ജയിലു ബേരകു ഉന്നിച്ചതികുള്ള കുള് മാണ് ചേവയു അക്ക്രണിടെ വദ്യണത്രണ് വാമാക്ക് കേശ്രക്കുന്നുണ്ടിന് മാണ്ടുയ്യുന്തി അവ്യ നെണിണ് ഒര്നികുമ്പ് നല്ലാൽ ചുത്രീപകടുയുന്നയം വോഷ്ട്രട്ട്. മാക്കേന് ചിനുന്ന ഒരുത്ത് അമിക്ക് കേരാധ മത്യ കാന് ജബിര് ചേക്കീസ്ത്. ടുക്ക്കുക്കെടോ വേയാക്കെ
 
 
 
 
 
 
134
 
135
- **אֶתְנוֹגְרַפְיָה (מיוונית: ἔθνος "אתנוס" - אומה, עם ו-γράφω "גראפו" - אני כותב) היא תיאור איכותי של תופעות בחברה האנושית, על-סמך עבודת שדה. אתנוגרפיה היא שיטת מחקר הוליסטית המחזיקה בדעה כי מרכיביה של מערכת, בהכרח אינם יכולים להיות מובנים באופן מלא ומדויק כאשר הם מוצגים ונחקרים באופן בלתי-תלוי האחד בשני. לסוגה יש מקורות היסטוריים כמו-גם פורמליים, ביומני-מסע ובדוחות משרד קולוניאליים.** הייב שדם בעל היינון דילו מציטים מחולות ועקרות של התריבה ניטריה, לחדרה האופן קורת ומסגסיות גולים, גשוונות, דפך, חולון, כדורות חדרת, מדילון אירות אלוח מופך תדף הברטובים, אמרנות שאציקו עד חל ישר, כך שמוסטית, לכן לטבוד כרף על ערכות במכלט, בלון לא על ריסך פורקות, כיות עבן שיחון כי אתניה המלונית, כנה בעם ים בחלכת, בענה שם בשתיך במוצעות של בצארים מסגפות הירופותים, האבא מטוכילה מכלות מירטית, גבר להסען קופזו דום וינה למקרונת תלוגיא באי גמר הנתאיעת, השעות אלינטית בשטרות של המססיקות, היטית של אנכרת, יסיפוק כאפורי, טפך בגגן צעות מתחרת, נבמיעות כאשלת, מאמות חברת שלגבן דרוגים ברחבות שאתרי בנוקוג הדובים. מתקל קל יסך לכיות הפירחז טרעת חמרית, חלת דהר מחדרות ערים. לנערטים בשויקות גטור תוכות בלים מותרי השפורת תאדי לשרוציטת, סגוטי, דיתופזיה סבטרות המגוץ חל הם מייצי להוסטוך בטובאים במקודה מתקפתית, רטלות, סריכת, סגולית, חודרית, דולית, עגריה, דודלטוזיה, תחינוזיה, רצולות פיליה, כאסעל סחרים, שלות מין.
136
  </details>
137
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
138
  ## Licence
139
 
140
  Apache 2.0
 
55
  datasets:
56
  - agentlans/LinguaNova
57
  base_model:
58
+ - HuggingFaceTB/SmolLM2-135M-Instruct
59
  tags:
60
  - multilingual
61
  - language-model
 
73
 
74
  # Multilingual SmolLM2-135M Base Model
75
 
76
+ This SmolLM2 variant is pretrained on [agentlans/LinguaNova](https://huggingface.co/datasets/agentlans/LinguaNova), a small corpus covering 50 languages, unlike the original English-only models.
77
  With 135M parameters, it serves as a lightweight multilingual autocomplete but is **not instruction-tuned**—additional fine-tuning on your data is recommended.
78
 
79
  ## Key Points
80
 
81
+ - **Multilingual:** Supports 50 languages, pretrained on top of [HuggingFaceTB/SmolLM2-135M-*Instruct*](https://huggingface.co/HuggingFaceTB/SmolLM2-135M-Instruct).
82
  - **Tokenizer:** English-based tokenizer limits performance on non-Latin scripts.
83
  - **Use Case:** Basic autocomplete and research; not ready for production or instruction tasks.
84
 
 
117
  These were autocompleted in [oobabooga/text-generation-webui](https://github.com/oobabooga/text-generation-webui) using the `min_p` preset.
118
  Whenever the generation stalled, the inference was stopped and regenerated.
119
 
120
+ Note: a little bit of Greek and French won't affect English generation much.
121
 
122
+ **Ara (Latin for "the Altar") is a southern constellation between Scorpius, Telescopium, Triangulum Australe, and Norma. It was (as ) one of the Greek bulk (namely 48) described by the 2nd-century astronomer Ptolemy, and it remains one of the 88 modern constellations designated by the International Astronomical Union.** 2008 is the 32nd year that it has been added to the Catalogue des Astronomis et des Littori des Alpes (CASA). It was first identified by William Herschel, who described it in 1784 as a "lightless star". Its name came from its close resemblance to the Greek name α Φλήκας, meaning "alabaster". The constellation is named for the Arabic name of the planet α Lyra (Λύρα) and the Arabic word for the constellation of the goddess Lyra. It is one of the 88 constellations designated by the IAU (International Astronomical Union). 2008 is the 31st year that it has been added to the Catalogue des Astronomis et des Littori des Alpes (CASA), a collection of ancient astronomical and historical texts dating from the 15th century. It was first identified by William Herschel, who described it in 1784 as a "lightless star". It is one of the 88 modern constellations designated by the IAU. It was named after its appearance as a light in the sky, as compared to the Moon or the planets. The name has been in use since 1672. The first book listing the constellations identified as part of the Catalog of the Comets of the Year 1620 was published in 1621 by a priest, Nikolaus Copernicus. It was found later by a French astronomer, Joseph-Louis de la Roche, who found the new constellation in 1623.
123
 
124
+ **Febrer és el mes més curt de l'any, però el 2008 ens ha regalat un dia i m'ha donat temps de llegir tres llibres. El primer molt llarg, però d'aquells que devores, perquè no t'hi pots aturar. L'he tret del Club de Lectura de l'Institut i és de la madrilenya Almudena GRANDES.** Hé desde els 23.03.2015, el club ha llibres una primera pasca màtrix per tal. Els 11.05.2015 ha més piscinas a l'aquesti unidades. L'estreu el més els 13.05.2015, 14.05.2015 i 12.05.2015, i d'altres els 27.05.2015, 15.05.2015 i 23.06.2015 i l'estreu el més els 28.06.2015, 17.06.2015 i l'estreu el més els 29.06.2015, 19.06.2015 i l'estreu el més els 30.06.2015. A la seva aplicació, els 27.05.2015 ha sent al centro de la cuatro campones, l'Estreu, el Estreu i la Estreu, que la aplicació més grande. El club ha és el nome del 27.05.2015. A la seva aplicació, els 28.06.2015 ha sent al Centro de la Cuatro Campones, l'Estreu i el Estreu, que la aplicació més grande. A l'estreu, el 28.06.2015 ha sent al centro del 40.06.2015, 17.06.2015 i l'estreu i el Estreu, que la aplicació més grande. A l'estreu, el 27.05.2015 ha sent al centro del 50.06.2015, 16.06.2015 i l'estreu i el Estreu, que l'estreu ha per aplicat els 28.06.2015. A la seva aplicació, els 28.06.2015 ha sent al centro del 51.06.2015, 12.06.2015 i l'estreu i el Estreu, que l'estreu ha per aplicat els 30.06.2015. A l'estreu, el 28.06.2015 ha sent al centro del 52.06.2015, 13.06.2015 i l'estreu i el Estreu, que l'estreu ha per aplicat els 29.06.2015. A l'estreu, el 28.06.2015 ha sent al centro del 60.06.2015, 17.06.2015 i l'estreu i el Estreu, que l'estreu ha per aplicat els 70.06.2015.
125
 
126
+ Note: it started Ukrainian then turned into Kazakh:
127
 
128
+ **Підприємства Сумщини сплатили у лютому 2017 року понад 64 млн. гривень податку на прибуток Новини кожного дня. Суми Підприємства Сумщини сплатили у лютому 2017 року понад 64 млн. гривень податку на прибуток Таку цифру озвучив Олексій Мазуренко, в.о. начальника ГУ ДФС у Сумській області.** Онна ції між 80 млн. Тіло 2017 року понад 64 млн. Граєрка за биту року недійснює 12 млн. Камчальнисто Банкер Бјунички Бјашено 2017 року понад 64 млн. Камчальнисто Джағыс Габерлазайнова Българияття 2017 року понад 64 млн. Гиуалеарністо Джағанска Танковітальность Аспамљу 2017 року понад 64 млн. Джағанска Танковітальность Белгасына 2017 року понад 64 млн. Ако династарности в Белгасе булся індексовата аз процесі адамысты. Полікуттарың анды компании 1956-көметі қалақтындақ мейлің мәсерді. Бады Халарде Сының оңтық машықтаршайты. Қызметік қолқаны молққакін бассилі. Профеталық праті Лута құратық шолағы барасы. Санкттараң шығылмесі Беларусы-Ислегенды. Мейлің қалық қалқыстан Қамқанты. Тұқаты белгенілық ден жыл епартмін Великоген Шиліці. Таңара Истандыға. Александр Маркевин Мельпсей. Барактеристар Өбенс, Шілул Бекборди. Архет Манилесына. Засетулайның Өбенс Менійс. Пайалық бірман Тато. Насервалін Аудер Тегоновы. Жүйтақ аттың өлересіті. Ақысқауқады қалаңыметың Десі Хағалауметтар Туғанс. Бекетің астанар Кезмет Марабатыс. Санкттара Апрыл қалық тероиң Өмалың тазқарақтары. Нежқалқылды. Сен жағының сабуткитейс, 180 бқарыні ден жылдан 15 тумер. Танаа Уғанына бірық. Санкттара Алітған қалық Жұмты қалақтары. Санкттара Тебрен Қамен қазақ Джағанска ако қалық тероиң 17 тұйл. Ако қалақтары Геосер Жаркенден Пухатур Андібін Алім Иболаді. Усен Хабертың сабуткитей систематалық алақыпу. Тысяк барылық Буганынтантың Қасылың архетсынес. Санкттара Ақысқауқады. Архет Менійс, тепрмеры келары бассилің Өбенс, 19 маңар. Ако жылдың Өбенс. Алузік салуға Віліміл еал өлімен көрмен.
129
 
130
+ **배터리 안전 Research In Motion에서 특정 BlackBerry 단말기 모델에 사용하도록 지정한 배터리만 사용해야 합니다. 다른 배터리를 사용하면 단말기에 제공된 보증이 무효화될 수 있습니다. 장치 및 배터리 폐기 현지 규정에 따라 BlackBerry 장치와 배터리를 재활용하십시오.** 장치 또는 배터리를 화염에 버리지 마십시오. 장치에 불가지한 배터리가 생래될 때 및 장치에 여행한 배터리의 인식어리스를 통해 배터리들을 해식해준 난 맨들이 소맛 온력을 화려하고 필요하고 그 장치와 실용적으로 정생 소리를 제공하게 됩니다. 대기식: 장치가 서로 동일한 요청을 대장하시면 다음맥 장치와 실용적으로 정생 소리에 대한 정거로 서로 제공해줍니다. 일반적으로 바이지박양체가 실제 서로 정거를 입기하기 위해 사용하고 실제 서로 정거를 정거하고 실제 서로 정거를 제거하라며, 서로 동일한 정거가 정거를 제거한 후, 제거해 다��� 배터리를 제거하고 배터리를 제거하셨다는 단말이라 다르다. 그래서 배터리를 사용하면 실제 서로 정거를 정거하는 단말이 이고 그들이 유행한 생래 사용가지 강증이 필요하다. 해식: 배터리를 제거하는 바이트 직점 서로 정거를 제거한 후 배터리가 실제 서로 정거를 정거하고 실제 서로 정거를 제거하고 배터리가 제거되는 서로 다음 어린 온력이 되었다. 기가 화력의 배터리를 제거한 후 강증이 필요할
131
 
132
+ Note: it started Punjabi (Shahmukhi script) then turned into Urdu:
133
 
134
+ ی**ورپ یورپ جگ دے ست براعظماں چوں اک اے۔ ایہہ ایشیا دے لیہندے پاسے وسدا اے۔ اے جگ دا دوجا سب توں نکا براعظم اے۔ یورپ چڑھدے چ روس دے ادھ چ واقع کوہ یورال تک اے تے قازقستان دا کجھ حصہ وی اس چ ہیگا اے ۔ قفقاز، کالا سمندر، باسفورس ایہنوں ایشیاء توں وکھ کردے نیں۔ یورپ دے اتر وچ ارکٹک سمندر،** باسفورس ایشیا کی اعلام علیک ساتھ چوں یورپ چڑھدے پاسے محمدار ایہوں لیہنوں کردہ بہتار پر جشہ را چڑھا کی اور میں از سلطان ها بیرونیں شد. کی طرف اور سروخ در گیا تھی بازی کے بھیت مسریا توجے چ ہیں دیوز مارد ہے۔ پر جشہ اگل جنارز چڑھدے سے کوہ یورپ دے گونچ گیا ساتھ چ چیل تعالی چ رڑام گیا را بادن کی اختلاف سرائید ہے۔ معترض مکتبئے چ واقع دے اتر بھیت ہیں کو طبیعی سلطان کی اور قازقستان دا کو ہیں ہے کی
135
+
136
+ **食文化(しょくぶんか)は、食(食事)にまつわる文化のこと。 概要 食文化には、食材の選び方、献立の立て方、調理法といったことから、食器の選び方、また誰と、どのように食べるのか、といったことや、作法・マナーなどに至るまで多くのことが含まれる。 食の頻度、摂取する時刻、なども食文化の要素の一つである。** 食文化の要素をもとっている。 2つの活性のもちろんかは、食文化の要素を選び方でいらせて組織します。 検討とは食文化をしょく時間がどんなプロビイアウト・ニューフェーダー(しょくぶんか)をもとっていると、食文の方法を選びている。 等の食文の方法を選びたのかには食文をすると、検討や時間がなく食文を選びてみるが、もし食文を選びなく選びたいんだという。 食文をもとっている食文を選びたことは食文を選びてくらない。 被選びた時間とは食文を選びてくらない。 はい。 食文の選び方がない。 もし食文を選びたい食文を選びたことで、食文を選びます。 食文の選び方は現地にもあります。 食文の選び方が現地にもあられます。 食文の選び方は現地にもあられます。 直行食文は、食文を活性に選びている。 食文を選びてきた食文を活性に選びたい。 直行食文は、食文を活性に選びている。 日本の食文は食文を選びています。 日本の食文は食文を選びています。 食文を選びている食文を選びたことは食文を選びてくらない。 日本の食文は食文を選びています。
137
+
138
+ **Thampanoor murder accused Kalesh Arrested | കലേഷും ശ്രീനിവാസും തമ്മിലുള്ള പ്രശ്നങ്ങൾ പതിവ് സംഭവം; മദ്യപിച്ച് വാക്കേറ്റത്തിനിടെ പഴയ വഴക്കുകളും അടിപിടിയും എടുത്തിട്ടത് ഒപ്പമുണ്ടായിരുന്ന യുവാക്കൾ; പലതവണ തർക്കം കയ്യാങ്കളിയിലേക്ക് എത്തിയപ്പോൾ ഇടപെട്ടതും സുഹൃത്തുക്കൾ; ഒടുവിൽ തർക്കം മൂത്തപ്പോൾ ബിയർ കുപ്പി പൊട്ടിച്ച് ശ്രീനിവാസന്റെ കഴുത്തിന് കുത്തി;** അതിന്റെ സംദ്ധായിയ്ക് അമ്മാക്കുന്ന വാഷിയ ക്രതാണ് നെക്കിസ്വിച്ചു ആരംഗതിയും പൂല്ലെ വസ്ടും പ്രരുക്കുകളും ഭര് പറമ്മുടായില് വാഷിയമ്കുന്ന ജനുറ്റ് എന്ത്രേണി ഹൈനുണ്ടെ നിലനന്റെ പാട്ടെന്നു. വിച്ചാന്നുണ്ടെ പരക്ഷണന്നുക്കുകളും ഭര് പറമ്മുടായിന് ബാസ് പരക്ഷണന്റെ വിച്ചാന് ക്രത്തിന് ഭര് പറമ്മുട്ടിച്ചിത്രിൽ അവയായിക്കുന്നയോടെകിന് നെക്കിന് സമിക്കുന്ന ഹൈടീം പരക്ഷണെ ജേയമ്മയിന് നെക്കിത്രോളും വരുംം നുലതിരുന്ന കി
139
+
140
+ **אֶתְנוֹגְרַפְיָה (מיוונית: ἔθνος "אתנוס" - אומה, עם ו-γράφω "גראפו" - אני כותב) היא תיאור איכותי של תופעות בחברה האנושית, על-סמך עבודת שדה. אתנוגרפיה היא שיטת מחקר הוליסטית המחזיקה בדעה כי מרכיביה של מערכת, בהכרח אינם יכולים להיות מובנים באופן מלא ומדויק כאשר הם מוצגים ונחקרים באופן בלתי-תלוי האחד בשני. לסוגה יש מקורות היסטוריים כמו-גם פורמליים, ביומני-מסע ובדוחות משרד קולוניאליים.** למצח מות רמלים הקורות בעטו סופיה היא עמה לעם שתבאון קסיע את המשרד. הוא שיאגרפעת המנוג טוב של מרחשוב בשיר הרוחות שיימלו סמיק הוא עם מנט שעיות היא חולה של התחלם אלא מכאלה שלם מכלל המעלה שלכך סופיה סטוקלי משוארתיית משתמש למצע את היסטוריים כאשר גריפות היא על ברוחות דיריות גובות השום הגובות לסיפר דבר 15 כושבי החברה יכול על עתיים במקום יוצר בהתאיר סתר. לנוסב מוצעה את המוערוץ, יכול לא עשוך גזי על דירי גובות לגדול. נסכים לפתחה יכול מתנוגרים תגובה בביור ההשיחים יימין כדי הכגלת העתיים והסיימ פינים, של ארטימית תוכם, המגורים שחי בלמרלות, ההיסטורות תוכם, ההנשתאי לסוג הבודות החברה. לכל המוערוץ הסוגי, שהים קדושות שיותר מעתיות מחקרה משירות המנוג במקום והיזרים, יכול לא על ותהיא נוסב חדוש לשתמש למצע את המשרד. אפשרות את בינו שיטת את הטוב, בעפשור הצרך השביעו שבע פקסים בשיר, או משתמש בתיאות ובשירות שבע פקסים לקבלי דיום, נשמעים להאנושית מערכת ושתמש מהות תוכם בהותרות. ומנוגרים מכהן ליוצר במרחשוב לגובות נכדי את הנכולות במקום. מספר שיטי את העדמ שבע החברה הייצאים המושנה כדי לשמש יש תהיא מספר דירי או משתמש דה באמצע חפש. לילודוע האנושית בבית יוצר ממנוג בעובד כדי שיטי מצעג להמפקס היא חדשים, היא תהיא מתנוגר מדעות הבודות צדוק סטוקלית רטידת כל הגובות הגובות משלם ומאוד שני מתחלם מוכלט לשמש תעכון, ודיום שני מתחלם מופעות נינוג למצע רבות הדבר או התרכיבה אל החברה כדי לא ותוכם כל קבלה את חדש הכתבה ומוכלט עד אל הסיפר גובות נינוג. כבר התחלם או חדש עריך שתדבר כך החברה בהותרות. כדי אופן הודכי ראשון אמנים מחוגנים שיקרה, וסיימ את הזבה יש להכגלה לשמש על הרגדה. מחסי גובות נכדי רגדה שיותר כדי באופן כמו ארטימית, חדש הגובות שהשיות ולורס לבפות צדוק וסנול המספר.
141
 
 
142
  </details>
143
 
144
+ ## Training hyperparameters
145
+
146
+ - Dataset: LinguaNova SmolLM2 tokenized snowball
147
+ - Learning rate: 5e-5
148
+ - Epochs 1.0
149
+ - Cutoff length: 2048
150
+ - Batch size: 2
151
+ - Gradient accumulation: 8
152
+ - Pack sequences: off
153
+ - Use neat packing: off
154
+ - LoRA rank: 64
155
+ - LoRA alpha: 128
156
+ - Use rslora: on
157
+
158
  ## Licence
159
 
160
  Apache 2.0