neph1 commited on
Commit
34ebf0c
1 Parent(s): f645cd8

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +42 -60
README.md CHANGED
@@ -8,17 +8,14 @@ language:
8
 
9
  ![image/png](https://cdn-uploads.huggingface.co/production/uploads/653cd3049107029eb004f968/pLcriXAfp3Y9Z0RGwwVUB.png)
10
 
11
- Update 240103: I'm currently retraining on Colab with a larger dataset but I'm running into issues due to reaching the limits of the V100. A100 don't seem to be available.
12
- May be some time before the new version is done.
13
 
14
-
15
- Qlora trained for 5 epochs on 6400 rows of q&a from around 1000 pages from wikipedia + around 100 of python questions and examples from
16
- eph1/Alpaca-Lora-GPT4-Swedish-Refined (because I had spent so much time cleaning them and didn't want to throw them away). Also a couple of hundred rows of manually
17
  gathered examples and some generated using chat-gpt.
18
  Dataset otherwise generated using gpt-3.5-turbo.
19
 
20
  The goal is to improve knowledge in Swedish topics, while improving the quality of the language.
21
- The model seems to have a thing for history and will, if free to speak, probably tell you some tidbit about historical people.
22
 
23
  The name comes from the Swedish bard and poet Carl Mikael Bellman who lived in the 1700s.
24
  As with any bard, what this model says should be taken with a grain of salt. Even though it has the best of intentions.
@@ -29,73 +26,58 @@ Configuration:
29
 
30
  Rank: 16
31
 
32
- Alpha: 16
33
 
34
  Dropout: 0.1
35
 
36
- Context length: 1024
37
 
38
- I may run another 5 epochs on this. But I feel like it's 'aligned' pretty well. (Regular mistral insists Magdalena Andersson is prime minister, still.)
39
 
40
- Example (q8, temp: 0.7):
41
  ```
42
- Prompt: Detta är en konversation mellan en användare och en hjälpsam AI-assistent som talar flytande svenska.
43
 
44
- Användare: vem är statsminister i sverige 2023?
45
 
46
- Assistent: Statsministern i Sverige år 2023 är Ulf Kristersson.
47
 
48
- Användare: hur många bor det i sverige?
49
 
50
- Assistent: År 2023 har Sverige ungefär 10,4 miljoner invånare.
51
 
52
- Användare: berätta om några vanliga djurarter i sverige
53
 
54
- Assistent: I Sverige finns ett brett utbud av djurarter. Några vanligt förekommande djur inkluderar älg, björn, lodjur, hare, rådjur samt en mångfald av fåglar och fiskar.
55
- Den svenska naturen erbjuder en rik biologisk diversitet.
56
 
57
- Användare: sjung lite som bellman
58
 
59
- Assistent: Sverige har en rik kulturhistoria och en av dess mest berömda bidrag är den klassiska svenska diktsamlingen 'Fredmans epistlar', skriven av Carl Michael Bellman.
60
- Här är ett exempel på en av hans dikter:
61
- 'År 1790 gick jag i parken ut,
62
- Och så såg jag en dam,
63
- Hon satt där på en bänk och slöt
64
- Et styver band om kam.'
65
- Bellmans poesi kännetecknas av humor och detaljrikedom. Den reflekterar den svenska samhällsklassstrukturen och livet under 1700-talet på ett unik väg.
66
- 'Fredman' är verkligen en viktig del i Sveriges kulturella arv.
67
- ```
68
 
69
- Regular mistral-instruct-0.2 (q8, temp: 0.7):
70
- ```
71
- Användare: vem är statsminister i sverige 2023?
72
- Assistent: Jag kan inte ge dig en säker svar på detta, eftersom jag inte har tillgång till uppdaterade information om framtida politiska ledare. Statsministern i Sverige år 2023 kommer att bestämmas av de svenska allmänna valen den tidpunkten. För närvarande är Magdalena Andersson statsminister (sedan december 2021).
73
-
74
- Användare: berätta om några vanliga djurarter i sverige
75
- Assistent: Absolutt! Sverige är känt för sin rika och olikartade fauna. Här är några vanliga djurarter som du kan möta i Sverige:
76
-
77
- Elk: Elken är Europas största däggdjur och är ett nationaldjur i Sverige. De lever i skogsbiotoper över hela landet.
78
- Rådjur: Rådjuret är ett av vår lands vanligaste djur. De lever i skogar, marker och trädgårdar överallt i Sverige.
79
- Fälgar: Fälgar är gräsätande djur som lever i öppna områden såsom ängar, parker och jordbruksmark. Det finns flera olika arter av fälgar i Sverige, bland dem rödhalsad fälg och vargfälg.
80
- Älg: Älger är en art av vilt som lever i Sverige, främst i skogsbiotoper men även på torra betesmarker.
81
- Björn: Björnen är det största däggdjuret i Sverige. De bor i skogar och alpina områden, och de har ett stort territorium.
82
- Vildsvin: Vildsvinet lever i skogsbiotoper och kustområden runt Öresundsregionen. De äter rotstoffor samt grönsaker och frukter.
83
- Hare: Harar är små och snabba djur som lever i skogar, buskmarker och öppna planer överallt i Sverige.
84
- Användare: sjung lite som bellman
85
- Assistent: Jag ska ge besök åt Carl Michael Bellmans "Anakreons visa" som är ett av hans mest berömda verk. Sångtexten går därför att läsa ut loud och jag ska recitera den för dig i stil av ett sångutdrag:
86
-
87
- I Gripenberg, Tyska grundet, stod Carl Michael Bellman,
88
- Och sången började han sjunga, sådan som han bara kunde.
89
- Om vackert Maja i blommorna sitter,
90
- rosa och vacker, i den gula trädgården,
91
- Hon sörjer sin lilla Josses sak,
92
- När hon sitter ensam med vindens kyss,
93
- Och röser sitt hjärta, fullt av brinnande kärleksask.
94
- .....
95
- Maja, Maja, om ni ser mig stå här,
96
- Har ni sett mig stå med mina händer krossade?
97
- Så har jag sett din Josses lik ligga,
98
- Kvar i det gröna och med sina ögon stängda.
99
- Maja, Maja, förlåt mig nu, min snuskiga mage,
100
- (and it goes on)
101
  ```
 
8
 
9
  ![image/png](https://cdn-uploads.huggingface.co/production/uploads/653cd3049107029eb004f968/pLcriXAfp3Y9Z0RGwwVUB.png)
10
 
11
+ Updated 240112: Bigger dataset. Validation set. rank/alpha: 16/32. 2k context length
 
12
 
13
+ Qlora trained for 2 epochs on 9600 rows of q&a from around 1300 pages from wikipedia + around 100 of python questions and examples from
14
+ neph1/Alpaca-Lora-GPT4-Swedish-Refined (because I had spent so much time cleaning them and didn't want to throw them away). Also a couple of hundred rows of manually
 
15
  gathered examples and some generated using chat-gpt.
16
  Dataset otherwise generated using gpt-3.5-turbo.
17
 
18
  The goal is to improve knowledge in Swedish topics, while improving the quality of the language.
 
19
 
20
  The name comes from the Swedish bard and poet Carl Mikael Bellman who lived in the 1700s.
21
  As with any bard, what this model says should be taken with a grain of salt. Even though it has the best of intentions.
 
26
 
27
  Rank: 16
28
 
29
+ Alpha: 32
30
 
31
  Dropout: 0.1
32
 
33
+ Context length: 2048
34
 
 
35
 
36
+ An absolutely beautiful example. Sadly it's not always as good. (gguf q8, temp: 0.7, llama.cpp):
37
  ```
38
+ User: Vem är statsminister i Sverige?
39
 
40
+ Llama: Statsministern i Sverige heter Ulf Kristersson från Moderata samlingspartiet sedan 2022. Han leder en koalition mellan sin parti, Kristdemokraterna och Liberalerna. Innan honom var Magdalena Andersson statsminister för Socialdemokraternas minoritetsregering.
41
 
42
+ User: Nämn fem vanliga mineraler
43
 
44
+ Llama: Några av de vanligaste mineralerna inkluderar feldspat, kvarts, mica, gips och kalkspat. De spelar olika roller i jordskorpan och har varierande egenskaper som ger dem användningsområden inom till exempel byggnadsmaterial och glasindustrin.
45
 
46
+ User: Hur känner jag igen feldspat?
47
 
48
+ Llama: Feldspaten är en vanlig grupp av mineral med varierande sammansättning, som ofta innehåller aluminium, silikon och syre. De kan ha olika färger, såsom vit eller rödaktig, och det finns flera olika typer av feldspat med specifika egenskaper.
49
 
50
+ User: Vilka egenskaper kan den ha?
 
51
 
52
+ Llama: Några egenskaper inkluderar hårdhet på Mohs skala från 2 till 6, samt att de vanligtvis är täta och har låg termisk expansionskoefficient. Feldspaten används ofta i byggnadsmaterial och glasindustrin på grund av dessa egenskaper.
53
 
54
+ User: Jag vet inte vilket gymnasieprogram jag ska välja
 
 
 
 
 
 
 
 
55
 
56
+ Llama: Det är helt normalt att det tar tid att bestämma sig för ett gymnasieprogram. Du kan pröva olika ämnen och överväga dina intressen, kunskaper och framtida karriärsmål för att hitta det rätta programmet för dig. Det finns många olika typer av gymnasieprogram som erbjuder olika inriktningar, så du bör finna något som passar din personliga utveckling och framtida mål.
57
+
58
+ User: Jag har ofta ont i magen. vad kan det bero på?
59
+
60
+ Llama: Magbesvär eller magsmältningsproblem kan ha flera orsaker, inklusive livsstilsfaktorer, matintoleranser och sjukdomar som inflammatorisk tarmsjukdom (IBS) eller gallblåseinflammering. Om du upplever starka symtom eller svårigheter att hantera det bästa är att besöka ditt läkare för en noggrann undersökning och eventuella behandlingar. Det kan inkluda mediciner, dietära ändringar eller andra terapiåtgärder.
61
+
62
+ User: Kan du skriva ett program i python som visar hur en for-loop fungerar?
63
+
64
+ Llama: Visst! Här är ett exempel en Python-kod som använder en "for"-slinga för att iterera genom en lista och skriva ut varje element.
65
+
66
+ my_list = ['apple', 'banana', 'cherry']
67
+ for fruit in my_list:
68
+ print(fruit)
69
+
70
+ Denna kod skapar en lista med frukter, sedan den använder en for-slinga för att iterera genom varje element i listan och skriva ut det på skärmen. Förutom loopning kan du också lära dig om andra metoder som fungerar bättre för specifika uppgifter, såsom med enumerate() eller zip().
71
+
72
+ User: Kan du göra om programmet att det bara skriver ut de frukter som börjar "a"?
73
+
74
+ Llama: Absolut! Du kan använda en conditional statement inom for-loopen för att kontrollera bokstaven i varje frukt och endast skriva ut dem som börjar med "a". Här är det uppdaterade kod:
75
+
76
+ my_list = ['apple', 'banana', 'cherry']
77
+ for fruit in my_list:
78
+ if fruit[0] == 'a': # kontrollera första bokstaven i frukten
79
+ print(fruit)
80
+
81
+
82
+ Detta program använder en if-utlåtelse för att kontrollera om det första tecknet i varje frukt är "a". Om den är så, skriver ut frukten med hjälp av print() funktionen. Detta resulterar endast i att de frukterna som börjar på "a" skrivs ut. I detta fall bara 'apple'.
 
 
 
 
 
83
  ```