Thalesian commited on
Commit
cc6785a
ยท
verified ยท
1 Parent(s): b211dfe

End of training

Browse files
README.md CHANGED
@@ -14,7 +14,7 @@ should probably proofread and complete it, then remove this comment. -->
14
 
15
  This model was trained from scratch on the None dataset.
16
  It achieves the following results on the evaluation set:
17
- - Loss: 0.2359
18
 
19
  ## Model description
20
 
@@ -46,9 +46,12 @@ The following hyperparameters were used during training:
46
 
47
  | Training Loss | Epoch | Step | Validation Loss |
48
  |:-------------:|:-----:|:-----:|:---------------:|
49
- | 0.2747 | 1.0 | 6351 | 0.1538 |
50
- | 0.2793 | 2.0 | 12702 | 0.1542 |
51
- | 0.2894 | 3.0 | 19053 | 0.2359 |
 
 
 
52
 
53
 
54
  ### Framework versions
 
14
 
15
  This model was trained from scratch on the None dataset.
16
  It achieves the following results on the evaluation set:
17
+ - Loss: 0.1577
18
 
19
  ## Model description
20
 
 
46
 
47
  | Training Loss | Epoch | Step | Validation Loss |
48
  |:-------------:|:-----:|:-----:|:---------------:|
49
+ | 0.2814 | 1.0 | 6351 | 0.1742 |
50
+ | 0.2857 | 2.0 | 12702 | 0.1582 |
51
+ | 0.2872 | 3.0 | 19053 | 0.1529 |
52
+ | 0.2733 | 4.0 | 25404 | 0.1528 |
53
+ | 0.3071 | 5.0 | 31755 | 0.1805 |
54
+ | 0.297 | 6.0 | 38106 | 0.1577 |
55
 
56
 
57
  ### Framework versions
added_tokens.json CHANGED
@@ -1,247 +1,247 @@
1
  {
2
- "ยฑ": 32201,
3
- "โ†’": 32203,
4
- "โŒœ": 32302,
5
- "โŒ": 32227,
6
- "โ—": 32274,
7
- "โŸฆ": 32324,
8
- "โŸง": 32318,
9
- "๐€€": 32167,
10
- "๐€": 32157,
11
- "๐€‚": 32108,
12
- "๐€ƒ": 32325,
13
- "๐€„": 32303,
14
- "๐€…": 32118,
15
- "๐€†": 32208,
16
- "๐€‡": 32189,
17
- "๐€ˆ": 32205,
18
- "๐€‰": 32232,
19
- "๐€Š": 32261,
20
- "๐€‹": 32184,
21
- "๐€": 32228,
22
- "๐€Ž": 32120,
23
- "๐€": 32143,
24
- "๐€": 32281,
25
- "๐€‘": 32147,
26
- "๐€’": 32100,
27
- "๐€“": 32136,
28
- "๐€”": 32198,
29
- "๐€•": 32229,
30
- "๐€–": 32289,
31
- "๐€—": 32191,
32
- "๐€˜": 32110,
33
- "๐€™": 32207,
34
- "๐€š": 32115,
35
- "๐€›": 32145,
36
- "๐€œ": 32168,
37
- "๐€": 32225,
38
- "๐€ž": 32153,
39
- "๐€Ÿ": 32197,
40
- "๐€ ": 32130,
41
- "๐€ก": 32252,
42
- "๐€ข": 32304,
43
- "๐€ฃ": 32174,
44
- "๐€ค": 32306,
45
- "๐€ฅ": 32339,
46
- "๐€ฆ": 32260,
47
- "๐€จ": 32309,
48
- "๐€ฉ": 32279,
49
- "๐€ช": 32152,
50
- "๐€ซ": 32156,
51
- "๐€ฌ": 32139,
52
- "๐€ญ": 32298,
53
- "๐€ฎ": 32213,
54
- "๐€ฏ": 32282,
55
- "๐€ฐ": 32200,
56
- "๐€ฑ": 32163,
57
- "๐€ฒ": 32230,
58
- "๐€ณ": 32148,
59
- "๐€ด": 32322,
60
- "๐€ต": 32162,
61
- "๐€ถ": 32248,
62
- "๐€ท": 32268,
63
- "๐€ธ": 32193,
64
- "๐€น": 32243,
65
- "๐€บ": 32178,
66
- "๐€ผ": 32135,
67
- "๐€ฝ": 32175,
68
- "๐€ฟ": 32171,
69
- "๐€": 32331,
70
- "๐": 32238,
71
- "๐‚": 32342,
72
- "๐ƒ": 32236,
73
- "๐„": 32276,
74
- "๐…": 32315,
75
- "๐†": 32314,
76
- "๐‡": 32180,
77
- "๐ˆ": 32181,
78
- "๐‰": 32330,
79
- "๐Š": 32131,
80
- "๐‹": 32253,
81
- "๐Œ": 32101,
82
- "๐": 32338,
83
- "๐": 32285,
84
- "๐‘": 32126,
85
- "๐’": 32169,
86
- "๐“": 32299,
87
- "๐”": 32291,
88
- "๐•": 32335,
89
- "๐–": 32182,
90
- "๐—": 32294,
91
- "๐˜": 32102,
92
- "๐™": 32329,
93
- "๐š": 32122,
94
- "๐›": 32125,
95
- "๐œ": 32222,
96
- "๐": 32114,
97
- "๐‚€": 32256,
98
- "๐‚": 32295,
99
- "๐‚‚": 32202,
100
- "๐‚ƒ": 32333,
101
- "๐‚„": 32111,
102
- "๐‚…": 32186,
103
- "๐‚†": 32241,
104
- "๐‚‡": 32337,
105
- "๐‚ˆ": 32164,
106
- "๐‚‰": 32280,
107
- "๐‚Š": 32328,
108
- "๐‚‹": 32209,
109
- "๐‚Œ": 32106,
110
- "๐‚": 32344,
111
- "๐‚Ž": 32211,
112
- "๐‚": 32275,
113
- "๐‚": 32127,
114
- "๐‚‘": 32223,
115
- "๐‚’": 32220,
116
- "๐‚”": 32340,
117
- "๐‚•": 32292,
118
- "๐‚–": 32204,
119
- "๐‚—": 32321,
120
- "๐‚š": 32250,
121
- "๐‚›": 32196,
122
- "๐‚œ": 32194,
123
- "๐‚": 32116,
124
- "๐‚ž": 32244,
125
- "๐‚Ÿ": 32283,
126
- "๐‚ก": 32121,
127
- "๐‚ข": 32296,
128
- "๐‚ฃ": 32264,
129
- "๐‚ฅ": 32226,
130
- "๐‚ฆ": 32190,
131
- "๐‚ง": 32124,
132
- "๐‚จ": 32231,
133
- "๐‚ฉ": 32219,
134
- "๐‚ช": 32286,
135
- "๐‚ซ": 32123,
136
- "๐‚ฌ": 32199,
137
- "๐‚ญ": 32251,
138
- "๐‚ฎ": 32170,
139
- "๐‚ฏ": 32287,
140
- "๐‚ฐ": 32334,
141
- "๐‚ฑ": 32265,
142
- "๐‚ฒ": 32262,
143
- "๐‚ณ": 32218,
144
- "๐‚ด": 32224,
145
- "๐‚ต": 32247,
146
- "๐‚ถ": 32183,
147
- "๐‚ท": 32326,
148
- "๐‚ธ": 32266,
149
- "๐‚น": 32137,
150
- "๐‚บ": 32160,
151
- "๐‚ป": 32254,
152
- "๐‚ผ": 32177,
153
- "๐‚ฝ": 32332,
154
- "๐‚พ": 32341,
155
- "๐‚ฟ": 32277,
156
- "๐ƒ€": 32142,
157
- "๐ƒ": 32242,
158
- "๐ƒ‚": 32323,
159
- "๐ƒ„": 32192,
160
- "๐ƒ†": 32217,
161
- "๐ƒ‡": 32316,
162
- "๐ƒˆ": 32270,
163
- "๐ƒ‰": 32109,
164
- "๐ƒŠ": 32146,
165
- "๐ƒŒ": 32119,
166
- "๐ƒ": 32144,
167
- "๐ƒŽ": 32255,
168
- "๐ƒ": 32150,
169
- "๐ƒ": 32206,
170
- "๐ƒ‘": 32307,
171
- "๐ƒ“": 32188,
172
- "๐ƒ”": 32273,
173
- "๐ƒ•": 32271,
174
- "๐ƒ—": 32210,
175
- "๐ƒ™": 32320,
176
- "๐ƒš": 32133,
177
- "๐ƒœ": 32311,
178
- "๐ƒ": 32212,
179
  "๐ƒž": 32305,
180
- "๐ƒŸ": 32134,
181
- "๐ƒ ": 32308,
182
- "๐ƒก": 32176,
183
- "๐ƒข": 32105,
184
- "๐ƒฃ": 32233,
185
- "๐ƒค": 32310,
186
- "๐ƒฅ": 32151,
187
- "๐ƒฆ": 32221,
188
- "๐ƒง": 32216,
189
- "๐ƒจ": 32132,
190
- "๐ƒฉ": 32267,
191
- "๐ƒช": 32104,
192
- "๐ƒซ": 32179,
193
- "๐ƒฌ": 32290,
194
- "๐ƒญ": 32272,
195
- "๐ƒฎ": 32214,
196
- "๐ƒฏ": 32155,
197
- "๐ƒฐ": 32138,
198
- "๐ƒฑ": 32278,
199
- "๐ƒฒ": 32239,
200
- "๐ƒณ": 32235,
201
- "๐ƒด": 32107,
202
- "๐ƒต": 32215,
203
- "๐ƒถ": 32185,
204
- "๐ƒท": 32259,
205
- "๐ƒธ": 32245,
206
- "๐ƒน": 32161,
207
- "๐„ˆ": 32128,
208
- "๐„‰": 32312,
209
- "๐„Š": 32240,
210
- "๐„‹": 32263,
211
- "๐„Œ": 32149,
212
- "๐„": 32154,
213
- "๐„Ž": 32313,
214
- "๐„": 32288,
215
- "๐„": 32297,
216
- "๐„‘": 32113,
217
- "๐„’": 32343,
218
- "๐„“": 32301,
219
- "๐„”": 32327,
220
- "๐„•": 32257,
221
- "๐„–": 32140,
222
- "๐„—": 32195,
223
- "๐„˜": 32293,
224
- "๐„™": 32141,
225
- "๐„š": 32284,
226
- "๐„›": 32112,
227
- "๐„œ": 32269,
228
- "๐„": 32237,
229
- "๐„ž": 32165,
230
- "๐„Ÿ": 32103,
231
- "๐„ก": 32158,
232
- "๐„ข": 32317,
233
- "๐„ฃ": 32258,
234
- "๐„ค": 32249,
235
- "๐„ฅ": 32159,
236
- "๐„ง": 32246,
237
- "๐„ช": 32187,
238
- "๐„ซ": 32117,
239
- "๐„ท": 32336,
240
- "๐„ธ": 32129,
241
- "๐„น": 32173,
242
- "๐„บ": 32172,
243
- "๐„ผ": 32166,
244
- "๐„ฝ": 32319,
245
- "๐„พ": 32234,
246
- "๐„ฟ": 32300
247
  }
 
1
  {
2
+ "ยฑ": 32314,
3
+ "โ†’": 32189,
4
+ "โŒœ": 32266,
5
+ "โŒ": 32231,
6
+ "โ—": 32179,
7
+ "โŸฆ": 32218,
8
+ "โŸง": 32200,
9
+ "๐€€": 32299,
10
+ "๐€": 32169,
11
+ "๐€‚": 32110,
12
+ "๐€ƒ": 32301,
13
+ "๐€„": 32261,
14
+ "๐€…": 32257,
15
+ "๐€†": 32102,
16
+ "๐€‡": 32341,
17
+ "๐€ˆ": 32136,
18
+ "๐€‰": 32187,
19
+ "๐€Š": 32286,
20
+ "๐€‹": 32127,
21
+ "๐€": 32108,
22
+ "๐€Ž": 32315,
23
+ "๐€": 32162,
24
+ "๐€": 32154,
25
+ "๐€‘": 32306,
26
+ "๐€’": 32152,
27
+ "๐€“": 32156,
28
+ "๐€”": 32157,
29
+ "๐€•": 32239,
30
+ "๐€–": 32295,
31
+ "๐€—": 32210,
32
+ "๐€˜": 32226,
33
+ "๐€™": 32340,
34
+ "๐€š": 32288,
35
+ "๐€›": 32304,
36
+ "๐€œ": 32188,
37
+ "๐€": 32272,
38
+ "๐€ž": 32171,
39
+ "๐€Ÿ": 32268,
40
+ "๐€ ": 32124,
41
+ "๐€ก": 32175,
42
+ "๐€ข": 32219,
43
+ "๐€ฃ": 32293,
44
+ "๐€ค": 32300,
45
+ "๐€ฅ": 32287,
46
+ "๐€ฆ": 32172,
47
+ "๐€จ": 32106,
48
+ "๐€ฉ": 32214,
49
+ "๐€ช": 32115,
50
+ "๐€ซ": 32225,
51
+ "๐€ฌ": 32309,
52
+ "๐€ญ": 32159,
53
+ "๐€ฎ": 32290,
54
+ "๐€ฏ": 32237,
55
+ "๐€ฐ": 32313,
56
+ "๐€ฑ": 32194,
57
+ "๐€ฒ": 32281,
58
+ "๐€ณ": 32107,
59
+ "๐€ด": 32265,
60
+ "๐€ต": 32325,
61
+ "๐€ถ": 32126,
62
+ "๐€ท": 32164,
63
+ "๐€ธ": 32130,
64
+ "๐€น": 32198,
65
+ "๐€บ": 32318,
66
+ "๐€ผ": 32263,
67
+ "๐€ฝ": 32321,
68
+ "๐€ฟ": 32271,
69
+ "๐€": 32216,
70
+ "๐": 32160,
71
+ "๐‚": 32144,
72
+ "๐ƒ": 32135,
73
+ "๐„": 32331,
74
+ "๐…": 32167,
75
+ "๐†": 32208,
76
+ "๐‡": 32204,
77
+ "๐ˆ": 32282,
78
+ "๐‰": 32118,
79
+ "๐Š": 32213,
80
+ "๐‹": 32183,
81
+ "๐Œ": 32311,
82
+ "๐": 32227,
83
+ "๐": 32298,
84
+ "๐‘": 32344,
85
+ "๐’": 32134,
86
+ "๐“": 32149,
87
+ "๐”": 32228,
88
+ "๐•": 32264,
89
+ "๐–": 32180,
90
+ "๐—": 32165,
91
+ "๐˜": 32101,
92
+ "๐™": 32147,
93
+ "๐š": 32173,
94
+ "๐›": 32117,
95
+ "๐œ": 32100,
96
+ "๐": 32270,
97
+ "๐‚€": 32267,
98
+ "๐‚": 32201,
99
+ "๐‚‚": 32291,
100
+ "๐‚ƒ": 32128,
101
+ "๐‚„": 32285,
102
+ "๐‚…": 32137,
103
+ "๐‚†": 32235,
104
+ "๐‚‡": 32255,
105
+ "๐‚ˆ": 32199,
106
+ "๐‚‰": 32195,
107
+ "๐‚Š": 32191,
108
+ "๐‚‹": 32249,
109
+ "๐‚Œ": 32177,
110
+ "๐‚": 32123,
111
+ "๐‚Ž": 32302,
112
+ "๐‚": 32248,
113
+ "๐‚": 32192,
114
+ "๐‚‘": 32310,
115
+ "๐‚’": 32109,
116
+ "๐‚”": 32337,
117
+ "๐‚•": 32276,
118
+ "๐‚–": 32143,
119
+ "๐‚—": 32166,
120
+ "๐‚š": 32184,
121
+ "๐‚›": 32338,
122
+ "๐‚œ": 32292,
123
+ "๐‚": 32215,
124
+ "๐‚ž": 32247,
125
+ "๐‚Ÿ": 32240,
126
+ "๐‚ก": 32111,
127
+ "๐‚ข": 32168,
128
+ "๐‚ฃ": 32233,
129
+ "๐‚ฅ": 32125,
130
+ "๐‚ฆ": 32206,
131
+ "๐‚ง": 32141,
132
+ "๐‚จ": 32297,
133
+ "๐‚ฉ": 32241,
134
+ "๐‚ช": 32185,
135
+ "๐‚ซ": 32343,
136
+ "๐‚ฌ": 32251,
137
+ "๐‚ญ": 32284,
138
+ "๐‚ฎ": 32202,
139
+ "๐‚ฏ": 32140,
140
+ "๐‚ฐ": 32246,
141
+ "๐‚ฑ": 32336,
142
+ "๐‚ฒ": 32148,
143
+ "๐‚ณ": 32256,
144
+ "๐‚ด": 32317,
145
+ "๐‚ต": 32104,
146
+ "๐‚ถ": 32190,
147
+ "๐‚ท": 32329,
148
+ "๐‚ธ": 32289,
149
+ "๐‚น": 32323,
150
+ "๐‚บ": 32320,
151
+ "๐‚ป": 32280,
152
+ "๐‚ผ": 32324,
153
+ "๐‚ฝ": 32150,
154
+ "๐‚พ": 32230,
155
+ "๐‚ฟ": 32296,
156
+ "๐ƒ€": 32232,
157
+ "๐ƒ": 32129,
158
+ "๐ƒ‚": 32155,
159
+ "๐ƒ„": 32163,
160
+ "๐ƒ†": 32220,
161
+ "๐ƒ‡": 32133,
162
+ "๐ƒˆ": 32333,
163
+ "๐ƒ‰": 32203,
164
+ "๐ƒŠ": 32121,
165
+ "๐ƒŒ": 32120,
166
+ "๐ƒ": 32131,
167
+ "๐ƒŽ": 32196,
168
+ "๐ƒ": 32158,
169
+ "๐ƒ": 32113,
170
+ "๐ƒ‘": 32316,
171
+ "๐ƒ“": 32258,
172
+ "๐ƒ”": 32274,
173
+ "๐ƒ•": 32217,
174
+ "๐ƒ—": 32322,
175
+ "๐ƒ™": 32223,
176
+ "๐ƒš": 32260,
177
+ "๐ƒœ": 32342,
178
+ "๐ƒ": 32283,
179
  "๐ƒž": 32305,
180
+ "๐ƒŸ": 32119,
181
+ "๐ƒ ": 32193,
182
+ "๐ƒก": 32103,
183
+ "๐ƒข": 32253,
184
+ "๐ƒฃ": 32234,
185
+ "๐ƒค": 32312,
186
+ "๐ƒฅ": 32153,
187
+ "๐ƒฆ": 32146,
188
+ "๐ƒง": 32114,
189
+ "๐ƒจ": 32209,
190
+ "๐ƒฉ": 32139,
191
+ "๐ƒช": 32335,
192
+ "๐ƒซ": 32151,
193
+ "๐ƒฌ": 32332,
194
+ "๐ƒญ": 32244,
195
+ "๐ƒฎ": 32279,
196
+ "๐ƒฏ": 32116,
197
+ "๐ƒฐ": 32197,
198
+ "๐ƒฑ": 32205,
199
+ "๐ƒฒ": 32207,
200
+ "๐ƒณ": 32330,
201
+ "๐ƒด": 32181,
202
+ "๐ƒต": 32211,
203
+ "๐ƒถ": 32236,
204
+ "๐ƒท": 32254,
205
+ "๐ƒธ": 32308,
206
+ "๐ƒน": 32339,
207
+ "๐„ˆ": 32334,
208
+ "๐„‰": 32328,
209
+ "๐„Š": 32262,
210
+ "๐„‹": 32138,
211
+ "๐„Œ": 32178,
212
+ "๐„": 32319,
213
+ "๐„Ž": 32269,
214
+ "๐„": 32122,
215
+ "๐„": 32170,
216
+ "๐„‘": 32221,
217
+ "๐„’": 32275,
218
+ "๐„“": 32245,
219
+ "๐„”": 32174,
220
+ "๐„•": 32224,
221
+ "๐„–": 32182,
222
+ "๐„—": 32142,
223
+ "๐„˜": 32250,
224
+ "๐„™": 32212,
225
+ "๐„š": 32294,
226
+ "๐„›": 32277,
227
+ "๐„œ": 32242,
228
+ "๐„": 32186,
229
+ "๐„ž": 32132,
230
+ "๐„Ÿ": 32105,
231
+ "๐„ก": 32112,
232
+ "๐„ข": 32243,
233
+ "๐„ฃ": 32273,
234
+ "๐„ค": 32238,
235
+ "๐„ฅ": 32145,
236
+ "๐„ง": 32259,
237
+ "๐„ช": 32327,
238
+ "๐„ซ": 32222,
239
+ "๐„ท": 32229,
240
+ "๐„ธ": 32326,
241
+ "๐„น": 32176,
242
+ "๐„บ": 32303,
243
+ "๐„ผ": 32307,
244
+ "๐„ฝ": 32161,
245
+ "๐„พ": 32252,
246
+ "๐„ฟ": 32278
247
  }
config.json CHANGED
@@ -1,5 +1,5 @@
1
  {
2
- "_name_or_path": "/Users/lee/GitHub/results/GMY-T5Small/train_1/checkpoint-49380",
3
  "architectures": [
4
  "T5ForConditionalGeneration"
5
  ],
 
1
  {
2
+ "_name_or_path": "/Users/lee/GitHub/results/GMY-T5Small/train_1/checkpoint-65840",
3
  "architectures": [
4
  "T5ForConditionalGeneration"
5
  ],
model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:fc49ee8d282b28a209e6c48734f46133d2664927eb6eb187d3e5bfa786550dc0
3
  size 242486312
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:fb7f5acc0e0a8661f5cfc17f326e922b7a39a32e92f43973c0b13a9bb42bed48
3
  size 242486312
runs/Mar13_00-24-26_Lees-MacBook-Pro.local/events.out.tfevents.1741847066.Lees-MacBook-Pro.local ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:167a66603a1bf87e2e6aaf6abc7b86c9e4072cadfd9a38c381d48f242b1d473e
3
+ size 24483
tokenizer.json CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:b0ee2673679b2f8cbac9094d2e3b35d97ea4cf42460e82e5661e18524da90979
3
  size 2466261
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:4645dfb7555ec9f79235ff2195ef1775751eab22cd17671731d376a2edca89ab
3
  size 2466261
tokenizer_config.json CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:82924e48da7a95af97c7825f1cd28e32a713f5ab8859c618b36316b16dfcc9ba
3
  size 62465
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:226471339474e6ac717acdd053bf20542f82bc2c6871f4cdc128bed5acd7516c
3
  size 62465
training_args.bin CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:473dd09a7604068f6cd76496c3cdc2813a700abf7689de0884f513ff3012b31e
3
  size 5560
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:332ee1e3d81fcfdb71d17c2ea4ccecf168f3c2a602aad1e2850c9c02f1268160
3
  size 5560