phonghoccode commited on
Commit
160c67b
·
verified ·
1 Parent(s): a335ec9

Model save

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,796 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:8337
8
+ - loss:ContrastiveLoss
9
+ base_model: AITeamVN/Vietnamese_Embedding_v2
10
+ widget:
11
+ - source_sentence: Điều khiển giao thông bằng tín hiệu đèn
12
+ sentences:
13
+ - "1. Báo hiệu đường bộ bao gồm: hiệu lệnh của người điều khiển giao thông; đèn\
14
+ \ tín hiệu giao thông; biển báo hiệu đường bộ; vạch kẻ đường và các dấu hiệu khác\
15
+ \ trên mặt đường; cọc tiêu, tường bảo vệ, rào chắn, đinh phản quang, tiêu phản\
16
+ \ quang, cột Km, cọc H; thiết bị âm thanh báo hiệu đường bộ.\n2. Người tham gia\
17
+ \ giao thông đường bộ phải chấp hành báo hiệu đường bộ theo thứ tự ưu tiên từ\
18
+ \ trên xuống dưới như sau: \na) Hiệu lệnh của người điều khiển giao thông;\nb)\
19
+ \ Tín hiệu đèn giao thông;\nc) Biển báo hiệu đường bộ;\nd) Vạch kẻ đường và các\
20
+ \ dấu hiệu khác trên mặt đường;\nđ) Cọc tiêu, tường bảo vệ, rào chắn, đinh phản\
21
+ \ quang, tiêu phản quang, cột Km, cọc H;\ne) Thiết bị âm thanh báo hiệu đường\
22
+ \ bộ.\n3. Hiệu lệnh của người điều khiển giao thông được quy định như sau:\na)\
23
+ \ Tay bên phải giơ thẳng đứng để báo hiệu cho người tham gia giao thông đường\
24
+ \ bộ ở tất cả các hướng phải dừng lại;\nb) Hai tay hoặc một tay dang ngang để\
25
+ \ báo hiệu cho người tham gia giao thông đường bộ ở phía trước và ở phía sau người\
26
+ \ điều khiển giao thông phải dừng lại; người tham gia giao thông đường bộ ở phía\
27
+ \ bên phải và bên trái người điều khiển giao thông được đi;\nc) Tay bên phải giơ\
28
+ \ về phía trước để báo hiệu cho người tham gia giao thông đường bộ ở phía sau\
29
+ \ và bên phải người điều khiển giao thông phải dừng lại; người tham gia giao thông\
30
+ \ đường bộ ở phía trước người điều khiển giao thông được rẽ phải; người tham gia\
31
+ \ giao thông đường bộ ở phía bên trái người điều khiển giao thông được đi tất\
32
+ \ cả các hướng; người đi bộ qua đường phải đi sau lưng người điều khiển giao thông.\n\
33
+ 4. Tín hiệu đèn giao thông có 03 màu, gồm: màu xanh, màu vàng, màu đỏ; có hiển\
34
+ \ thị thời gian hoặc không hiển thị thời gian. Người tham gia giao thông đường\
35
+ \ bộ phải chấp hành như sau:\na) Tín hiệu đèn màu xanh là được đi; trường hợp\
36
+ \ người đi bộ, xe lăn của người khuyết tật đang đi ở lòng đường, người điều khiển\
37
+ \ phương tiện tham gia giao thông đường bộ phải giảm tốc độ hoặc dừng lại nhường\
38
+ \ đường cho người đi bộ, xe lăn của người khuyết tật qua đường;\nb) Tín hiệu đèn\
39
+ \ màu vàng phải dừng lại trước vạch dừng; trường hợp đang đi trên vạch dừng hoặc\
40
+ \ đã đi qua vạch dừng mà tín hiệu đèn màu vàng thì được đi tiếp; trường hợp tín\
41
+ \ hiệu đèn màu vàng nhấp nháy, người điều khiển phương tiện tham gia giao thông\
42
+ \ đường bộ được đi nhưng phải quan sát, giảm tốc độ hoặc dừng lại nhường đường\
43
+ \ cho người đi bộ, xe lăn của người khuyết tật qua đường hoặc các phương tiện\
44
+ \ khác;\nc) Tín hiệu đèn màu đỏ là cấm đi.\n5. Báo hiệu của biển báo hiệu đường\
45
+ \ bộ được quy định như sau:\na) Biển báo cấm để biểu thị các điều cấm; \nb) Biển\
46
+ \ báo nguy hiểm để cảnh báo các tình huống nguy hiểm có thể xảy ra; \nc) Biển\
47
+ \ hiệu lệnh để báo hiệu lệnh phải thi hành; \nd) Biển chỉ dẫn để chỉ dẫn hướng\
48
+ \ đi hoặc các điều cần biết; \nđ) Biển phụ để thuyết minh bổ sung cho biển báo\
49
+ \ cấm, biển báo nguy hiểm, biển hiệu lệnh và biển chỉ dẫn. \n6. Vạch kẻ đường\
50
+ \ là vạch chỉ sự phân chia làn đường, vị trí hoặc hướng đi, vị trí dừng lại.\n\
51
+ 7. Cọc tiêu, tường bảo vệ để hướng dẫn cho người tham gia giao thông đường bộ\
52
+ \ biết phạm vi an toàn của nền đường và hướng đi của đường.\n8. Rào chắn để ngăn\
53
+ \ không cho người, phương tiện qua lại.\n9. Đinh phản quang, tiêu phản quang để\
54
+ \ thông tin, cảnh báo về phần đường, làn đường. \n10. Cột Km, cọc H để báo hiệu\
55
+ \ cho người tham gia giao thông đường bộ về các thông tin của đường bộ.\n11. Thiết\
56
+ \ bị âm thanh báo hiệu đường bộ để hỗ trợ cảnh báo nguy hiểm cho người tham gia\
57
+ \ giao thông đường bộ.\n12. Khi ở một vị trí vừa có biển báo hiệu đặt cố định\
58
+ \ vừa có biển báo hiệu tạm thời mà hai biển có ý nghĩa khác nhau, người tham gia\
59
+ \ giao thông đường bộ phải chấp hành hiệu lệnh của biển báo hiệu tạm thời.\n13.\
60
+ \ Bộ trưởng Bộ Giao thông vận tải ban hành quy chuẩn kỹ thuật quốc gia về báo\
61
+ \ hiệu đường bộ, trừ hiệu lệnh của người điều khiển giao thông.\n14. Bộ trưởng\
62
+ \ Bộ Công an quy định chi tiết khoản 3 Điều này."
63
+ - 'a) Khi quy định tốc độ tối đa cho phép theo phương tiện trên từng làn đường,
64
+ sử dụng biển số P.127c. Các loại phương tiện phải đi đúng làn đường và tuân thủ
65
+ tốc độ tối đa cho phép trên làn đường đó.
66
+
67
+ b) Biển số P.127c là biển hình chữ nhật nền màu xanh, trên đó thể hiện tốc độ
68
+ tối đa trên các làn đường. Biển đặt bên đường hoặc treo trên cột cần vươn hay
69
+ giá long môn. Biểu tượng trên biển có thể thay đổi theo điều kiện sử dụng thực
70
+ tế.
71
+
72
+
73
+ Hình B.27e - Biển số P.127c'
74
+ - '- Hình dạng: có dạng biển hình chữ nhật gắn trên cột biển báo.
75
+
76
+ - Kích thước: tấm hình chữ nhật làm mặt biển có kích thước chiều rộng 350 mm;
77
+ chiều cao 700 mm, 1000 m hoặc 1300m tùy theo việc bố trí 1, 2 hoặc 3 con số lý
78
+ trình thể hiện trên biển theo chiều đứng.
79
+
80
+ - Biển có nền màu xanh lá cây, viền màu trắng với đường cao tốc. Chi tiết xem
81
+ Hình I.3.
82
+
83
+ - Biển có nền màu xanh lam, viền màu trắng với các đường ôtô khác.
84
+
85
+
86
+ Ghi chú: Kích thước ghi trên hình vẽ là cm
87
+
88
+ Hình I.1 - Cột kilômét dạng cột thấp
89
+
90
+
91
+ Ghi chú: Kích thước ghi trên hình vẽ là mm
92
+
93
+ Hình I.2 - Cột kilômét dạng cột cao
94
+
95
+
96
+ Ghi chú: Nền màu xanh lá cây áp dụng cho đường ô tô cao tốc, nền màu xanh lam
97
+ áp dụng cho các đường ô tô khác
98
+
99
+ Hình I.3 - Biển báo hiệu cột kilômét dạng tấm hình chữ nhật đặt ở lề đường
100
+
101
+ Bảng các giá trị kích thước trên Hình I.3
102
+
103
+ Đơn vị: mm
104
+
105
+
106
+  
107
+
108
+
109
+ Hình I.4 - Cọc mốc lộ giới
110
+
111
+
112
+ Hình I.5 - Mặt bằng bố trí mốc lộ giới
113
+
114
+  
115
+
116
+
117
+ a) Cọc H dạng cột
118
+
119
+
120
+ b) Cọc H dạng tấm
121
+
122
+ Hình I.6 - Chi tiết cọc H'
123
+ - source_sentence: Vị trí đặt biển báo cấm theo chiều đi và hướng hiệu lực của biển
124
+ sentences:
125
+ - '7.1. Xe ưu tiên được quyền đi trước xe khác khi qua đường giao nhau từ bất kỳ
126
+ hướng nào tới theo thứ tự ưu tiên từ trên xuống dưới như sau:
127
+
128
+ a) Xe chữa cháy của Cảnh sát phòng cháy, chữa cháy và cứu nạn, cứu hộ và xe chữa
129
+ cháy của các lực lượng khác được huy động đi làm nhiệm vụ chữa cháy;
130
+
131
+ b) Xe của lực lượng quân sự, công an, kiểm sát đi làm nhiệm vụ khẩn cấp; đoàn
132
+ xe có xe Cảnh sát giao thông dẫn đường;
133
+
134
+ c) Xe cứu thương đi làm nhiệm vụ cấp cứu;
135
+
136
+ d) Xe hộ đê đi làm nhiệm vụ; xe đi làm nhiệm vụ cứu nạn, cứu hộ, khắc phục sự
137
+ cố thiên tai, dịch bệnh hoặc xe đi làm nhiệm vụ trong tình trạng khẩn cấp theo
138
+ quy định của pháp luật;
139
+
140
+ đ) Đoàn xe tang.
141
+
142
+ 7.2. Xe ưu tiên quy định tại các điểm a, b, c và d khoản 7.1 Điều này phải có
143
+ tín hiệu ưu tiên theo quy định của pháp luật. Màu của tín hiệu đèn ưu tiên được
144
+ quy định như sau:
145
+
146
+ a) Xe chữa cháy của Cảnh sát phòng cháy, chữa cháy và cứu nạn, cứu hộ và xe chữa
147
+ cháy của các lực lượng khác được huy động đi làm nhiệm vụ chữa cháy, xe của lực
148
+ lượng quân sự đi làm nhiệm vụ khẩn cấp, xe cứu thương đang làm nhiệm vụ cấp cứu
149
+ có đèn nhấp nháy màu đỏ;
150
+
151
+ b) Xe của lực lượng công an, kiểm sát đi làm nhiệm vụ khẩn cấp, xe Cảnh sát giao
152
+ thông dẫn đường có đèn nhấp nháy màu xanh và đỏ;
153
+
154
+ c) Xe hộ đê đi làm nhiệm vụ; xe đi làm nhiệm vụ cứu nạn, cứu hộ, khắc phục sự
155
+ cố thiên tai, dịch bệnh hoặc xe đi làm nhiệm vụ trong tình trạng khẩn cấp theo
156
+ quy định của pháp luật có đèn nhấp nháy màu xanh.
157
+
158
+ 7.3. Xe ưu tiên quy định tại các điểm a, b, c và d khoản 7.1 Điều này không bị
159
+ hạn chế tốc độ; ��ược phép đi không phụ thuộc vào tín hiệu đèn giao thông, đi vào
160
+ đường ngược chiều, các đường khác có thể đi được; riêng đối với đường cao tốc,
161
+ chỉ được đi ngược chiều trên làn dừng xe khẩn cấp; phải tuân theo hiệu lệnh của
162
+ người điều khiển giao thông, biển báo hiệu tạm thời.
163
+
164
+ 7.4. Khi có tín hiệu của xe ưu tiên, người và phương tiện tham gia giao thông
165
+ đường bộ phải giảm tốc độ, đi sát lề đường bên phải hoặc dừng lại để nhường đường,
166
+ trạm thu phí phải ưu tiên cho xe ưu tiên qua trạm trong mọi tình huống, không
167
+ được gây cản trở.'
168
+ - 'a) Để báo nơi cấm đỗ xe trừ các xe được ưu tiên theo quy định, đặt biển số P.131
169
+ (a,b,c) "Cấm đỗ xe".
170
+
171
+ Biển số P.131a có hiệu lực cấm các loại xe cơ giới đỗ ở phía đường có đặt biển.
172
+
173
+ Biển số P.131b có hiệu lực cấm các loại xe cơ giới đỗ ở phía đường có đặt biển
174
+ vào những ngày lẻ và biển số P.131c vào những ngày chẵn.
175
+
176
+ b) Hiệu lực cấm và thời gian cấm đỗ xe áp dụng theo quy định tại điểm b, c mục
177
+ B.30 đối với biển số P.130.
178
+
179
+ c) Trong phạm vi có hiệu lực của biển, nếu có chỗ mở dải phân cách cho phép xe
180
+ quay đầu thì cần đặt thêm biển nhắc lại.
181
+
182
+
183
+ Hình B.31 - Biển số P.131'
184
+ - 'a) Để báo cấm các loại xe quay đầu (theo kiểu chữ U), đặt biển số P.124a "Cấm
185
+ quay đầu xe". Chiều mũi tên phù hợp với chiều cấm quay đầu xe.
186
+
187
+ b) Để báo cấm xe ô tô quay đầu (theo kiểu chữ U), đặt biển số P.124b "Cấm ô tô
188
+ quay đầu xe". Chiều mũi tên phù hợp với chiều cấm xe ô tô quay đầu.
189
+
190
+ c) Để báo cấm các loại xe rẽ trái đồng thời cấm quay đầu, đặt biển số P.124c “Cấm
191
+ rẽ trái và quay đầu xe”.
192
+
193
+ d) Để báo cấm các loại xe rẽ phải đồng thời cấm quay đầu, đặt biển số P.124d “Cấm
194
+ rẽ phải và quay đầu xe”.
195
+
196
+ e) Để báo cấm xe ô tô rẽ trái và đồng thời cấm quay đầu, đặt biển số P.124e “Cấm
197
+ ô tô rẽ trái và quay đầu xe”.
198
+
199
+ f) Để báo cấm xe ô tô rẽ phải và đồng thời cấm quay đầu, đặt biển số P.124f “Cấm
200
+ ô tô rẽ phải và quay đầu xe”.
201
+
202
+ g) Biển số P.124a có hiệu lực cấm các loại xe (cơ giới và thô sơ) và biển số P.124b
203
+ có hiệu lực cấm xe ô tô và xe máy 3 bánh (side car) quay đầu (theo kiểu chữ U)
204
+ trừ các xe được ưu tiên theo quy định.
205
+
206
+ Biển không có giá trị cấm rẽ trái để đi sang hướng đường khác.
207
+
208
+ h) Nếu đặt biển "Cấm quay đầu xe" hay biển "Cấm ô tô quay đầu xe" ở một đoạn đường
209
+ không phải là nơi đường giao nhau thì vị trí bắt đầu cấm, dùng biển số S.503d
210
+ "Hướng tác dụng của biển" đặt bên dưới biển chính.
211
+
212
+
213
+ Hình B.24- Biển số P.124'
214
+ - source_sentence: Tác dụng của biển hiệu lệnh
215
+ sentences:
216
+ - 'Biển số S.505a được đặt bên dưới các biển báo cấm và biển hiệu lệnh hay biển
217
+ chỉ dẫn để chỉ loại xe chịu hiệu lực của biển báo cấm, biển hiệu lệnh hay biển
218
+ chỉ dẫn. Tùy theo loại xe chịu hiệu lực mà bố trí hình vẽ cho phù hợp.
219
+
220
+
221
+ Hình F.5 - Biển số S.505a'
222
+ - '12.1. Quy chuẩn này quy định các thông số về kích thước biển, hình vẽ trong biển
223
+ và chữ viết tương ứng với đường đô thị có hệ số là 1 (xem Hình 1 và Bảng 1). Trường
224
+ hợp đặc biệt, kích thước biển có thể được điều chỉnh để đảm bảo cân đối, đáp ứng
225
+ tính thẩm mỹ và rõ ràng thông tin.
226
+
227
+ 12.2. Đối với các đường khác, kích thước biển, hình vẽ trong biển và chữ viết
228
+ phải nhân với hệ số tương ứng trong Bảng 2, kích thước biển được làm tròn theo
229
+ nguyên tắc:
230
+
231
+ a) Số hàng đơn vị ≤ 5 thì lấy bằng 5;
232
+
233
+ b) Số hàng đơn vị > 5 thì lấy bằng 0 và tăng số hàng chục lên 1 đơn vị.
234
+
235
+
236
+ Hình 1 - Kích thước các loại biển báo
237
+
238
+ Bảng 1 - Kích thước cơ bản của biển báo hệ số 1
239
+
240
+ Đơn vị tính: mm
241
+
242
+
243
+ Bảng 2 - Hệ số kích thước biển báo
244
+
245
+
246
+ 12.3. Chi tiết thông số về chữ viết, kích thước biển, hình vẽ trong biển được
247
+ quy định tại các Phụ lục K, M và Phụ lục P của Quy chuẩn này. Đối với biển chỉ
248
+ dẫn, tùy theo điều kiện thực tế, thông tin chỉ dẫn dài hay ngắn, kích thước biển
249
+ có thể được điều chỉnh để đảm bảo tính rõ ràng thông tin, cân đối và thẩm mỹ của
250
+ biển báo.
251
+
252
+ 12.4. Đối với các đường cấp kỹ thuật thấp (đường cấp V, cấp VI hoặc chưa vào cấp),
253
+ đường giao thông nông thôn tùy theo quy mô và điều kiện khai thác mà vận dụng
254
+ các hệ số kích thước là: 1,25; 1,00 hoặc 0,75.
255
+
256
+ 12.5. Biển di động, biển đặt tạm thời trong thời gian ngắn và các biển sử dụng
257
+ trong các trường hợp đặc biệt (vị trí biển ở dải phân cách hẹp, lề đường hẹp,
258
+ hoặc ảnh hưởng tầm nhìn biển đặt trên các ngõ, ngách, hẻm; các hình biển trong
259
+ biển ghép) có thể điều chỉnh kích thước với hệ số bằng 0,5 hoặc 0,75 (có làm tròn
260
+ số theo quy định).
261
+
262
+ 12.6. Đối với các tuyến đường đối ngoại thì biển bằng chữ được điều chỉnh kích
263
+ thước biển để bố trí đủ chữ viết trên cơ sở quy định của Quy chuẩn này.'
264
+ - '26.1. Biển báo cấm được đặt ở nơi đường giao nhau hoặc trước một vị trí trên
265
+ đường cần cấm.
266
+
267
+ Biển có hiệu lực bắt đầu từ vị trí đặt biển trở đi. Nếu vì lý do nào đó, biển
268
+ đặt cách xa vị trí định cấm thì phải đặt biển phụ số S.502 để chỉ rõ khoảng cách
269
+ từ sau biển cấm đến vị trí biển bắt đầu có hiệu lực.
270
+
271
+ 26.2. Khi cần thiết để chỉ rõ hướng tác dụng của biển và chỉ vị trí bắt đầu hay
272
+ vị trí kết thúc hiệu lực của biển phải đặt biển phụ số S.503 “Hướng tác dụng của
273
+ biển”.
274
+
275
+ 26.3. Các biển báo cấm từ biển số P.101 đến biển số P.120 không cần quy định phạm
276
+ vi có hiệu lực của biển, không có biển báo hết cấm.
277
+
278
+ 26.4. Khi cần thiết, trong trường hợp cấm vì lý do cầu đường bị tắc, hư hỏng thì
279
+ kèm theo các biển báo cấm nêu tại khoản 26.3 Điều này đặt các biển chỉ dẫn lối
280
+ đi cho xe bị cấm.
281
+
282
+ 26.5. Biển số P.121 và biển số P.128 có hiệu lực đến hết khoảng cách cấm ghi trên
283
+ biển phụ số S.501 hoặc đến vị trí đặt biển số DP.135 “Hết tất cả các lệnh cấm”.
284
+
285
+ 26.6. Biển số P.123 (a,b) và biển số P.129 có hiệu lực tại khu vực đặt biển.
286
+
287
+ 26.7. Biển số P.124 (a, b, c, d, e, f) có hiệu lực ở vị trí nơi đường giao nhau,
288
+ chỗ mở dải phân cách nhưng không cho phép quay đầu xe hoặc căn cứ vào biển phụ
289
+ số S.503.
290
+
291
+ 26.8. Biển số P.125, P.126, P.127(a,b,c), P.130, P.131(a,b,c) có hiệu lực đến
292
+ nơi đường giao nhau tiếp giáp hoặc đến vị trí đặt biển hết cấm (các biển số DP.133,
293
+ DP.134, DP.135, DP.127d). Các biển số P.130 và P.131(a,b,c) còn căn cứ vào các
294
+ biển phụ.
295
+
296
+ 26.9. Nếu đoạn đường phải thi hành biển cấm đi qua các nút giao (trừ giao với
297
+ các ngõ, ngách, hẻm hoặc lối ra vào cơ quan, đơn vị; hoặc khu đất lân cận mà phương
298
+ tiện chỉ có thể ra, vào khu đất bằng một lối đi chung), biển cấm phải được nhắc
299
+ lại đặt phía sau nút giao theo hướng đường đang có biển cấm, trừ các trường hợp
300
+ có qui định riêng hoặc có biển phụ kèm theo.'
301
+ - source_sentence: Biển báo giao thông có thông tin thay đổi, biển báo tạm thời
302
+ sentences:
303
+ - "13.1. Chữ viết trên biển phù hợp với quy định về kiểu chữ nêu tại Phụ lục K của\
304
+ \ Quy chuẩn này, trường hợp đặc biệt có thể điều chỉnh cho cân đối, phù hợp và\
305
+ \ đáp ứng thông tin rõ ràng, trong đó:\n13.1.1. Sử dụng kiểu chữ tiêu chuẩn “gt1\
306
+ \ - Kiểu chữ nén” và “gt2 - Kiểu chữ thường” để ghi thông tin bằng chữ trên biển.\n\
307
+ 13.1.2. Chữ viết hoa kiểu chữ thường hoặc kiểu chữ nén sử dụng để viết các thông\
308
+ \ tin chỉ dẫn về hướng đi, các danh từ riêng hoặc các thông tin có tính chất nhấn\
309
+ \ mạnh, gây chú ý cho người tham gia giao thông. Chỉ nên sử dụng kiểu chữ nén\
310
+ \ trong trường hợp phải hạn chế kích thước của biển.\n13.1.3. Chữ viết thường\
311
+ \ thường được sử dụng để viết tên địa danh bằng tiếng Anh, các thông tin dịch\
312
+ \ vụ và trên các biển phụ.\n13.1.4. Trên cùng một hàng chữ chỉ sử dụng một loại\
313
+ \ nét chữ.\n13.1.5. Chữ viết trên biển phải là tiếng Việt đủ dấu. Khoảng cách\
314
+ \ giữa các chữ cái từ 25% - 40% chiều cao chữ, khoảng cách giữa các chữ bất kỳ\
315
+ \ trên cùng một hàng chữ từ 75% - 100% chiều cao chữ. Khoảng cách theo chiều đứng\
316
+ \ giữa các hàng chữ tối thiểu 50% - 75% chiều cao chữ lớn nhất của hàng sau. Khoảng\
317
+ \ cách giữa hàng chữ trên và dưới cùng với mép biển tối thiểu bằng 40% chiều cao\
318
+ \ chữ cao nhất trong hàng. Khoảng cách theo chiều ngang của các chữ ở góc trên\
319
+ \ cùng và dưới cùng đến mép biển tối thiểu bằng 60% chiều cao chữ với chữ viết\
320
+ \ hoa và 100% với chữ viết thường.\n13.1.6. Khoảng cách giữa chữ ghi đơn vị đo\
321
+ \ lường (t, m, km) và chữ số phía trước lấy bằng 50% chiều cao chữ ghi đơn vị\
322
+ \ đo lường.\n13.1.7. Chiều cao chữ được lựa chọn căn cứ trên tốc độ xe chạy sao\
323
+ \ cho người tham gia giao thông có thể đọc được rõ ràng cả ban ngày và ban đêm.\
324
+ \ Chiều cao chữ tối thiểu trên các biển chỉ dẫn là 100 mm với đường thông thường\
325
+ \ và đường đô thị; 150 mm với đường đôi ngoài đô thị và 300 mm đối với đường cao\
326
+ \ tốc. Chữ viết chỉ địa danh và hướng đường có chiều cao tối thiểu là 150 mm.\
327
+ \ Khuyến khích sử dụng kích thước chữ viết lớn nhưng phải đảm bảo tính cân đối\
328
+ \ và thẩm mỹ đối với biển báo.\n13.1.8. Chữ viết phải lựa chọn câu, từ ngắn gọn,\
329
+ \ dễ hiểu nhất; thông tin trên biển phải thống nhất với các thông tin báo hiệu\
330
+ \ khác.\n13.1.9. Chỉ sử dụng màu của chữ như sau: màu trắng trên nền đen, xanh\
331
+ \ hoặc đỏ; màu đen trên nền trắng hoặc vàng hoặc màu vàng trên các nền xanh.\n\
332
+ 13.1.10. Chữ viết trên biển chỉ dẫn trên đường cao tốc ngoài việc tuân thủ các\
333
+ \ quy định trong khoản 13.1 Điều 13 còn tuân thủ khoản 45.3 Điều 45 của Quy chuẩn\
334
+ \ này.\n13.2. Màu sắc trên biển\nMàu sắc trên biển phải tuân theo quy định tiêu\
335
+ \ chuẩn kỹ thuật về màu sắc, màu sắc ban ngày, màu sắc ban đêm và thống nhất trong\
336
+ \ các nhóm biển sử dụng trên mạng lưới đường bộ.\n13.3. Biểu tượng, hình vẽ trên\
337
+ \ biển\nBiểu tượng, hình vẽ được quy định chi tiết đối với từng biển báo. Riêng\
338
+ \ hình vẽ thể hiện cho các loại phương tiện được thể hiện theo nguyên tắc: biểu\
339
+ \ thị ô tô nói chung, xe buýt thì dùng biểu tượng hình chiếu đối diện, đối với\
340
+ \ từng loại xe thì dùng biểu tượng là hình chiếu cạnh. Căn cứ vào thực tiễn tổ\
341
+ \ chức giao thông, từ các biển đã có trong Quy chuẩn, khi vận dụng cho các trường\
342
+ \ hợp khác thì chỉ cần thay thế đối tượng (biểu tượng phương tiện) cũ bằng đối\
343
+ \ tượng (biểu tượng phương tiện) mới. Đối với xe taxi, sử dụng biểu tượng ô tô\
344
+ \ có bổ sung chữ “TAXI” phía trên; xe buýt nhanh, sử dụng biểu tượng xe buýt có\
345
+ \ bổ sung chữ “BRT” phía trên; xe có gắn thiết bị thu phí tự động ETC, sử dụng\
346
+ \ biểu tượng của xe đó có bổ sung ký hiệu “ETC” phía trên. Đối với các loại xe\
347
+ \ chưa có biểu tượng quy định thì có thể viết bằng chữ.\n\n Hình 3 - Biểu tượng\
348
+ \ đối với từng loại phương tiện\nKhi cần biểu thị trọng tải hoặc số chỗ ngồi cho\
349
+ \ các loại xe tải, xe khách thì bổ sung chữ viết số tấn, số chỗ ngồi (chẳng hạn,\
350
+ \ xe tải >3,5 tấn thì viết chữ >3,5t lên hình vẽ xe tải, xe khách dưới 16 chỗ\
351
+ \ thì viết chữ <16c lên hình vẽ xe khách)."
352
+ - Kích thước, hình dạng và các quy định khác của đèn tín hiệu ở Phụ lục A của Quy
353
+ chuẩn này.
354
+ - 'Hình K.5 - Chi tiết chữ viết dạng chữ thường, kiểu chữ nén (gt1)
355
+
356
+  
357
+
358
+ Phụ Lục M
359
+
360
+ CHI TIẾT CÁC THÔNG SỐ THIẾT KẾ BIỂN BÁO'
361
+ - source_sentence: Kích thước, hình dạng và màu sắc của biển báo cấm
362
+ sentences:
363
+ - '- Hình dạng: có dạng biển hình chữ nhật gắn trên cột biển báo.
364
+
365
+ - Kích thước: tấm hình chữ nhật làm mặt biển có kích thước chiều rộng 350 mm;
366
+ chiều cao 700 mm, 1000 m hoặc 1300m tùy theo việc bố trí 1, 2 hoặc 3 con số lý
367
+ trình thể hiện trên biển theo chiều đứng.
368
+
369
+ - Biển có nền màu xanh lá cây, viền màu trắng với đường cao tốc. Chi tiết xem
370
+ Hình I.3.
371
+
372
+ - Biển có nền màu xanh lam, viền màu trắng với các đường ôtô khác.
373
+
374
+
375
+ Ghi chú: Kích thước ghi trên hình vẽ là cm
376
+
377
+ Hình I.1 - Cột kilômét dạng cột thấp
378
+
379
+
380
+ Ghi chú: Kích thước ghi trên hình vẽ là mm
381
+
382
+ Hình I.2 - Cột kilômét dạng cột cao
383
+
384
+
385
+ Ghi chú: Nền màu xanh lá cây áp dụng cho đường ô tô cao tốc, nền màu xanh lam
386
+ áp dụng cho các đường ô tô khác
387
+
388
+ Hình I.3 - Biển báo hiệu cột kilômét dạng tấm hình chữ nhật đặt ở lề đường
389
+
390
+ Bảng các giá trị kích thước trên Hình I.3
391
+
392
+ Đơn vị: mm
393
+
394
+
395
+  
396
+
397
+
398
+ Hình I.4 - Cọc mốc lộ giới
399
+
400
+
401
+ Hình I.5 - Mặt bằng bố trí mốc lộ giới
402
+
403
+  
404
+
405
+
406
+ a) Cọc H dạng cột
407
+
408
+
409
+ b) Cọc H dạng tấm
410
+
411
+ Hình I.6 - Chi tiết cọc H'
412
+ - Hình K.2 - Chi tiết chữ viết và con số dạng chữ in hoa, kiểu chữ thường (gt2)
413
+ - '- Hình dạng: có dạng biển hình chữ nhật gắn trên cột biển báo.
414
+
415
+ - Kích thước: tấm hình chữ nhật làm mặt biển có kích thước chiều rộng 350 mm;
416
+ chiều cao 700 mm, 1000 m hoặc 1300m tùy theo việc bố trí 1, 2 hoặc 3 con số lý
417
+ trình thể hiện trên biển theo chiều đứng.
418
+
419
+ - Biển có nền màu xanh lá cây, viền màu trắng với đường cao tốc. Chi tiết xem
420
+ Hình I.3.
421
+
422
+ - Biển có nền màu xanh lam, viền màu trắng với các đường ôtô khác.
423
+
424
+
425
+ Ghi chú: Kích thước ghi trên hình vẽ là cm
426
+
427
+ Hình I.1 - Cột kilômét dạng cột thấp
428
+
429
+
430
+ Ghi chú: Kích thước ghi trên hình vẽ là mm
431
+
432
+ Hình I.2 - Cột kilômét dạng cột cao
433
+
434
+
435
+ Ghi chú: Nền màu xanh lá cây áp dụng cho đường ô tô cao tốc, nền màu xanh lam
436
+ áp dụng cho các đường ô tô khác
437
+
438
+ Hình I.3 - Biển báo hiệu cột kilômét dạng tấm hình chữ nhật đặt ở lề đường
439
+
440
+ Bảng các giá trị kích thước trên Hình I.3
441
+
442
+ Đơn vị: mm
443
+
444
+
445
+  
446
+
447
+
448
+ Hình I.4 - Cọc mốc lộ giới
449
+
450
+
451
+ Hình I.5 - Mặt bằng bố trí mốc lộ giới
452
+
453
+  
454
+
455
+
456
+ a) Cọc H dạng cột
457
+
458
+
459
+ b) Cọc H dạng tấm
460
+
461
+ Hình I.6 - Chi tiết cọc H'
462
+ pipeline_tag: sentence-similarity
463
+ library_name: sentence-transformers
464
+ ---
465
+
466
+ # SentenceTransformer based on AITeamVN/Vietnamese_Embedding_v2
467
+
468
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [AITeamVN/Vietnamese_Embedding_v2](https://huggingface.co/AITeamVN/Vietnamese_Embedding_v2). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
469
+
470
+ ## Model Details
471
+
472
+ ### Model Description
473
+ - **Model Type:** Sentence Transformer
474
+ - **Base model:** [AITeamVN/Vietnamese_Embedding_v2](https://huggingface.co/AITeamVN/Vietnamese_Embedding_v2) <!-- at revision 18b44161e041bf1d3a333ab5144b5b7b93f914d2 -->
475
+ - **Maximum Sequence Length:** 2048 tokens
476
+ - **Output Dimensionality:** 1024 dimensions
477
+ - **Similarity Function:** Cosine Similarity
478
+ <!-- - **Training Dataset:** Unknown -->
479
+ <!-- - **Language:** Unknown -->
480
+ <!-- - **License:** Unknown -->
481
+
482
+ ### Model Sources
483
+
484
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
485
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
486
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
487
+
488
+ ### Full Model Architecture
489
+
490
+ ```
491
+ SentenceTransformer(
492
+ (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
493
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
494
+ )
495
+ ```
496
+
497
+ ## Usage
498
+
499
+ ### Direct Usage (Sentence Transformers)
500
+
501
+ First install the Sentence Transformers library:
502
+
503
+ ```bash
504
+ pip install -U sentence-transformers
505
+ ```
506
+
507
+ Then you can load this model and run inference.
508
+ ```python
509
+ from sentence_transformers import SentenceTransformer
510
+
511
+ # Download from the 🤗 Hub
512
+ model = SentenceTransformer("phonghoccode/VSLP2025_Embedding_bm25_v1")
513
+ # Run inference
514
+ sentences = [
515
+ 'Kích thước, hình dạng và màu sắc của biển báo cấm',
516
+ '- Hình dạng: có dạng biển hình chữ nhật gắn trên cột biển báo.\n- Kích thước: tấm hình chữ nhật làm mặt biển có kích thước chiều rộng 350 mm; chiều cao 700 mm, 1000 m hoặc 1300m tùy theo việc bố trí 1, 2 hoặc 3 con số lý trình thể hiện trên biển theo chiều đứng.\n- Biển có nền màu xanh lá cây, viền màu trắng với đường cao tốc. Chi tiết xem Hình I.3.\n- Biển có nền màu xanh lam, viền màu trắng với các đường ôtô khác.\n\nGhi chú: Kích thước ghi trên hình vẽ là cm\nHình I.1 - Cột kilômét dạng cột thấp\n\nGhi chú: Kích thước ghi trên hình vẽ là mm\nHình I.2 - Cột kilômét dạng cột cao\n\nGhi chú: Nền màu xanh lá cây áp dụng cho đường ô tô cao tốc, nền màu xanh lam áp dụng cho các đường ô tô khác\nHình I.3 - Biển báo hiệu cột kilômét dạng tấm hình chữ nhật đặt ở lề đường\nBảng các giá trị kích thước trên Hình I.3\nĐơn vị: mm\n\n\xa0\n\nHình I.4 - Cọc mốc lộ giới\n\nHình I.5 - Mặt bằng bố trí mốc lộ giới\n\xa0\n\na) Cọc H dạng cột\n\nb) Cọc H dạng tấm\nHình I.6 - Chi tiết cọc H',
517
+ '- Hình dạng: có dạng biển hình chữ nhật gắn trên cột biển báo.\n- Kích thước: tấm hình chữ nhật làm mặt biển có kích thước chiều rộng 350 mm; chiều cao 700 mm, 1000 m hoặc 1300m tùy theo việc bố trí 1, 2 hoặc 3 con số lý trình thể hiện trên biển theo chiều đứng.\n- Biển có nền màu xanh lá cây, viền màu trắng với đường cao tốc. Chi tiết xem Hình I.3.\n- Biển có nền màu xanh lam, viền màu trắng với các đường ôtô khác.\n\nGhi chú: Kích thước ghi trên hình vẽ là cm\nHình I.1 - Cột kilômét dạng cột thấp\n\nGhi chú: Kích thước ghi trên hình vẽ là mm\nHình I.2 - Cột kilômét dạng cột cao\n\nGhi chú: Nền màu xanh lá cây áp dụng cho đường ô tô cao tốc, nền màu xanh lam áp dụng cho các đường ô tô khác\nHình I.3 - Biển báo hiệu cột kilômét dạng tấm hình chữ nhật đặt ở lề đường\nBảng các giá trị kích thước trên Hình I.3\nĐơn vị: mm\n\n\xa0\n\nHình I.4 - Cọc mốc lộ giới\n\nHình I.5 - Mặt bằng bố trí mốc lộ giới\n\xa0\n\na) Cọc H dạng cột\n\nb) Cọc H dạng tấm\nHình I.6 - Chi tiết cọc H',
518
+ ]
519
+ embeddings = model.encode(sentences)
520
+ print(embeddings.shape)
521
+ # [3, 1024]
522
+
523
+ # Get the similarity scores for the embeddings
524
+ similarities = model.similarity(embeddings, embeddings)
525
+ print(similarities.shape)
526
+ # [3, 3]
527
+ ```
528
+
529
+ <!--
530
+ ### Direct Usage (Transformers)
531
+
532
+ <details><summary>Click to see the direct usage in Transformers</summary>
533
+
534
+ </details>
535
+ -->
536
+
537
+ <!--
538
+ ### Downstream Usage (Sentence Transformers)
539
+
540
+ You can finetune this model on your own dataset.
541
+
542
+ <details><summary>Click to expand</summary>
543
+
544
+ </details>
545
+ -->
546
+
547
+ <!--
548
+ ### Out-of-Scope Use
549
+
550
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
551
+ -->
552
+
553
+ <!--
554
+ ## Bias, Risks and Limitations
555
+
556
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
557
+ -->
558
+
559
+ <!--
560
+ ### Recommendations
561
+
562
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
563
+ -->
564
+
565
+ ## Training Details
566
+
567
+ ### Training Dataset
568
+
569
+ #### Unnamed Dataset
570
+
571
+ * Size: 8,337 training samples
572
+ * Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>label</code>
573
+ * Approximate statistics based on the first 1000 samples:
574
+ | | sentence1 | sentence2 | label |
575
+ |:--------|:----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:-----------------------------------------------|
576
+ | type | string | string | int |
577
+ | details | <ul><li>min: 4 tokens</li><li>mean: 11.61 tokens</li><li>max: 22 tokens</li></ul> | <ul><li>min: 23 tokens</li><li>mean: 430.65 tokens</li><li>max: 2048 tokens</li></ul> | <ul><li>0: ~95.20%</li><li>1: ~4.80%</li></ul> |
578
+ * Samples:
579
+ | sentence1 | sentence2 | label |
580
+ |:--------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
581
+ | <code>Phạm vi điều chỉnh</code> | <code>Quy chuẩn này quy định về báo hiệu đường bộ bao gồm: đèn tín hiệu giao thông; biển báo hiệu đường bộ; vạch kẻ đường và các dấu hiệu khác trên mặt đường; cọc tiêu, tường bảo vệ, rào chắn, đinh phản quang, tiêu phản quang, cột Km, cọc H; thiết bị âm thanh báo hiệu đường bộ.<br>Quy chuẩn này quy định về báo hiệu đường bộ áp dụng cho tất cả các tuyến đường bộ trong mạng lưới đường bộ Việt Nam, các đường nằm trong hệ thống đường bộ tham gia Điều ước quốc tế mà Việt Nam là thành viên (Hiệp định GMS-CBTA, các thỏa thuận trong ASEAN và các thỏa thuận quốc tế khác) - sau đây gọi là các tuyến đường đối ngoại.</code> | <code>1</code> |
582
+ | <code>Phạm vi điều chỉnh</code> | <code>a) Để báo trước gần tới đoạn đường thường có gió ngang thổi mạnh gây nguy hiểm, đặt biển số W.232 "Gió ngang". Người tham gia giao thông cần phải điều chỉnh tốc độ xe chạy cho thích hợp, đề phòng gió thổi mạnh gây lật xe.<br>b) Biển này chỉ đặt ngoài phạm vi thành phố, khu đông dân cư. Tại vị trí nguy hiểm nên đặt thiết bị đo gió để những người tham gia giao thông biết được hướng và cường độ gió.<br><br>Hình C.34 - Biển số W.232</code> | <code>0</code> |
583
+ | <code>Phạm vi điều chỉnh</code> | <code>12.1. Quy chuẩn này quy định các thông số về kích thước biển, hình vẽ trong biển và chữ viết tương ứng với đường đô thị có hệ số là 1 (xem Hình 1 và Bảng 1). Trường hợp đặc biệt, kích thước biển có thể được điều chỉnh để đảm bảo cân đối, đáp ứng tính thẩm mỹ và rõ ràng thông tin.<br>12.2. Đối với các đường khác, kích thước biển, hình vẽ trong biển và chữ viết phải nhân với hệ số tương ứng trong Bảng 2, kích thước biển được làm tròn theo nguyên tắc:<br>a) Số hàng đơn vị ≤ 5 thì lấy bằng 5;<br>b) Số hàng đơn vị > 5 thì lấy bằng 0 và tăng số hàng chục lên 1 đơn vị.<br><br>Hình 1 - Kích thước các loại biển báo<br>Bảng 1 - Kích thước cơ bản của biển báo hệ số 1<br>Đơn vị tính: mm<br><br>Bảng 2 - Hệ số kích thước biển báo<br><br>12.3. Chi tiết thông số về chữ viết, kích thước biển, hình vẽ trong bi���n được quy định tại các Phụ lục K, M và Phụ lục P của Quy chuẩn này. Đối với biển chỉ dẫn, tùy theo điều kiện thực tế, thông tin chỉ dẫn dài hay ngắn, kích thước biển có thể được điều chỉnh để đảm bảo tính rõ ràng thông tin, cân ...</code> | <code>0</code> |
584
+ * Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
585
+ ```json
586
+ {
587
+ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
588
+ "margin": 0.5,
589
+ "size_average": true
590
+ }
591
+ ```
592
+
593
+ ### Training Hyperparameters
594
+ #### Non-Default Hyperparameters
595
+
596
+ - `per_device_train_batch_size`: 6
597
+ - `per_device_eval_batch_size`: 12
598
+ - `gradient_accumulation_steps`: 4
599
+ - `learning_rate`: 2e-05
600
+ - `warmup_ratio`: 0.1
601
+ - `fp16`: True
602
+ - `push_to_hub`: True
603
+ - `hub_model_id`: phonghoccode/VSLP2025_Embedding_bm25_v1
604
+ - `gradient_checkpointing`: True
605
+
606
+ #### All Hyperparameters
607
+ <details><summary>Click to expand</summary>
608
+
609
+ - `overwrite_output_dir`: False
610
+ - `do_predict`: False
611
+ - `eval_strategy`: no
612
+ - `prediction_loss_only`: True
613
+ - `per_device_train_batch_size`: 6
614
+ - `per_device_eval_batch_size`: 12
615
+ - `per_gpu_train_batch_size`: None
616
+ - `per_gpu_eval_batch_size`: None
617
+ - `gradient_accumulation_steps`: 4
618
+ - `eval_accumulation_steps`: None
619
+ - `torch_empty_cache_steps`: None
620
+ - `learning_rate`: 2e-05
621
+ - `weight_decay`: 0.0
622
+ - `adam_beta1`: 0.9
623
+ - `adam_beta2`: 0.999
624
+ - `adam_epsilon`: 1e-08
625
+ - `max_grad_norm`: 1.0
626
+ - `num_train_epochs`: 3
627
+ - `max_steps`: -1
628
+ - `lr_scheduler_type`: linear
629
+ - `lr_scheduler_kwargs`: {}
630
+ - `warmup_ratio`: 0.1
631
+ - `warmup_steps`: 0
632
+ - `log_level`: passive
633
+ - `log_level_replica`: warning
634
+ - `log_on_each_node`: True
635
+ - `logging_nan_inf_filter`: True
636
+ - `save_safetensors`: True
637
+ - `save_on_each_node`: False
638
+ - `save_only_model`: False
639
+ - `restore_callback_states_from_checkpoint`: False
640
+ - `no_cuda`: False
641
+ - `use_cpu`: False
642
+ - `use_mps_device`: False
643
+ - `seed`: 42
644
+ - `data_seed`: None
645
+ - `jit_mode_eval`: False
646
+ - `use_ipex`: False
647
+ - `bf16`: False
648
+ - `fp16`: True
649
+ - `fp16_opt_level`: O1
650
+ - `half_precision_backend`: auto
651
+ - `bf16_full_eval`: False
652
+ - `fp16_full_eval`: False
653
+ - `tf32`: None
654
+ - `local_rank`: 0
655
+ - `ddp_backend`: None
656
+ - `tpu_num_cores`: None
657
+ - `tpu_metrics_debug`: False
658
+ - `debug`: []
659
+ - `dataloader_drop_last`: False
660
+ - `dataloader_num_workers`: 0
661
+ - `dataloader_prefetch_factor`: None
662
+ - `past_index`: -1
663
+ - `disable_tqdm`: False
664
+ - `remove_unused_columns`: True
665
+ - `label_names`: None
666
+ - `load_best_model_at_end`: False
667
+ - `ignore_data_skip`: False
668
+ - `fsdp`: []
669
+ - `fsdp_min_num_params`: 0
670
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
671
+ - `fsdp_transformer_layer_cls_to_wrap`: None
672
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
673
+ - `deepspeed`: None
674
+ - `label_smoothing_factor`: 0.0
675
+ - `optim`: adamw_torch
676
+ - `optim_args`: None
677
+ - `adafactor`: False
678
+ - `group_by_length`: False
679
+ - `length_column_name`: length
680
+ - `ddp_find_unused_parameters`: None
681
+ - `ddp_bucket_cap_mb`: None
682
+ - `ddp_broadcast_buffers`: False
683
+ - `dataloader_pin_memory`: True
684
+ - `dataloader_persistent_workers`: False
685
+ - `skip_memory_metrics`: True
686
+ - `use_legacy_prediction_loop`: False
687
+ - `push_to_hub`: True
688
+ - `resume_from_checkpoint`: None
689
+ - `hub_model_id`: phonghoccode/VSLP2025_Embedding_bm25_v1
690
+ - `hub_strategy`: every_save
691
+ - `hub_private_repo`: None
692
+ - `hub_always_push`: False
693
+ - `gradient_checkpointing`: True
694
+ - `gradient_checkpointing_kwargs`: None
695
+ - `include_inputs_for_metrics`: False
696
+ - `include_for_metrics`: []
697
+ - `eval_do_concat_batches`: True
698
+ - `fp16_backend`: auto
699
+ - `push_to_hub_model_id`: None
700
+ - `push_to_hub_organization`: None
701
+ - `mp_parameters`:
702
+ - `auto_find_batch_size`: False
703
+ - `full_determinism`: False
704
+ - `torchdynamo`: None
705
+ - `ray_scope`: last
706
+ - `ddp_timeout`: 1800
707
+ - `torch_compile`: False
708
+ - `torch_compile_backend`: None
709
+ - `torch_compile_mode`: None
710
+ - `include_tokens_per_second`: False
711
+ - `include_num_input_tokens_seen`: False
712
+ - `neftune_noise_alpha`: None
713
+ - `optim_target_modules`: None
714
+ - `batch_eval_metrics`: False
715
+ - `eval_on_start`: False
716
+ - `use_liger_kernel`: False
717
+ - `eval_use_gather_object`: False
718
+ - `average_tokens_across_devices`: False
719
+ - `prompts`: None
720
+ - `batch_sampler`: batch_sampler
721
+ - `multi_dataset_batch_sampler`: proportional
722
+
723
+ </details>
724
+
725
+ ### Training Logs
726
+ | Epoch | Step | Training Loss |
727
+ |:------:|:----:|:-------------:|
728
+ | 0.2878 | 100 | 0.0272 |
729
+ | 0.5755 | 200 | 0.0134 |
730
+ | 0.8633 | 300 | 0.0107 |
731
+ | 1.1496 | 400 | 0.0064 |
732
+ | 1.4374 | 500 | 0.0071 |
733
+ | 1.7252 | 600 | 0.0053 |
734
+ | 2.0115 | 700 | 0.0064 |
735
+ | 2.2993 | 800 | 0.0032 |
736
+ | 2.5871 | 900 | 0.0031 |
737
+ | 2.8748 | 1000 | 0.0038 |
738
+
739
+
740
+ ### Framework Versions
741
+ - Python: 3.11.13
742
+ - Sentence Transformers: 4.1.0
743
+ - Transformers: 4.52.4
744
+ - PyTorch: 2.6.0+cu124
745
+ - Accelerate: 1.8.1
746
+ - Datasets: 2.19.2
747
+ - Tokenizers: 0.21.2
748
+
749
+ ## Citation
750
+
751
+ ### BibTeX
752
+
753
+ #### Sentence Transformers
754
+ ```bibtex
755
+ @inproceedings{reimers-2019-sentence-bert,
756
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
757
+ author = "Reimers, Nils and Gurevych, Iryna",
758
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
759
+ month = "11",
760
+ year = "2019",
761
+ publisher = "Association for Computational Linguistics",
762
+ url = "https://arxiv.org/abs/1908.10084",
763
+ }
764
+ ```
765
+
766
+ #### ContrastiveLoss
767
+ ```bibtex
768
+ @inproceedings{hadsell2006dimensionality,
769
+ author={Hadsell, R. and Chopra, S. and LeCun, Y.},
770
+ booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
771
+ title={Dimensionality Reduction by Learning an Invariant Mapping},
772
+ year={2006},
773
+ volume={2},
774
+ number={},
775
+ pages={1735-1742},
776
+ doi={10.1109/CVPR.2006.100}
777
+ }
778
+ ```
779
+
780
+ <!--
781
+ ## Glossary
782
+
783
+ *Clearly define terms in order to be accessible across audiences.*
784
+ -->
785
+
786
+ <!--
787
+ ## Model Card Authors
788
+
789
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
790
+ -->
791
+
792
+ <!--
793
+ ## Model Card Contact
794
+
795
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
796
+ -->
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "4.1.0",
4
+ "transformers": "4.52.4",
5
+ "pytorch": "2.6.0+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 2048,
3
+ "do_lower_case": false
4
+ }