Training in progress, step 1000
Browse files- .gitattributes +1 -0
- 1_Pooling/config.json +10 -0
- README.md +796 -0
- config.json +27 -0
- config_sentence_transformers.json +10 -0
- model.safetensors +3 -0
- modules.json +14 -0
- runs/Aug16_17-46-16_04f91239a58d/events.out.tfevents.1755366379.04f91239a58d.260.0 +3 -0
- runs/Aug16_18-42-28_04f91239a58d/events.out.tfevents.1755369751.04f91239a58d.330.0 +3 -0
- runs/Aug16_23-05-27_04f91239a58d/events.out.tfevents.1755385529.04f91239a58d.410.0 +3 -0
- sentence_bert_config.json +4 -0
- sentencepiece.bpe.model +3 -0
- special_tokens_map.json +51 -0
- tokenizer.json +3 -0
- tokenizer_config.json +56 -0
- training_args.bin +3 -0
.gitattributes
CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
36 |
+
tokenizer.json filter=lfs diff=lfs merge=lfs -text
|
1_Pooling/config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"word_embedding_dimension": 1024,
|
3 |
+
"pooling_mode_cls_token": false,
|
4 |
+
"pooling_mode_mean_tokens": true,
|
5 |
+
"pooling_mode_max_tokens": false,
|
6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
+
"pooling_mode_weightedmean_tokens": false,
|
8 |
+
"pooling_mode_lasttoken": false,
|
9 |
+
"include_prompt": true
|
10 |
+
}
|
README.md
ADDED
@@ -0,0 +1,796 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
tags:
|
3 |
+
- sentence-transformers
|
4 |
+
- sentence-similarity
|
5 |
+
- feature-extraction
|
6 |
+
- generated_from_trainer
|
7 |
+
- dataset_size:8337
|
8 |
+
- loss:ContrastiveLoss
|
9 |
+
base_model: AITeamVN/Vietnamese_Embedding_v2
|
10 |
+
widget:
|
11 |
+
- source_sentence: Điều khiển giao thông bằng tín hiệu đèn
|
12 |
+
sentences:
|
13 |
+
- "1. Báo hiệu đường bộ bao gồm: hiệu lệnh của người điều khiển giao thông; đèn\
|
14 |
+
\ tín hiệu giao thông; biển báo hiệu đường bộ; vạch kẻ đường và các dấu hiệu khác\
|
15 |
+
\ trên mặt đường; cọc tiêu, tường bảo vệ, rào chắn, đinh phản quang, tiêu phản\
|
16 |
+
\ quang, cột Km, cọc H; thiết bị âm thanh báo hiệu đường bộ.\n2. Người tham gia\
|
17 |
+
\ giao thông đường bộ phải chấp hành báo hiệu đường bộ theo thứ tự ưu tiên từ\
|
18 |
+
\ trên xuống dưới như sau: \na) Hiệu lệnh của người điều khiển giao thông;\nb)\
|
19 |
+
\ Tín hiệu đèn giao thông;\nc) Biển báo hiệu đường bộ;\nd) Vạch kẻ đường và các\
|
20 |
+
\ dấu hiệu khác trên mặt đường;\nđ) Cọc tiêu, tường bảo vệ, rào chắn, đinh phản\
|
21 |
+
\ quang, tiêu phản quang, cột Km, cọc H;\ne) Thiết bị âm thanh báo hiệu đường\
|
22 |
+
\ bộ.\n3. Hiệu lệnh của người điều khiển giao thông được quy định như sau:\na)\
|
23 |
+
\ Tay bên phải giơ thẳng đứng để báo hiệu cho người tham gia giao thông đường\
|
24 |
+
\ bộ ở tất cả các hướng phải dừng lại;\nb) Hai tay hoặc một tay dang ngang để\
|
25 |
+
\ báo hiệu cho người tham gia giao thông đường bộ ở phía trước và ở phía sau người\
|
26 |
+
\ điều khiển giao thông phải dừng lại; người tham gia giao thông đường bộ ở phía\
|
27 |
+
\ bên phải và bên trái người điều khiển giao thông được đi;\nc) Tay bên phải giơ\
|
28 |
+
\ về phía trước để báo hiệu cho người tham gia giao thông đường bộ ở phía sau\
|
29 |
+
\ và bên phải người điều khiển giao thông phải dừng lại; người tham gia giao thông\
|
30 |
+
\ đường bộ ở phía trước người điều khiển giao thông được rẽ phải; người tham gia\
|
31 |
+
\ giao thông đường bộ ở phía bên trái người điều khiển giao thông được đi tất\
|
32 |
+
\ cả các hướng; người đi bộ qua đường phải đi sau lưng người điều khiển giao thông.\n\
|
33 |
+
4. Tín hiệu đèn giao thông có 03 màu, gồm: màu xanh, màu vàng, màu đỏ; có hiển\
|
34 |
+
\ thị thời gian hoặc không hiển thị thời gian. Người tham gia giao thông đường\
|
35 |
+
\ bộ phải chấp hành như sau:\na) Tín hiệu đèn màu xanh là được đi; trường hợp\
|
36 |
+
\ người đi bộ, xe lăn của người khuyết tật đang đi ở lòng đường, người điều khiển\
|
37 |
+
\ phương tiện tham gia giao thông đường bộ phải giảm tốc độ hoặc dừng lại nhường\
|
38 |
+
\ đường cho người đi bộ, xe lăn của người khuyết tật qua đường;\nb) Tín hiệu đèn\
|
39 |
+
\ màu vàng phải dừng lại trước vạch dừng; trường hợp đang đi trên vạch dừng hoặc\
|
40 |
+
\ đã đi qua vạch dừng mà tín hiệu đèn màu vàng thì được đi tiếp; trường hợp tín\
|
41 |
+
\ hiệu đèn màu vàng nhấp nháy, người điều khiển phương tiện tham gia giao thông\
|
42 |
+
\ đường bộ được đi nhưng phải quan sát, giảm tốc độ hoặc dừng lại nhường đường\
|
43 |
+
\ cho người đi bộ, xe lăn của người khuyết tật qua đường hoặc các phương tiện\
|
44 |
+
\ khác;\nc) Tín hiệu đèn màu đỏ là cấm đi.\n5. Báo hiệu của biển báo hiệu đường\
|
45 |
+
\ bộ được quy định như sau:\na) Biển báo cấm để biểu thị các điều cấm; \nb) Biển\
|
46 |
+
\ báo nguy hiểm để cảnh báo các tình huống nguy hiểm có thể xảy ra; \nc) Biển\
|
47 |
+
\ hiệu lệnh để báo hiệu lệnh phải thi hành; \nd) Biển chỉ dẫn để chỉ dẫn hướng\
|
48 |
+
\ đi hoặc các điều cần biết; \nđ) Biển phụ để thuyết minh bổ sung cho biển báo\
|
49 |
+
\ cấm, biển báo nguy hiểm, biển hiệu lệnh và biển chỉ dẫn. \n6. Vạch kẻ đường\
|
50 |
+
\ là vạch chỉ sự phân chia làn đường, vị trí hoặc hướng đi, vị trí dừng lại.\n\
|
51 |
+
7. Cọc tiêu, tường bảo vệ để hướng dẫn cho người tham gia giao thông đường bộ\
|
52 |
+
\ biết phạm vi an toàn của nền đường và hướng đi của đường.\n8. Rào chắn để ngăn\
|
53 |
+
\ không cho người, phương tiện qua lại.\n9. Đinh phản quang, tiêu phản quang để\
|
54 |
+
\ thông tin, cảnh báo về phần đường, làn đường. \n10. Cột Km, cọc H để báo hiệu\
|
55 |
+
\ cho người tham gia giao thông đường bộ về các thông tin của đường bộ.\n11. Thiết\
|
56 |
+
\ bị âm thanh báo hiệu đường bộ để hỗ trợ cảnh báo nguy hiểm cho người tham gia\
|
57 |
+
\ giao thông đường bộ.\n12. Khi ở một vị trí vừa có biển báo hiệu đặt cố định\
|
58 |
+
\ vừa có biển báo hiệu tạm thời mà hai biển có ý nghĩa khác nhau, người tham gia\
|
59 |
+
\ giao thông đường bộ phải chấp hành hiệu lệnh của biển báo hiệu tạm thời.\n13.\
|
60 |
+
\ Bộ trưởng Bộ Giao thông vận tải ban hành quy chuẩn kỹ thuật quốc gia về báo\
|
61 |
+
\ hiệu đường bộ, trừ hiệu lệnh của người điều khiển giao thông.\n14. Bộ trưởng\
|
62 |
+
\ Bộ Công an quy định chi tiết khoản 3 Điều này."
|
63 |
+
- 'a) Khi quy định tốc độ tối đa cho phép theo phương tiện trên từng làn đường,
|
64 |
+
sử dụng biển số P.127c. Các loại phương tiện phải đi đúng làn đường và tuân thủ
|
65 |
+
tốc độ tối đa cho phép trên làn đường đó.
|
66 |
+
|
67 |
+
b) Biển số P.127c là biển hình chữ nhật nền màu xanh, trên đó thể hiện tốc độ
|
68 |
+
tối đa trên các làn đường. Biển đặt bên đường hoặc treo trên cột cần vươn hay
|
69 |
+
giá long môn. Biểu tượng trên biển có thể thay đổi theo điều kiện sử dụng thực
|
70 |
+
tế.
|
71 |
+
|
72 |
+
|
73 |
+
Hình B.27e - Biển số P.127c'
|
74 |
+
- '- Hình dạng: có dạng biển hình chữ nhật gắn trên cột biển báo.
|
75 |
+
|
76 |
+
- Kích thước: tấm hình chữ nhật làm mặt biển có kích thước chiều rộng 350 mm;
|
77 |
+
chiều cao 700 mm, 1000 m hoặc 1300m tùy theo việc bố trí 1, 2 hoặc 3 con số lý
|
78 |
+
trình thể hiện trên biển theo chiều đứng.
|
79 |
+
|
80 |
+
- Biển có nền màu xanh lá cây, viền màu trắng với đường cao tốc. Chi tiết xem
|
81 |
+
Hình I.3.
|
82 |
+
|
83 |
+
- Biển có nền màu xanh lam, viền màu trắng với các đường ôtô khác.
|
84 |
+
|
85 |
+
|
86 |
+
Ghi chú: Kích thước ghi trên hình vẽ là cm
|
87 |
+
|
88 |
+
Hình I.1 - Cột kilômét dạng cột thấp
|
89 |
+
|
90 |
+
|
91 |
+
Ghi chú: Kích thước ghi trên hình vẽ là mm
|
92 |
+
|
93 |
+
Hình I.2 - Cột kilômét dạng cột cao
|
94 |
+
|
95 |
+
|
96 |
+
Ghi chú: Nền màu xanh lá cây áp dụng cho đường ô tô cao tốc, nền màu xanh lam
|
97 |
+
áp dụng cho các đường ô tô khác
|
98 |
+
|
99 |
+
Hình I.3 - Biển báo hiệu cột kilômét dạng tấm hình chữ nhật đặt ở lề đường
|
100 |
+
|
101 |
+
Bảng các giá trị kích thước trên Hình I.3
|
102 |
+
|
103 |
+
Đơn vị: mm
|
104 |
+
|
105 |
+
|
106 |
+
|
107 |
+
|
108 |
+
|
109 |
+
Hình I.4 - Cọc mốc lộ giới
|
110 |
+
|
111 |
+
|
112 |
+
Hình I.5 - Mặt bằng bố trí mốc lộ giới
|
113 |
+
|
114 |
+
|
115 |
+
|
116 |
+
|
117 |
+
a) Cọc H dạng cột
|
118 |
+
|
119 |
+
|
120 |
+
b) Cọc H dạng tấm
|
121 |
+
|
122 |
+
Hình I.6 - Chi tiết cọc H'
|
123 |
+
- source_sentence: Vị trí đặt biển báo cấm theo chiều đi và hướng hiệu lực của biển
|
124 |
+
sentences:
|
125 |
+
- '7.1. Xe ưu tiên được quyền đi trước xe khác khi qua đường giao nhau từ bất kỳ
|
126 |
+
hướng nào tới theo thứ tự ưu tiên từ trên xuống dưới như sau:
|
127 |
+
|
128 |
+
a) Xe chữa cháy của Cảnh sát phòng cháy, chữa cháy và cứu nạn, cứu hộ và xe chữa
|
129 |
+
cháy của các lực lượng khác được huy động đi làm nhiệm vụ chữa cháy;
|
130 |
+
|
131 |
+
b) Xe của lực lượng quân sự, công an, kiểm sát đi làm nhiệm vụ khẩn cấp; đoàn
|
132 |
+
xe có xe Cảnh sát giao thông dẫn đường;
|
133 |
+
|
134 |
+
c) Xe cứu thương đi làm nhiệm vụ cấp cứu;
|
135 |
+
|
136 |
+
d) Xe hộ đê đi làm nhiệm vụ; xe đi làm nhiệm vụ cứu nạn, cứu hộ, khắc phục sự
|
137 |
+
cố thiên tai, dịch bệnh hoặc xe đi làm nhiệm vụ trong tình trạng khẩn cấp theo
|
138 |
+
quy định của pháp luật;
|
139 |
+
|
140 |
+
đ) Đoàn xe tang.
|
141 |
+
|
142 |
+
7.2. Xe ưu tiên quy định tại các điểm a, b, c và d khoản 7.1 Điều này phải có
|
143 |
+
tín hiệu ưu tiên theo quy định của pháp luật. Màu của tín hiệu đèn ưu tiên được
|
144 |
+
quy định như sau:
|
145 |
+
|
146 |
+
a) Xe chữa cháy của Cảnh sát phòng cháy, chữa cháy và cứu nạn, cứu hộ và xe chữa
|
147 |
+
cháy của các lực lượng khác được huy động đi làm nhiệm vụ chữa cháy, xe của lực
|
148 |
+
lượng quân sự đi làm nhiệm vụ khẩn cấp, xe cứu thương đang làm nhiệm vụ cấp cứu
|
149 |
+
có đèn nhấp nháy màu đỏ;
|
150 |
+
|
151 |
+
b) Xe của lực lượng công an, kiểm sát đi làm nhiệm vụ khẩn cấp, xe Cảnh sát giao
|
152 |
+
thông dẫn đường có đèn nhấp nháy màu xanh và đỏ;
|
153 |
+
|
154 |
+
c) Xe hộ đê đi làm nhiệm vụ; xe đi làm nhiệm vụ cứu nạn, cứu hộ, khắc phục sự
|
155 |
+
cố thiên tai, dịch bệnh hoặc xe đi làm nhiệm vụ trong tình trạng khẩn cấp theo
|
156 |
+
quy định của pháp luật có đèn nhấp nháy màu xanh.
|
157 |
+
|
158 |
+
7.3. Xe ưu tiên quy định tại các điểm a, b, c và d khoản 7.1 Điều này không bị
|
159 |
+
hạn chế tốc độ; ��ược phép đi không phụ thuộc vào tín hiệu đèn giao thông, đi vào
|
160 |
+
đường ngược chiều, các đường khác có thể đi được; riêng đối với đường cao tốc,
|
161 |
+
chỉ được đi ngược chiều trên làn dừng xe khẩn cấp; phải tuân theo hiệu lệnh của
|
162 |
+
người điều khiển giao thông, biển báo hiệu tạm thời.
|
163 |
+
|
164 |
+
7.4. Khi có tín hiệu của xe ưu tiên, người và phương tiện tham gia giao thông
|
165 |
+
đường bộ phải giảm tốc độ, đi sát lề đường bên phải hoặc dừng lại để nhường đường,
|
166 |
+
trạm thu phí phải ưu tiên cho xe ưu tiên qua trạm trong mọi tình huống, không
|
167 |
+
được gây cản trở.'
|
168 |
+
- 'a) Để báo nơi cấm đỗ xe trừ các xe được ưu tiên theo quy định, đặt biển số P.131
|
169 |
+
(a,b,c) "Cấm đỗ xe".
|
170 |
+
|
171 |
+
Biển số P.131a có hiệu lực cấm các loại xe cơ giới đỗ ở phía đường có đặt biển.
|
172 |
+
|
173 |
+
Biển số P.131b có hiệu lực cấm các loại xe cơ giới đỗ ở phía đường có đặt biển
|
174 |
+
vào những ngày lẻ và biển số P.131c vào những ngày chẵn.
|
175 |
+
|
176 |
+
b) Hiệu lực cấm và thời gian cấm đỗ xe áp dụng theo quy định tại điểm b, c mục
|
177 |
+
B.30 đối với biển số P.130.
|
178 |
+
|
179 |
+
c) Trong phạm vi có hiệu lực của biển, nếu có chỗ mở dải phân cách cho phép xe
|
180 |
+
quay đầu thì cần đặt thêm biển nhắc lại.
|
181 |
+
|
182 |
+
|
183 |
+
Hình B.31 - Biển số P.131'
|
184 |
+
- 'a) Để báo cấm các loại xe quay đầu (theo kiểu chữ U), đặt biển số P.124a "Cấm
|
185 |
+
quay đầu xe". Chiều mũi tên phù hợp với chiều cấm quay đầu xe.
|
186 |
+
|
187 |
+
b) Để báo cấm xe ô tô quay đầu (theo kiểu chữ U), đặt biển số P.124b "Cấm ô tô
|
188 |
+
quay đầu xe". Chiều mũi tên phù hợp với chiều cấm xe ô tô quay đầu.
|
189 |
+
|
190 |
+
c) Để báo cấm các loại xe rẽ trái đồng thời cấm quay đầu, đặt biển số P.124c “Cấm
|
191 |
+
rẽ trái và quay đầu xe”.
|
192 |
+
|
193 |
+
d) Để báo cấm các loại xe rẽ phải đồng thời cấm quay đầu, đặt biển số P.124d “Cấm
|
194 |
+
rẽ phải và quay đầu xe”.
|
195 |
+
|
196 |
+
e) Để báo cấm xe ô tô rẽ trái và đồng thời cấm quay đầu, đặt biển số P.124e “Cấm
|
197 |
+
ô tô rẽ trái và quay đầu xe”.
|
198 |
+
|
199 |
+
f) Để báo cấm xe ô tô rẽ phải và đồng thời cấm quay đầu, đặt biển số P.124f “Cấm
|
200 |
+
ô tô rẽ phải và quay đầu xe”.
|
201 |
+
|
202 |
+
g) Biển số P.124a có hiệu lực cấm các loại xe (cơ giới và thô sơ) và biển số P.124b
|
203 |
+
có hiệu lực cấm xe ô tô và xe máy 3 bánh (side car) quay đầu (theo kiểu chữ U)
|
204 |
+
trừ các xe được ưu tiên theo quy định.
|
205 |
+
|
206 |
+
Biển không có giá trị cấm rẽ trái để đi sang hướng đường khác.
|
207 |
+
|
208 |
+
h) Nếu đặt biển "Cấm quay đầu xe" hay biển "Cấm ô tô quay đầu xe" ở một đoạn đường
|
209 |
+
không phải là nơi đường giao nhau thì vị trí bắt đầu cấm, dùng biển số S.503d
|
210 |
+
"Hướng tác dụng của biển" đặt bên dưới biển chính.
|
211 |
+
|
212 |
+
|
213 |
+
Hình B.24- Biển số P.124'
|
214 |
+
- source_sentence: Tác dụng của biển hiệu lệnh
|
215 |
+
sentences:
|
216 |
+
- 'Biển số S.505a được đặt bên dưới các biển báo cấm và biển hiệu lệnh hay biển
|
217 |
+
chỉ dẫn để chỉ loại xe chịu hiệu lực của biển báo cấm, biển hiệu lệnh hay biển
|
218 |
+
chỉ dẫn. Tùy theo loại xe chịu hiệu lực mà bố trí hình vẽ cho phù hợp.
|
219 |
+
|
220 |
+
|
221 |
+
Hình F.5 - Biển số S.505a'
|
222 |
+
- '12.1. Quy chuẩn này quy định các thông số về kích thước biển, hình vẽ trong biển
|
223 |
+
và chữ viết tương ứng với đường đô thị có hệ số là 1 (xem Hình 1 và Bảng 1). Trường
|
224 |
+
hợp đặc biệt, kích thước biển có thể được điều chỉnh để đảm bảo cân đối, đáp ứng
|
225 |
+
tính thẩm mỹ và rõ ràng thông tin.
|
226 |
+
|
227 |
+
12.2. Đối với các đường khác, kích thước biển, hình vẽ trong biển và chữ viết
|
228 |
+
phải nhân với hệ số tương ứng trong Bảng 2, kích thước biển được làm tròn theo
|
229 |
+
nguyên tắc:
|
230 |
+
|
231 |
+
a) Số hàng đơn vị ≤ 5 thì lấy bằng 5;
|
232 |
+
|
233 |
+
b) Số hàng đơn vị > 5 thì lấy bằng 0 và tăng số hàng chục lên 1 đơn vị.
|
234 |
+
|
235 |
+
|
236 |
+
Hình 1 - Kích thước các loại biển báo
|
237 |
+
|
238 |
+
Bảng 1 - Kích thước cơ bản của biển báo hệ số 1
|
239 |
+
|
240 |
+
Đơn vị tính: mm
|
241 |
+
|
242 |
+
|
243 |
+
Bảng 2 - Hệ số kích thước biển báo
|
244 |
+
|
245 |
+
|
246 |
+
12.3. Chi tiết thông số về chữ viết, kích thước biển, hình vẽ trong biển được
|
247 |
+
quy định tại các Phụ lục K, M và Phụ lục P của Quy chuẩn này. Đối với biển chỉ
|
248 |
+
dẫn, tùy theo điều kiện thực tế, thông tin chỉ dẫn dài hay ngắn, kích thước biển
|
249 |
+
có thể được điều chỉnh để đảm bảo tính rõ ràng thông tin, cân đối và thẩm mỹ của
|
250 |
+
biển báo.
|
251 |
+
|
252 |
+
12.4. Đối với các đường cấp kỹ thuật thấp (đường cấp V, cấp VI hoặc chưa vào cấp),
|
253 |
+
đường giao thông nông thôn tùy theo quy mô và điều kiện khai thác mà vận dụng
|
254 |
+
các hệ số kích thước là: 1,25; 1,00 hoặc 0,75.
|
255 |
+
|
256 |
+
12.5. Biển di động, biển đặt tạm thời trong thời gian ngắn và các biển sử dụng
|
257 |
+
trong các trường hợp đặc biệt (vị trí biển ở dải phân cách hẹp, lề đường hẹp,
|
258 |
+
hoặc ảnh hưởng tầm nhìn biển đặt trên các ngõ, ngách, hẻm; các hình biển trong
|
259 |
+
biển ghép) có thể điều chỉnh kích thước với hệ số bằng 0,5 hoặc 0,75 (có làm tròn
|
260 |
+
số theo quy định).
|
261 |
+
|
262 |
+
12.6. Đối với các tuyến đường đối ngoại thì biển bằng chữ được điều chỉnh kích
|
263 |
+
thước biển để bố trí đủ chữ viết trên cơ sở quy định của Quy chuẩn này.'
|
264 |
+
- '26.1. Biển báo cấm được đặt ở nơi đường giao nhau hoặc trước một vị trí trên
|
265 |
+
đường cần cấm.
|
266 |
+
|
267 |
+
Biển có hiệu lực bắt đầu từ vị trí đặt biển trở đi. Nếu vì lý do nào đó, biển
|
268 |
+
đặt cách xa vị trí định cấm thì phải đặt biển phụ số S.502 để chỉ rõ khoảng cách
|
269 |
+
từ sau biển cấm đến vị trí biển bắt đầu có hiệu lực.
|
270 |
+
|
271 |
+
26.2. Khi cần thiết để chỉ rõ hướng tác dụng của biển và chỉ vị trí bắt đầu hay
|
272 |
+
vị trí kết thúc hiệu lực của biển phải đặt biển phụ số S.503 “Hướng tác dụng của
|
273 |
+
biển”.
|
274 |
+
|
275 |
+
26.3. Các biển báo cấm từ biển số P.101 đến biển số P.120 không cần quy định phạm
|
276 |
+
vi có hiệu lực của biển, không có biển báo hết cấm.
|
277 |
+
|
278 |
+
26.4. Khi cần thiết, trong trường hợp cấm vì lý do cầu đường bị tắc, hư hỏng thì
|
279 |
+
kèm theo các biển báo cấm nêu tại khoản 26.3 Điều này đặt các biển chỉ dẫn lối
|
280 |
+
đi cho xe bị cấm.
|
281 |
+
|
282 |
+
26.5. Biển số P.121 và biển số P.128 có hiệu lực đến hết khoảng cách cấm ghi trên
|
283 |
+
biển phụ số S.501 hoặc đến vị trí đặt biển số DP.135 “Hết tất cả các lệnh cấm”.
|
284 |
+
|
285 |
+
26.6. Biển số P.123 (a,b) và biển số P.129 có hiệu lực tại khu vực đặt biển.
|
286 |
+
|
287 |
+
26.7. Biển số P.124 (a, b, c, d, e, f) có hiệu lực ở vị trí nơi đường giao nhau,
|
288 |
+
chỗ mở dải phân cách nhưng không cho phép quay đầu xe hoặc căn cứ vào biển phụ
|
289 |
+
số S.503.
|
290 |
+
|
291 |
+
26.8. Biển số P.125, P.126, P.127(a,b,c), P.130, P.131(a,b,c) có hiệu lực đến
|
292 |
+
nơi đường giao nhau tiếp giáp hoặc đến vị trí đặt biển hết cấm (các biển số DP.133,
|
293 |
+
DP.134, DP.135, DP.127d). Các biển số P.130 và P.131(a,b,c) còn căn cứ vào các
|
294 |
+
biển phụ.
|
295 |
+
|
296 |
+
26.9. Nếu đoạn đường phải thi hành biển cấm đi qua các nút giao (trừ giao với
|
297 |
+
các ngõ, ngách, hẻm hoặc lối ra vào cơ quan, đơn vị; hoặc khu đất lân cận mà phương
|
298 |
+
tiện chỉ có thể ra, vào khu đất bằng một lối đi chung), biển cấm phải được nhắc
|
299 |
+
lại đặt phía sau nút giao theo hướng đường đang có biển cấm, trừ các trường hợp
|
300 |
+
có qui định riêng hoặc có biển phụ kèm theo.'
|
301 |
+
- source_sentence: Biển báo giao thông có thông tin thay đổi, biển báo tạm thời
|
302 |
+
sentences:
|
303 |
+
- "13.1. Chữ viết trên biển phù hợp với quy định về kiểu chữ nêu tại Phụ lục K của\
|
304 |
+
\ Quy chuẩn này, trường hợp đặc biệt có thể điều chỉnh cho cân đối, phù hợp và\
|
305 |
+
\ đáp ứng thông tin rõ ràng, trong đó:\n13.1.1. Sử dụng kiểu chữ tiêu chuẩn “gt1\
|
306 |
+
\ - Kiểu chữ nén” và “gt2 - Kiểu chữ thường” để ghi thông tin bằng chữ trên biển.\n\
|
307 |
+
13.1.2. Chữ viết hoa kiểu chữ thường hoặc kiểu chữ nén sử dụng để viết các thông\
|
308 |
+
\ tin chỉ dẫn về hướng đi, các danh từ riêng hoặc các thông tin có tính chất nhấn\
|
309 |
+
\ mạnh, gây chú ý cho người tham gia giao thông. Chỉ nên sử dụng kiểu chữ nén\
|
310 |
+
\ trong trường hợp phải hạn chế kích thước của biển.\n13.1.3. Chữ viết thường\
|
311 |
+
\ thường được sử dụng để viết tên địa danh bằng tiếng Anh, các thông tin dịch\
|
312 |
+
\ vụ và trên các biển phụ.\n13.1.4. Trên cùng một hàng chữ chỉ sử dụng một loại\
|
313 |
+
\ nét chữ.\n13.1.5. Chữ viết trên biển phải là tiếng Việt đủ dấu. Khoảng cách\
|
314 |
+
\ giữa các chữ cái từ 25% - 40% chiều cao chữ, khoảng cách giữa các chữ bất kỳ\
|
315 |
+
\ trên cùng một hàng chữ từ 75% - 100% chiều cao chữ. Khoảng cách theo chiều đứng\
|
316 |
+
\ giữa các hàng chữ tối thiểu 50% - 75% chiều cao chữ lớn nhất của hàng sau. Khoảng\
|
317 |
+
\ cách giữa hàng chữ trên và dưới cùng với mép biển tối thiểu bằng 40% chiều cao\
|
318 |
+
\ chữ cao nhất trong hàng. Khoảng cách theo chiều ngang của các chữ ở góc trên\
|
319 |
+
\ cùng và dưới cùng đến mép biển tối thiểu bằng 60% chiều cao chữ với chữ viết\
|
320 |
+
\ hoa và 100% với chữ viết thường.\n13.1.6. Khoảng cách giữa chữ ghi đơn vị đo\
|
321 |
+
\ lường (t, m, km) và chữ số phía trước lấy bằng 50% chiều cao chữ ghi đơn vị\
|
322 |
+
\ đo lường.\n13.1.7. Chiều cao chữ được lựa chọn căn cứ trên tốc độ xe chạy sao\
|
323 |
+
\ cho người tham gia giao thông có thể đọc được rõ ràng cả ban ngày và ban đêm.\
|
324 |
+
\ Chiều cao chữ tối thiểu trên các biển chỉ dẫn là 100 mm với đường thông thường\
|
325 |
+
\ và đường đô thị; 150 mm với đường đôi ngoài đô thị và 300 mm đối với đường cao\
|
326 |
+
\ tốc. Chữ viết chỉ địa danh và hướng đường có chiều cao tối thiểu là 150 mm.\
|
327 |
+
\ Khuyến khích sử dụng kích thước chữ viết lớn nhưng phải đảm bảo tính cân đối\
|
328 |
+
\ và thẩm mỹ đối với biển báo.\n13.1.8. Chữ viết phải lựa chọn câu, từ ngắn gọn,\
|
329 |
+
\ dễ hiểu nhất; thông tin trên biển phải thống nhất với các thông tin báo hiệu\
|
330 |
+
\ khác.\n13.1.9. Chỉ sử dụng màu của chữ như sau: màu trắng trên nền đen, xanh\
|
331 |
+
\ hoặc đỏ; màu đen trên nền trắng hoặc vàng hoặc màu vàng trên các nền xanh.\n\
|
332 |
+
13.1.10. Chữ viết trên biển chỉ dẫn trên đường cao tốc ngoài việc tuân thủ các\
|
333 |
+
\ quy định trong khoản 13.1 Điều 13 còn tuân thủ khoản 45.3 Điều 45 của Quy chuẩn\
|
334 |
+
\ này.\n13.2. Màu sắc trên biển\nMàu sắc trên biển phải tuân theo quy định tiêu\
|
335 |
+
\ chuẩn kỹ thuật về màu sắc, màu sắc ban ngày, màu sắc ban đêm và thống nhất trong\
|
336 |
+
\ các nhóm biển sử dụng trên mạng lưới đường bộ.\n13.3. Biểu tượng, hình vẽ trên\
|
337 |
+
\ biển\nBiểu tượng, hình vẽ được quy định chi tiết đối với từng biển báo. Riêng\
|
338 |
+
\ hình vẽ thể hiện cho các loại phương tiện được thể hiện theo nguyên tắc: biểu\
|
339 |
+
\ thị ô tô nói chung, xe buýt thì dùng biểu tượng hình chiếu đối diện, đối với\
|
340 |
+
\ từng loại xe thì dùng biểu tượng là hình chiếu cạnh. Căn cứ vào thực tiễn tổ\
|
341 |
+
\ chức giao thông, từ các biển đã có trong Quy chuẩn, khi vận dụng cho các trường\
|
342 |
+
\ hợp khác thì chỉ cần thay thế đối tượng (biểu tượng phương tiện) cũ bằng đối\
|
343 |
+
\ tượng (biểu tượng phương tiện) mới. Đối với xe taxi, sử dụng biểu tượng ô tô\
|
344 |
+
\ có bổ sung chữ “TAXI” phía trên; xe buýt nhanh, sử dụng biểu tượng xe buýt có\
|
345 |
+
\ bổ sung chữ “BRT” phía trên; xe có gắn thiết bị thu phí tự động ETC, sử dụng\
|
346 |
+
\ biểu tượng của xe đó có bổ sung ký hiệu “ETC” phía trên. Đối với các loại xe\
|
347 |
+
\ chưa có biểu tượng quy định thì có thể viết bằng chữ.\n\n Hình 3 - Biểu tượng\
|
348 |
+
\ đối với từng loại phương tiện\nKhi cần biểu thị trọng tải hoặc số chỗ ngồi cho\
|
349 |
+
\ các loại xe tải, xe khách thì bổ sung chữ viết số tấn, số chỗ ngồi (chẳng hạn,\
|
350 |
+
\ xe tải >3,5 tấn thì viết chữ >3,5t lên hình vẽ xe tải, xe khách dưới 16 chỗ\
|
351 |
+
\ thì viết chữ <16c lên hình vẽ xe khách)."
|
352 |
+
- Kích thước, hình dạng và các quy định khác của đèn tín hiệu ở Phụ lục A của Quy
|
353 |
+
chuẩn này.
|
354 |
+
- 'Hình K.5 - Chi tiết chữ viết dạng chữ thường, kiểu chữ nén (gt1)
|
355 |
+
|
356 |
+
|
357 |
+
|
358 |
+
Phụ Lục M
|
359 |
+
|
360 |
+
CHI TIẾT CÁC THÔNG SỐ THIẾT KẾ BIỂN BÁO'
|
361 |
+
- source_sentence: Kích thước, hình dạng và màu sắc của biển báo cấm
|
362 |
+
sentences:
|
363 |
+
- '- Hình dạng: có dạng biển hình chữ nhật gắn trên cột biển báo.
|
364 |
+
|
365 |
+
- Kích thước: tấm hình chữ nhật làm mặt biển có kích thước chiều rộng 350 mm;
|
366 |
+
chiều cao 700 mm, 1000 m hoặc 1300m tùy theo việc bố trí 1, 2 hoặc 3 con số lý
|
367 |
+
trình thể hiện trên biển theo chiều đứng.
|
368 |
+
|
369 |
+
- Biển có nền màu xanh lá cây, viền màu trắng với đường cao tốc. Chi tiết xem
|
370 |
+
Hình I.3.
|
371 |
+
|
372 |
+
- Biển có nền màu xanh lam, viền màu trắng với các đường ôtô khác.
|
373 |
+
|
374 |
+
|
375 |
+
Ghi chú: Kích thước ghi trên hình vẽ là cm
|
376 |
+
|
377 |
+
Hình I.1 - Cột kilômét dạng cột thấp
|
378 |
+
|
379 |
+
|
380 |
+
Ghi chú: Kích thước ghi trên hình vẽ là mm
|
381 |
+
|
382 |
+
Hình I.2 - Cột kilômét dạng cột cao
|
383 |
+
|
384 |
+
|
385 |
+
Ghi chú: Nền màu xanh lá cây áp dụng cho đường ô tô cao tốc, nền màu xanh lam
|
386 |
+
áp dụng cho các đường ô tô khác
|
387 |
+
|
388 |
+
Hình I.3 - Biển báo hiệu cột kilômét dạng tấm hình chữ nhật đặt ở lề đường
|
389 |
+
|
390 |
+
Bảng các giá trị kích thước trên Hình I.3
|
391 |
+
|
392 |
+
Đơn vị: mm
|
393 |
+
|
394 |
+
|
395 |
+
|
396 |
+
|
397 |
+
|
398 |
+
Hình I.4 - Cọc mốc lộ giới
|
399 |
+
|
400 |
+
|
401 |
+
Hình I.5 - Mặt bằng bố trí mốc lộ giới
|
402 |
+
|
403 |
+
|
404 |
+
|
405 |
+
|
406 |
+
a) Cọc H dạng cột
|
407 |
+
|
408 |
+
|
409 |
+
b) Cọc H dạng tấm
|
410 |
+
|
411 |
+
Hình I.6 - Chi tiết cọc H'
|
412 |
+
- Hình K.2 - Chi tiết chữ viết và con số dạng chữ in hoa, kiểu chữ thường (gt2)
|
413 |
+
- '- Hình dạng: có dạng biển hình chữ nhật gắn trên cột biển báo.
|
414 |
+
|
415 |
+
- Kích thước: tấm hình chữ nhật làm mặt biển có kích thước chiều rộng 350 mm;
|
416 |
+
chiều cao 700 mm, 1000 m hoặc 1300m tùy theo việc bố trí 1, 2 hoặc 3 con số lý
|
417 |
+
trình thể hiện trên biển theo chiều đứng.
|
418 |
+
|
419 |
+
- Biển có nền màu xanh lá cây, viền màu trắng với đường cao tốc. Chi tiết xem
|
420 |
+
Hình I.3.
|
421 |
+
|
422 |
+
- Biển có nền màu xanh lam, viền màu trắng với các đường ôtô khác.
|
423 |
+
|
424 |
+
|
425 |
+
Ghi chú: Kích thước ghi trên hình vẽ là cm
|
426 |
+
|
427 |
+
Hình I.1 - Cột kilômét dạng cột thấp
|
428 |
+
|
429 |
+
|
430 |
+
Ghi chú: Kích thước ghi trên hình vẽ là mm
|
431 |
+
|
432 |
+
Hình I.2 - Cột kilômét dạng cột cao
|
433 |
+
|
434 |
+
|
435 |
+
Ghi chú: Nền màu xanh lá cây áp dụng cho đường ô tô cao tốc, nền màu xanh lam
|
436 |
+
áp dụng cho các đường ô tô khác
|
437 |
+
|
438 |
+
Hình I.3 - Biển báo hiệu cột kilômét dạng tấm hình chữ nhật đặt ở lề đường
|
439 |
+
|
440 |
+
Bảng các giá trị kích thước trên Hình I.3
|
441 |
+
|
442 |
+
Đơn vị: mm
|
443 |
+
|
444 |
+
|
445 |
+
|
446 |
+
|
447 |
+
|
448 |
+
Hình I.4 - Cọc mốc lộ giới
|
449 |
+
|
450 |
+
|
451 |
+
Hình I.5 - Mặt bằng bố trí mốc lộ giới
|
452 |
+
|
453 |
+
|
454 |
+
|
455 |
+
|
456 |
+
a) Cọc H dạng cột
|
457 |
+
|
458 |
+
|
459 |
+
b) Cọc H dạng tấm
|
460 |
+
|
461 |
+
Hình I.6 - Chi tiết cọc H'
|
462 |
+
pipeline_tag: sentence-similarity
|
463 |
+
library_name: sentence-transformers
|
464 |
+
---
|
465 |
+
|
466 |
+
# SentenceTransformer based on AITeamVN/Vietnamese_Embedding_v2
|
467 |
+
|
468 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [AITeamVN/Vietnamese_Embedding_v2](https://huggingface.co/AITeamVN/Vietnamese_Embedding_v2). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
469 |
+
|
470 |
+
## Model Details
|
471 |
+
|
472 |
+
### Model Description
|
473 |
+
- **Model Type:** Sentence Transformer
|
474 |
+
- **Base model:** [AITeamVN/Vietnamese_Embedding_v2](https://huggingface.co/AITeamVN/Vietnamese_Embedding_v2) <!-- at revision 18b44161e041bf1d3a333ab5144b5b7b93f914d2 -->
|
475 |
+
- **Maximum Sequence Length:** 2048 tokens
|
476 |
+
- **Output Dimensionality:** 1024 dimensions
|
477 |
+
- **Similarity Function:** Cosine Similarity
|
478 |
+
<!-- - **Training Dataset:** Unknown -->
|
479 |
+
<!-- - **Language:** Unknown -->
|
480 |
+
<!-- - **License:** Unknown -->
|
481 |
+
|
482 |
+
### Model Sources
|
483 |
+
|
484 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
485 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
486 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
487 |
+
|
488 |
+
### Full Model Architecture
|
489 |
+
|
490 |
+
```
|
491 |
+
SentenceTransformer(
|
492 |
+
(0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
|
493 |
+
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
494 |
+
)
|
495 |
+
```
|
496 |
+
|
497 |
+
## Usage
|
498 |
+
|
499 |
+
### Direct Usage (Sentence Transformers)
|
500 |
+
|
501 |
+
First install the Sentence Transformers library:
|
502 |
+
|
503 |
+
```bash
|
504 |
+
pip install -U sentence-transformers
|
505 |
+
```
|
506 |
+
|
507 |
+
Then you can load this model and run inference.
|
508 |
+
```python
|
509 |
+
from sentence_transformers import SentenceTransformer
|
510 |
+
|
511 |
+
# Download from the 🤗 Hub
|
512 |
+
model = SentenceTransformer("phonghoccode/VSLP2025_Embedding_bm25_v1")
|
513 |
+
# Run inference
|
514 |
+
sentences = [
|
515 |
+
'Kích thước, hình dạng và màu sắc của biển báo cấm',
|
516 |
+
'- Hình dạng: có dạng biển hình chữ nhật gắn trên cột biển báo.\n- Kích thước: tấm hình chữ nhật làm mặt biển có kích thước chiều rộng 350 mm; chiều cao 700 mm, 1000 m hoặc 1300m tùy theo việc bố trí 1, 2 hoặc 3 con số lý trình thể hiện trên biển theo chiều đứng.\n- Biển có nền màu xanh lá cây, viền màu trắng với đường cao tốc. Chi tiết xem Hình I.3.\n- Biển có nền màu xanh lam, viền màu trắng với các đường ôtô khác.\n\nGhi chú: Kích thước ghi trên hình vẽ là cm\nHình I.1 - Cột kilômét dạng cột thấp\n\nGhi chú: Kích thước ghi trên hình vẽ là mm\nHình I.2 - Cột kilômét dạng cột cao\n\nGhi chú: Nền màu xanh lá cây áp dụng cho đường ô tô cao tốc, nền màu xanh lam áp dụng cho các đường ô tô khác\nHình I.3 - Biển báo hiệu cột kilômét dạng tấm hình chữ nhật đặt ở lề đường\nBảng các giá trị kích thước trên Hình I.3\nĐơn vị: mm\n\n\xa0\n\nHình I.4 - Cọc mốc lộ giới\n\nHình I.5 - Mặt bằng bố trí mốc lộ giới\n\xa0\n\na) Cọc H dạng cột\n\nb) Cọc H dạng tấm\nHình I.6 - Chi tiết cọc H',
|
517 |
+
'- Hình dạng: có dạng biển hình chữ nhật gắn trên cột biển báo.\n- Kích thước: tấm hình chữ nhật làm mặt biển có kích thước chiều rộng 350 mm; chiều cao 700 mm, 1000 m hoặc 1300m tùy theo việc bố trí 1, 2 hoặc 3 con số lý trình thể hiện trên biển theo chiều đứng.\n- Biển có nền màu xanh lá cây, viền màu trắng với đường cao tốc. Chi tiết xem Hình I.3.\n- Biển có nền màu xanh lam, viền màu trắng với các đường ôtô khác.\n\nGhi chú: Kích thước ghi trên hình vẽ là cm\nHình I.1 - Cột kilômét dạng cột thấp\n\nGhi chú: Kích thước ghi trên hình vẽ là mm\nHình I.2 - Cột kilômét dạng cột cao\n\nGhi chú: Nền màu xanh lá cây áp dụng cho đường ô tô cao tốc, nền màu xanh lam áp dụng cho các đường ô tô khác\nHình I.3 - Biển báo hiệu cột kilômét dạng tấm hình chữ nhật đặt ở lề đường\nBảng các giá trị kích thước trên Hình I.3\nĐơn vị: mm\n\n\xa0\n\nHình I.4 - Cọc mốc lộ giới\n\nHình I.5 - Mặt bằng bố trí mốc lộ giới\n\xa0\n\na) Cọc H dạng cột\n\nb) Cọc H dạng tấm\nHình I.6 - Chi tiết cọc H',
|
518 |
+
]
|
519 |
+
embeddings = model.encode(sentences)
|
520 |
+
print(embeddings.shape)
|
521 |
+
# [3, 1024]
|
522 |
+
|
523 |
+
# Get the similarity scores for the embeddings
|
524 |
+
similarities = model.similarity(embeddings, embeddings)
|
525 |
+
print(similarities.shape)
|
526 |
+
# [3, 3]
|
527 |
+
```
|
528 |
+
|
529 |
+
<!--
|
530 |
+
### Direct Usage (Transformers)
|
531 |
+
|
532 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
533 |
+
|
534 |
+
</details>
|
535 |
+
-->
|
536 |
+
|
537 |
+
<!--
|
538 |
+
### Downstream Usage (Sentence Transformers)
|
539 |
+
|
540 |
+
You can finetune this model on your own dataset.
|
541 |
+
|
542 |
+
<details><summary>Click to expand</summary>
|
543 |
+
|
544 |
+
</details>
|
545 |
+
-->
|
546 |
+
|
547 |
+
<!--
|
548 |
+
### Out-of-Scope Use
|
549 |
+
|
550 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
551 |
+
-->
|
552 |
+
|
553 |
+
<!--
|
554 |
+
## Bias, Risks and Limitations
|
555 |
+
|
556 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
557 |
+
-->
|
558 |
+
|
559 |
+
<!--
|
560 |
+
### Recommendations
|
561 |
+
|
562 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
563 |
+
-->
|
564 |
+
|
565 |
+
## Training Details
|
566 |
+
|
567 |
+
### Training Dataset
|
568 |
+
|
569 |
+
#### Unnamed Dataset
|
570 |
+
|
571 |
+
* Size: 8,337 training samples
|
572 |
+
* Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>label</code>
|
573 |
+
* Approximate statistics based on the first 1000 samples:
|
574 |
+
| | sentence1 | sentence2 | label |
|
575 |
+
|:--------|:----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:-----------------------------------------------|
|
576 |
+
| type | string | string | int |
|
577 |
+
| details | <ul><li>min: 4 tokens</li><li>mean: 11.61 tokens</li><li>max: 22 tokens</li></ul> | <ul><li>min: 23 tokens</li><li>mean: 430.65 tokens</li><li>max: 2048 tokens</li></ul> | <ul><li>0: ~95.20%</li><li>1: ~4.80%</li></ul> |
|
578 |
+
* Samples:
|
579 |
+
| sentence1 | sentence2 | label |
|
580 |
+
|:--------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
|
581 |
+
| <code>Phạm vi điều chỉnh</code> | <code>Quy chuẩn này quy định về báo hiệu đường bộ bao gồm: đèn tín hiệu giao thông; biển báo hiệu đường bộ; vạch kẻ đường và các dấu hiệu khác trên mặt đường; cọc tiêu, tường bảo vệ, rào chắn, đinh phản quang, tiêu phản quang, cột Km, cọc H; thiết bị âm thanh báo hiệu đường bộ.<br>Quy chuẩn này quy định về báo hiệu đường bộ áp dụng cho tất cả các tuyến đường bộ trong mạng lưới đường bộ Việt Nam, các đường nằm trong hệ thống đường bộ tham gia Điều ước quốc tế mà Việt Nam là thành viên (Hiệp định GMS-CBTA, các thỏa thuận trong ASEAN và các thỏa thuận quốc tế khác) - sau đây gọi là các tuyến đường đối ngoại.</code> | <code>1</code> |
|
582 |
+
| <code>Phạm vi điều chỉnh</code> | <code>a) Để báo trước gần tới đoạn đường thường có gió ngang thổi mạnh gây nguy hiểm, đặt biển số W.232 "Gió ngang". Người tham gia giao thông cần phải điều chỉnh tốc độ xe chạy cho thích hợp, đề phòng gió thổi mạnh gây lật xe.<br>b) Biển này chỉ đặt ngoài phạm vi thành phố, khu đông dân cư. Tại vị trí nguy hiểm nên đặt thiết bị đo gió để những người tham gia giao thông biết được hướng và cường độ gió.<br><br>Hình C.34 - Biển số W.232</code> | <code>0</code> |
|
583 |
+
| <code>Phạm vi điều chỉnh</code> | <code>12.1. Quy chuẩn này quy định các thông số về kích thước biển, hình vẽ trong biển và chữ viết tương ứng với đường đô thị có hệ số là 1 (xem Hình 1 và Bảng 1). Trường hợp đặc biệt, kích thước biển có thể được điều chỉnh để đảm bảo cân đối, đáp ứng tính thẩm mỹ và rõ ràng thông tin.<br>12.2. Đối với các đường khác, kích thước biển, hình vẽ trong biển và chữ viết phải nhân với hệ số tương ứng trong Bảng 2, kích thước biển được làm tròn theo nguyên tắc:<br>a) Số hàng đơn vị ≤ 5 thì lấy bằng 5;<br>b) Số hàng đơn vị > 5 thì lấy bằng 0 và tăng số hàng chục lên 1 đơn vị.<br><br>Hình 1 - Kích thước các loại biển báo<br>Bảng 1 - Kích thước cơ bản của biển báo hệ số 1<br>Đơn vị tính: mm<br><br>Bảng 2 - Hệ số kích thước biển báo<br><br>12.3. Chi tiết thông số về chữ viết, kích thước biển, hình vẽ trong bi���n được quy định tại các Phụ lục K, M và Phụ lục P của Quy chuẩn này. Đối với biển chỉ dẫn, tùy theo điều kiện thực tế, thông tin chỉ dẫn dài hay ngắn, kích thước biển có thể được điều chỉnh để đảm bảo tính rõ ràng thông tin, cân ...</code> | <code>0</code> |
|
584 |
+
* Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
|
585 |
+
```json
|
586 |
+
{
|
587 |
+
"distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
|
588 |
+
"margin": 0.5,
|
589 |
+
"size_average": true
|
590 |
+
}
|
591 |
+
```
|
592 |
+
|
593 |
+
### Training Hyperparameters
|
594 |
+
#### Non-Default Hyperparameters
|
595 |
+
|
596 |
+
- `per_device_train_batch_size`: 6
|
597 |
+
- `per_device_eval_batch_size`: 12
|
598 |
+
- `gradient_accumulation_steps`: 4
|
599 |
+
- `learning_rate`: 2e-05
|
600 |
+
- `warmup_ratio`: 0.1
|
601 |
+
- `fp16`: True
|
602 |
+
- `push_to_hub`: True
|
603 |
+
- `hub_model_id`: phonghoccode/VSLP2025_Embedding_bm25_v1
|
604 |
+
- `gradient_checkpointing`: True
|
605 |
+
|
606 |
+
#### All Hyperparameters
|
607 |
+
<details><summary>Click to expand</summary>
|
608 |
+
|
609 |
+
- `overwrite_output_dir`: False
|
610 |
+
- `do_predict`: False
|
611 |
+
- `eval_strategy`: no
|
612 |
+
- `prediction_loss_only`: True
|
613 |
+
- `per_device_train_batch_size`: 6
|
614 |
+
- `per_device_eval_batch_size`: 12
|
615 |
+
- `per_gpu_train_batch_size`: None
|
616 |
+
- `per_gpu_eval_batch_size`: None
|
617 |
+
- `gradient_accumulation_steps`: 4
|
618 |
+
- `eval_accumulation_steps`: None
|
619 |
+
- `torch_empty_cache_steps`: None
|
620 |
+
- `learning_rate`: 2e-05
|
621 |
+
- `weight_decay`: 0.0
|
622 |
+
- `adam_beta1`: 0.9
|
623 |
+
- `adam_beta2`: 0.999
|
624 |
+
- `adam_epsilon`: 1e-08
|
625 |
+
- `max_grad_norm`: 1.0
|
626 |
+
- `num_train_epochs`: 3
|
627 |
+
- `max_steps`: -1
|
628 |
+
- `lr_scheduler_type`: linear
|
629 |
+
- `lr_scheduler_kwargs`: {}
|
630 |
+
- `warmup_ratio`: 0.1
|
631 |
+
- `warmup_steps`: 0
|
632 |
+
- `log_level`: passive
|
633 |
+
- `log_level_replica`: warning
|
634 |
+
- `log_on_each_node`: True
|
635 |
+
- `logging_nan_inf_filter`: True
|
636 |
+
- `save_safetensors`: True
|
637 |
+
- `save_on_each_node`: False
|
638 |
+
- `save_only_model`: False
|
639 |
+
- `restore_callback_states_from_checkpoint`: False
|
640 |
+
- `no_cuda`: False
|
641 |
+
- `use_cpu`: False
|
642 |
+
- `use_mps_device`: False
|
643 |
+
- `seed`: 42
|
644 |
+
- `data_seed`: None
|
645 |
+
- `jit_mode_eval`: False
|
646 |
+
- `use_ipex`: False
|
647 |
+
- `bf16`: False
|
648 |
+
- `fp16`: True
|
649 |
+
- `fp16_opt_level`: O1
|
650 |
+
- `half_precision_backend`: auto
|
651 |
+
- `bf16_full_eval`: False
|
652 |
+
- `fp16_full_eval`: False
|
653 |
+
- `tf32`: None
|
654 |
+
- `local_rank`: 0
|
655 |
+
- `ddp_backend`: None
|
656 |
+
- `tpu_num_cores`: None
|
657 |
+
- `tpu_metrics_debug`: False
|
658 |
+
- `debug`: []
|
659 |
+
- `dataloader_drop_last`: False
|
660 |
+
- `dataloader_num_workers`: 0
|
661 |
+
- `dataloader_prefetch_factor`: None
|
662 |
+
- `past_index`: -1
|
663 |
+
- `disable_tqdm`: False
|
664 |
+
- `remove_unused_columns`: True
|
665 |
+
- `label_names`: None
|
666 |
+
- `load_best_model_at_end`: False
|
667 |
+
- `ignore_data_skip`: False
|
668 |
+
- `fsdp`: []
|
669 |
+
- `fsdp_min_num_params`: 0
|
670 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
671 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
672 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
673 |
+
- `deepspeed`: None
|
674 |
+
- `label_smoothing_factor`: 0.0
|
675 |
+
- `optim`: adamw_torch
|
676 |
+
- `optim_args`: None
|
677 |
+
- `adafactor`: False
|
678 |
+
- `group_by_length`: False
|
679 |
+
- `length_column_name`: length
|
680 |
+
- `ddp_find_unused_parameters`: None
|
681 |
+
- `ddp_bucket_cap_mb`: None
|
682 |
+
- `ddp_broadcast_buffers`: False
|
683 |
+
- `dataloader_pin_memory`: True
|
684 |
+
- `dataloader_persistent_workers`: False
|
685 |
+
- `skip_memory_metrics`: True
|
686 |
+
- `use_legacy_prediction_loop`: False
|
687 |
+
- `push_to_hub`: True
|
688 |
+
- `resume_from_checkpoint`: None
|
689 |
+
- `hub_model_id`: phonghoccode/VSLP2025_Embedding_bm25_v1
|
690 |
+
- `hub_strategy`: every_save
|
691 |
+
- `hub_private_repo`: None
|
692 |
+
- `hub_always_push`: False
|
693 |
+
- `gradient_checkpointing`: True
|
694 |
+
- `gradient_checkpointing_kwargs`: None
|
695 |
+
- `include_inputs_for_metrics`: False
|
696 |
+
- `include_for_metrics`: []
|
697 |
+
- `eval_do_concat_batches`: True
|
698 |
+
- `fp16_backend`: auto
|
699 |
+
- `push_to_hub_model_id`: None
|
700 |
+
- `push_to_hub_organization`: None
|
701 |
+
- `mp_parameters`:
|
702 |
+
- `auto_find_batch_size`: False
|
703 |
+
- `full_determinism`: False
|
704 |
+
- `torchdynamo`: None
|
705 |
+
- `ray_scope`: last
|
706 |
+
- `ddp_timeout`: 1800
|
707 |
+
- `torch_compile`: False
|
708 |
+
- `torch_compile_backend`: None
|
709 |
+
- `torch_compile_mode`: None
|
710 |
+
- `include_tokens_per_second`: False
|
711 |
+
- `include_num_input_tokens_seen`: False
|
712 |
+
- `neftune_noise_alpha`: None
|
713 |
+
- `optim_target_modules`: None
|
714 |
+
- `batch_eval_metrics`: False
|
715 |
+
- `eval_on_start`: False
|
716 |
+
- `use_liger_kernel`: False
|
717 |
+
- `eval_use_gather_object`: False
|
718 |
+
- `average_tokens_across_devices`: False
|
719 |
+
- `prompts`: None
|
720 |
+
- `batch_sampler`: batch_sampler
|
721 |
+
- `multi_dataset_batch_sampler`: proportional
|
722 |
+
|
723 |
+
</details>
|
724 |
+
|
725 |
+
### Training Logs
|
726 |
+
| Epoch | Step | Training Loss |
|
727 |
+
|:------:|:----:|:-------------:|
|
728 |
+
| 0.2878 | 100 | 0.0272 |
|
729 |
+
| 0.5755 | 200 | 0.0134 |
|
730 |
+
| 0.8633 | 300 | 0.0107 |
|
731 |
+
| 1.1496 | 400 | 0.0064 |
|
732 |
+
| 1.4374 | 500 | 0.0071 |
|
733 |
+
| 1.7252 | 600 | 0.0053 |
|
734 |
+
| 2.0115 | 700 | 0.0064 |
|
735 |
+
| 2.2993 | 800 | 0.0032 |
|
736 |
+
| 2.5871 | 900 | 0.0031 |
|
737 |
+
| 2.8748 | 1000 | 0.0038 |
|
738 |
+
|
739 |
+
|
740 |
+
### Framework Versions
|
741 |
+
- Python: 3.11.13
|
742 |
+
- Sentence Transformers: 4.1.0
|
743 |
+
- Transformers: 4.52.4
|
744 |
+
- PyTorch: 2.6.0+cu124
|
745 |
+
- Accelerate: 1.8.1
|
746 |
+
- Datasets: 2.19.2
|
747 |
+
- Tokenizers: 0.21.2
|
748 |
+
|
749 |
+
## Citation
|
750 |
+
|
751 |
+
### BibTeX
|
752 |
+
|
753 |
+
#### Sentence Transformers
|
754 |
+
```bibtex
|
755 |
+
@inproceedings{reimers-2019-sentence-bert,
|
756 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
757 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
758 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
759 |
+
month = "11",
|
760 |
+
year = "2019",
|
761 |
+
publisher = "Association for Computational Linguistics",
|
762 |
+
url = "https://arxiv.org/abs/1908.10084",
|
763 |
+
}
|
764 |
+
```
|
765 |
+
|
766 |
+
#### ContrastiveLoss
|
767 |
+
```bibtex
|
768 |
+
@inproceedings{hadsell2006dimensionality,
|
769 |
+
author={Hadsell, R. and Chopra, S. and LeCun, Y.},
|
770 |
+
booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
|
771 |
+
title={Dimensionality Reduction by Learning an Invariant Mapping},
|
772 |
+
year={2006},
|
773 |
+
volume={2},
|
774 |
+
number={},
|
775 |
+
pages={1735-1742},
|
776 |
+
doi={10.1109/CVPR.2006.100}
|
777 |
+
}
|
778 |
+
```
|
779 |
+
|
780 |
+
<!--
|
781 |
+
## Glossary
|
782 |
+
|
783 |
+
*Clearly define terms in order to be accessible across audiences.*
|
784 |
+
-->
|
785 |
+
|
786 |
+
<!--
|
787 |
+
## Model Card Authors
|
788 |
+
|
789 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
790 |
+
-->
|
791 |
+
|
792 |
+
<!--
|
793 |
+
## Model Card Contact
|
794 |
+
|
795 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
796 |
+
-->
|
config.json
ADDED
@@ -0,0 +1,27 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"architectures": [
|
3 |
+
"XLMRobertaModel"
|
4 |
+
],
|
5 |
+
"attention_probs_dropout_prob": 0.1,
|
6 |
+
"bos_token_id": 0,
|
7 |
+
"classifier_dropout": null,
|
8 |
+
"eos_token_id": 2,
|
9 |
+
"hidden_act": "gelu",
|
10 |
+
"hidden_dropout_prob": 0.1,
|
11 |
+
"hidden_size": 1024,
|
12 |
+
"initializer_range": 0.02,
|
13 |
+
"intermediate_size": 4096,
|
14 |
+
"layer_norm_eps": 1e-05,
|
15 |
+
"max_position_embeddings": 8194,
|
16 |
+
"model_type": "xlm-roberta",
|
17 |
+
"num_attention_heads": 16,
|
18 |
+
"num_hidden_layers": 24,
|
19 |
+
"output_past": true,
|
20 |
+
"pad_token_id": 1,
|
21 |
+
"position_embedding_type": "absolute",
|
22 |
+
"torch_dtype": "float32",
|
23 |
+
"transformers_version": "4.52.4",
|
24 |
+
"type_vocab_size": 1,
|
25 |
+
"use_cache": true,
|
26 |
+
"vocab_size": 250002
|
27 |
+
}
|
config_sentence_transformers.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"__version__": {
|
3 |
+
"sentence_transformers": "4.1.0",
|
4 |
+
"transformers": "4.52.4",
|
5 |
+
"pytorch": "2.6.0+cu124"
|
6 |
+
},
|
7 |
+
"prompts": {},
|
8 |
+
"default_prompt_name": null,
|
9 |
+
"similarity_fn_name": "cosine"
|
10 |
+
}
|
model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:fe2080560d2ad0b290c3f113e704daabdc54fb9bec6be71474099e0cbdbb4715
|
3 |
+
size 2271064456
|
modules.json
ADDED
@@ -0,0 +1,14 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"idx": 0,
|
4 |
+
"name": "0",
|
5 |
+
"path": "",
|
6 |
+
"type": "sentence_transformers.models.Transformer"
|
7 |
+
},
|
8 |
+
{
|
9 |
+
"idx": 1,
|
10 |
+
"name": "1",
|
11 |
+
"path": "1_Pooling",
|
12 |
+
"type": "sentence_transformers.models.Pooling"
|
13 |
+
}
|
14 |
+
]
|
runs/Aug16_17-46-16_04f91239a58d/events.out.tfevents.1755366379.04f91239a58d.260.0
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:6355b9970c676fdfe7d33720f76fa131168d472a56f3632d9a870519fdc3a7a6
|
3 |
+
size 4992
|
runs/Aug16_18-42-28_04f91239a58d/events.out.tfevents.1755369751.04f91239a58d.330.0
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:12a5c287ab06442c9734b2fc8a8668525e57e9b794af3a4dffc0d285351685da
|
3 |
+
size 6829
|
runs/Aug16_23-05-27_04f91239a58d/events.out.tfevents.1755385529.04f91239a58d.410.0
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:251134cb62263c2802846d8ae0622bc0f5a01d8f15b898f977aa4ccbde26005c
|
3 |
+
size 6479
|
sentence_bert_config.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"max_seq_length": 2048,
|
3 |
+
"do_lower_case": false
|
4 |
+
}
|
sentencepiece.bpe.model
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
|
3 |
+
size 5069051
|
special_tokens_map.json
ADDED
@@ -0,0 +1,51 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"bos_token": {
|
3 |
+
"content": "<s>",
|
4 |
+
"lstrip": false,
|
5 |
+
"normalized": false,
|
6 |
+
"rstrip": false,
|
7 |
+
"single_word": false
|
8 |
+
},
|
9 |
+
"cls_token": {
|
10 |
+
"content": "<s>",
|
11 |
+
"lstrip": false,
|
12 |
+
"normalized": false,
|
13 |
+
"rstrip": false,
|
14 |
+
"single_word": false
|
15 |
+
},
|
16 |
+
"eos_token": {
|
17 |
+
"content": "</s>",
|
18 |
+
"lstrip": false,
|
19 |
+
"normalized": false,
|
20 |
+
"rstrip": false,
|
21 |
+
"single_word": false
|
22 |
+
},
|
23 |
+
"mask_token": {
|
24 |
+
"content": "<mask>",
|
25 |
+
"lstrip": true,
|
26 |
+
"normalized": false,
|
27 |
+
"rstrip": false,
|
28 |
+
"single_word": false
|
29 |
+
},
|
30 |
+
"pad_token": {
|
31 |
+
"content": "<pad>",
|
32 |
+
"lstrip": false,
|
33 |
+
"normalized": false,
|
34 |
+
"rstrip": false,
|
35 |
+
"single_word": false
|
36 |
+
},
|
37 |
+
"sep_token": {
|
38 |
+
"content": "</s>",
|
39 |
+
"lstrip": false,
|
40 |
+
"normalized": false,
|
41 |
+
"rstrip": false,
|
42 |
+
"single_word": false
|
43 |
+
},
|
44 |
+
"unk_token": {
|
45 |
+
"content": "<unk>",
|
46 |
+
"lstrip": false,
|
47 |
+
"normalized": false,
|
48 |
+
"rstrip": false,
|
49 |
+
"single_word": false
|
50 |
+
}
|
51 |
+
}
|
tokenizer.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:f346050eed4b822e076c8958539a82bd05b7828c9110f81e7ed7a6d1b853710b
|
3 |
+
size 17083154
|
tokenizer_config.json
ADDED
@@ -0,0 +1,56 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"added_tokens_decoder": {
|
3 |
+
"0": {
|
4 |
+
"content": "<s>",
|
5 |
+
"lstrip": false,
|
6 |
+
"normalized": false,
|
7 |
+
"rstrip": false,
|
8 |
+
"single_word": false,
|
9 |
+
"special": true
|
10 |
+
},
|
11 |
+
"1": {
|
12 |
+
"content": "<pad>",
|
13 |
+
"lstrip": false,
|
14 |
+
"normalized": false,
|
15 |
+
"rstrip": false,
|
16 |
+
"single_word": false,
|
17 |
+
"special": true
|
18 |
+
},
|
19 |
+
"2": {
|
20 |
+
"content": "</s>",
|
21 |
+
"lstrip": false,
|
22 |
+
"normalized": false,
|
23 |
+
"rstrip": false,
|
24 |
+
"single_word": false,
|
25 |
+
"special": true
|
26 |
+
},
|
27 |
+
"3": {
|
28 |
+
"content": "<unk>",
|
29 |
+
"lstrip": false,
|
30 |
+
"normalized": false,
|
31 |
+
"rstrip": false,
|
32 |
+
"single_word": false,
|
33 |
+
"special": true
|
34 |
+
},
|
35 |
+
"250001": {
|
36 |
+
"content": "<mask>",
|
37 |
+
"lstrip": true,
|
38 |
+
"normalized": false,
|
39 |
+
"rstrip": false,
|
40 |
+
"single_word": false,
|
41 |
+
"special": true
|
42 |
+
}
|
43 |
+
},
|
44 |
+
"bos_token": "<s>",
|
45 |
+
"clean_up_tokenization_spaces": true,
|
46 |
+
"cls_token": "<s>",
|
47 |
+
"eos_token": "</s>",
|
48 |
+
"extra_special_tokens": {},
|
49 |
+
"mask_token": "<mask>",
|
50 |
+
"model_max_length": 2048,
|
51 |
+
"pad_token": "<pad>",
|
52 |
+
"sep_token": "</s>",
|
53 |
+
"sp_model_kwargs": {},
|
54 |
+
"tokenizer_class": "XLMRobertaTokenizer",
|
55 |
+
"unk_token": "<unk>"
|
56 |
+
}
|
training_args.bin
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:d5d67814913f3ad04ab385bf38aa1e6a0d5eaa7a30b90427cc23a36ffe7df5e8
|
3 |
+
size 5624
|