GbrlOl commited on
Commit
d8e6369
·
verified ·
1 Parent(s): af1d766

Add new SentenceTransformer model

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,633 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:527
8
+ - loss:MultipleNegativesRankingLoss
9
+ base_model: sentence-transformers/all-MiniLM-L6-v2
10
+ widget:
11
+ - source_sentence: ¿Cuál es la longitud del Canal de Derivación Superior?
12
+ sentences:
13
+ - "Esto podría incluir material afectado por Steam Heated \no suelos asociados a\
14
+ \ depósitos cuaternarios. Para evitar problemas de inestabilidad, estos \nmateriales\
15
+ \ de baja calidad no deben ser depositados : ni al pie del botadero Sur; ni al\
16
+ \ fondo de la \ncuenca en donde se emplazará el botadero Sur (donde hay mayor\
17
+ \ espesor de materiales aluviales \ny piroclásticos); ni bajo el área donde estará\
18
+ \ emplazado el depósito de relaves filtrados."
19
+ - "26 \n \n \n85/11382/13328 Proyecto de Cierre Tranque de Relave N°4 Planta\
20
+ \ Cabildo, Región de Valparaíso \nPlan de Cierre \n7.2.9 Habilitación de Evacuador\
21
+ \ de Emergencia. \nDescrito ampliamente en el ítem 7.2.4.1. \n7.2.10 Cercado\
22
+ \ de las Torres Colectoras. \nPara la operación del Tranque de Relave N°4, se\
23
+ \ consideraron 6 cámaras colectoras de agua clara, unidas \npor tuberías HDPE.\
24
+ \ Se prevé sellar completamente las cámaras, a través de rellenos realizados con\
25
+ \ grava, \ncon arena y con relave. Posteriormente a dicho sello se demuele la\
26
+ \ porción que sobresale de las lamas \nevitándose los promontorios. \nPara que\
27
+ \ los rellenos queden estables y se elimine toda posibilidad de que haya migración\
28
+ \ de lamas o de \nlos rellenos, a través de la tubería, el sello de la cámara\
29
+ \ se realizará con los siguientes materiales y \nsecuencia constructiva: \n\x7F\
30
+ \ Se coloca una primera capa, de a lo menos un metro de altura, sobre el fondo\
31
+ \ de la cámara, con \nsobretamaño, superior a 6\". \n\x7F Inmediatamente después\
32
+ \ se realiza un relleno de grava arenosa con contenido de grava superior al \n\
33
+ 50% y arena superior al 30%. Dicha capa debe presentar a lo menos una altura de\
34
+ \ un metro. \n\x7F Posteriormente, sobre la grava, se realiza un relleno con arena\
35
+ \ de relaves (proveniente del muro), \ntambién con una dimensión mínima de un\
36
+ \ metro. \n\x7F Finalmente se realiza un relleno con lamas (secas o con baja humedad)\
37
+ \ hasta el nivel de lamas \nexistentes en la cubeta. \n\x7F Todos los rellenos\
38
+ \ se colocan sin compactar."
39
+ - "Plan de Cierre - Faena Minera Salares Norte | 122 \n \n \nFuente: SRK \nFigura\
40
+ \ 8-37: Sistema de Manejo de Aguas de No Contacto \n \n Características \nA continuación,\
41
+ \ se presentan las características de las obras asociadas al sistema de manejo\
42
+ \ de aguas de no contacto. \n Canal de Derivación Superior \nEl Canal de Derivación\
43
+ \ Superior recibirá la escorrentía proveniente de la quebrada N ° 1 y su afluente\
44
+ \ (Quebrada 1 -\n1) a aproximadamente 4.588 m.s.n.m. y conduciéndolo a través\
45
+ \ de su trazado hasta la quebrada Anaranjada, \ndescargando a través de una obra\
46
+ \ d e entrega (caída) a 4.575 m.s.n.m., posee una longitud de 1.630 m y una\
47
+ \ \npendiente uniforme de 0,8 %. \nLa sección transversal del Canal de Derivación\
48
+ \ Superior es una excavación trapezoidal en suelo, con una base de \n0,50 m, profundidad\
49
+ \ total de 0,35 m y talud es de 1,5 (H): 1 (V). Aguas arriba del canal, se considera\
50
+ \ una berma de \nprotección de un ancho de 1 m; mientras que aguas abajo, se diseñó\
51
+ \ un camino de mantenimiento de un ancho de \n3,0 m. Se consideran taludes de\
52
+ \ 1 (H): 1.5 (V) y de 1.5 (H): 1 (V) para excavación en corte y relleno, respectivamente.\
53
+ \ \nLa Figura 8-38 muestra una sección típica para el Canal de Derivación Superior."
54
+ - source_sentence: ¿Dónde no deben ser depositados los materiales de baja calidad
55
+ para evitar problemas de inestabilidad?
56
+ sentences:
57
+ - "41 \nvigente, se asocia con un 30 % de la gravedad, el que a su vez corresponde\
58
+ \ a grado de riesgo \nsísmico medio - alto. \n \n5.1.11. Patrimonio cultural y\
59
+ \ arqueológico \n \nComo resultado de la inspección visual del terreno, realizado\
60
+ \ en el marco de la DIA Reapertura \nMina Guanaco, en el área del proyecto se\
61
+ \ detectó 10 sitios arqueológicos, clasificados en dos \ntipos de evidencia arqueológica\
62
+ \ según su cronología, distinguiéndose sitios prehispánicos e \nhistóricos. \n\
63
+ \ \nSe encontraron dos hallazgos prehispánicos, se trata de campamentos que presentan\
64
+ \ \nabundantes desechos de talla lítica e instrumentos formalizados como puntas\
65
+ \ de proyectil, \ncuchillos y raspadores que señalan actividades de caza y destazamiento\
66
+ \ de presas. Estos \nhallazgos, tanto por el tipo de evidencia como por su moderada\
67
+ \ densidad, permite interpretarlos \ncomo campamentos esporádicos asociados a\
68
+ \ la circulación de grupos durante el período \nFormativo (1500 aC - 600 dC).\
69
+ \ \n \nLas evidencias arqueológicas históricas se dividen en asentamientos mayores\
70
+ \ y estructuras \nmenores. Los asentamientos mayores están asociados a la producción\
71
+ \ minera de carácter \nindustrial del área minera de Guanaco, que se remontan\
72
+ \ hasta el siglo XIX. Aquí se incluyen el \npoblado y el cementerio en las inmediaciones\
73
+ \ del sector Cachinales, y el cementerio entre el \nRajo Dumbo y el Campamento\
74
+ \ Soledad. \n \nLas estructuras menores (demarcatorias y campamentos pirquineros),\
75
+ \ debido a su \nausencia/mezcla de evidencias materiales culturales, no permiten\
76
+ \ definir una cronología \nprecisa, pero están asociados a una explotación minera\
77
+ \ artesanal del distrito Guanaco, \nefectuada desde fines del siglo XIX hasta\
78
+ \ una época más reciente."
79
+ - "Esto podría incluir material afectado por Steam Heated \no suelos asociados a\
80
+ \ depósitos cuaternarios. Para evitar problemas de inestabilidad, estos \nmateriales\
81
+ \ de baja calidad no deben ser depositados : ni al pie del botadero Sur; ni al\
82
+ \ fondo de la \ncuenca en donde se emplazará el botadero Sur (donde hay mayor\
83
+ \ espesor de materiales aluviales \ny piroclásticos); ni bajo el área donde estará\
84
+ \ emplazado el depósito de relaves filtrados."
85
+ - "SRK Consulting: 01-2028-64 Salares Norte Análisis de Estabilidad Botadero Sur\
86
+ \ y Depósito de Relaves Filtrados Página 18 \nAT/br SRK-GFCH74-FS-6100-CE-RP-0003_00P1\
87
+ \ mayo.18 \n9 Conclusiones \n1. Los análisis de estabilidad descritos en este\
88
+ \ reporte verifican que los diseños propuestos para el \nbotadero Sur y el depósito\
89
+ \ de relaves filtrados concuerdan con los criterios de estabilidad adoptados \n\
90
+ para las condiciones de operación (corto plazo), como las condiciones de post-cierre\
91
+ \ (largo plazo). \n2. Para la configuración final del botadero Sur y el depósito\
92
+ \ de relaves filtrados, dos secciones fueron \nanalizadas. El suelo de fundación\
93
+ \ para ambas secciones corresponde a materiales aluviales y \npiroclásticos. Todas\
94
+ \ las secciones son estables de acuerdo al criterio de diseño. \n3. Para la configuración\
95
+ \ intermedia del botadero Sur, dos secciones fueron seleccionadas para estudiar\
96
+ \ \nla estabilidad del botadero previo a la depositación de los relaves filtrados.\
97
+ \ Una sección considera \nla zona del botadero Sur sobre la cual se apoyará el\
98
+ \ depósito de relaves filtrados (Sección PT-01) y \nla otra considera la máxima\
99
+ \ altura y ángulo global (Sección PT -02). Ambas secciones son estables \nde acuerdo\
100
+ \ con los criterios de diseño. \n4. Dado que la configuración máxima analizada\
101
+ \ es estable, las configuraciones que tengan los mismos \ncriterios geométricos\
102
+ \ (mismo alto de banco, ancho de berma, y ángulo de talud entre bancos ), y \n\
103
+ menor capacidad de almacenamiento (por ende, menor altura máxima), también serán\
104
+ \ estables de \nacuerdo con los criterios de diseño. \n5."
105
+ - source_sentence: ¿Cuál es el periodo de retorno asociado a la crecida del río La
106
+ Ligua en el diseño hidráulico del tranque?
107
+ sentences:
108
+ - "Además SCMET velará por el buen estado mecánico de todos \nlos vehículos y equipos\
109
+ \ de tal forma que cumplan con las normas de emisión respectivas. \nEtapa de\
110
+ \ Operación \nEn esta etapa, se generará material particulado debido a las actividades\
111
+ \ relacionadas con el tránsito de \nvehículos cargados con el relave filtrado\
112
+ \ por los caminos internos de la faena, el recorrido de los \ncamiones desde la\
113
+ \ Planta de Espesado hasta el Depósito de Relaves filtrados Doña Rosa es de \n\
114
+ aproximadamente 250 m. Las emisiones de material particulado producto de esta\
115
+ \ actividad se estima en \n680,85 kg/día. Cabe destacar que la descarga del relave\
116
+ \ producirá una cantidad poco significativa de \nmaterial particulado, dado que\
117
+ \ éste tendrá una humedad en torno al 16%. \nLos caminos que serán utilizados\
118
+ \ para el transporte de material serán humectados cuando se requiera con \nel\
119
+ \ fin de disminuir al mínimo las emisiones de material particulado. Cabe recordar,\
120
+ \ que la ruta de \ntransporte se encuentra lejos de asentamientos humanos. Por\
121
+ \ otro lado, el Proyecto emitirá gases de \ncombustión debido al funcionamiento\
122
+ \ de vehículos y maquinaría, estas emisiones se han estimado en 0.01 \nkg/día.\
123
+ \ Como puede apreciarse, estas emisiones serán poco significativas, ya que los\
124
+ \ vehículos estarán \nsujetos a revisiones y mantenciones periódicas, lo cual\
125
+ \ permitirá mantener un control sobre los gases a \nemitir. \nEtapa de Cierre\
126
+ \ \nEn esta etapa, se generará material particulado debido a las actividades\
127
+ \ relacionadas con el \ndesmantelamiento de instalaciones, tránsito de vehículos\
128
+ \ y movimiento de tierra para obtener la \nconfiguración final del depósito de\
129
+ \ relaves. En esta etapa también se emitirán gases de combustión \nproveniente\
130
+ \ del sistema de escape de los vehículos."
131
+ - "Una vez que los camiones descarguen los \nrelaves filtrados, éstos serán esparcidos\
132
+ \ y compactados mediante el uso de un bulldozer y un rodillo. \n3.11.1 Fase o\
133
+ \ Etapa de Construcción. \n \n3.11.1.1 Reubicación de Infraestructura Existente\
134
+ \ \nEn la zona en que se emplazarán las obras del proyecto se encuentra infraestructura\
135
+ \ existente, la que \ncorresponde a: \n· Línea de agua mina Estatuas,\
136
+ \ consistente en una tubería de HDPE de 200 mm de \ndiámetro. \n· Línea\
137
+ \ Eléctrica corresponde a una línea de 23 kV. \n· Camino no pavimentado\
138
+ \ de 10 m de ancho. \nToda esta infraestructura deberá ser reubicada de tal manera\
139
+ \ que no interfiera con las obras del proyecto. \nEl tramo a ser reubicado tanto\
140
+ \ de la línea de aguas mina como la línea eléctrica es de aproximadamente \n300\
141
+ \ m de largo. \nDado que la tubería de aguas minas no se encuentra en operaciones,\
142
+ \ esta infraestructura simplemente será \nretirada del lugar para evitar interferencias\
143
+ \ con las obras del Depósito de Relaves Filtrados Doña Rosa. En \ntanto que la\
144
+ \ reubicación de la línea eléctrica consistirá en el desmontaje de 500 m de línea\
145
+ \ (con su \nrespectiva postación), para posteriormente instalar la postación y\
146
+ \ los cables en un lugar en que no exista \ninterferencia con el depósito de relaves\
147
+ \ filtrados. La reubicación del camino existente consistirá en \nconstruir un\
148
+ \ nuevo camino de aproximadamente 350 m de largo por 10 m de ancho. Esta actividad\
149
+ \ se \nllevará a cabo mediante el uso de maquinaria convencional y consistirá\
150
+ \ básicamente en un movimiento de \ntierra equivalente a 1.750 m3."
151
+ - "10 \n \n \n85/11382/13328 Proyecto de Cierre Tranque de Relave N°4 Planta\
152
+ \ Cabildo, Región de Valparaíso \nPlan de Cierre \n5.2 Identificación de Riesgos.\
153
+ \ \nLos posibles riesgos, identificados en este Proyecto de Cierre y que pueden\
154
+ \ tener un mayor impacto, están \nrelacionados principalmente con la posible pérdida\
155
+ \ de la estabilidad física del tranque, y se centra en dos \ncondiciones: \n\x9D\
156
+ \ Aspectos Meteorológicos extremos (Pluviométrico y Fluviométrico), que implica\
157
+ \ el análisis de la \ncondición actual de los diseños hidráulicos. \n\x9D Aspectos\
158
+ \ de Estabilidad del muro del Tranque. \nAmbos aspectos, en caso de no ser controlados\
159
+ \ a través del correcto diseño de las obras hidráulicas y/o \nrefuerzo del muro,\
160
+ \ podrían ocasionar daños en la estructura del tranque. En atención a lo expuesto,\
161
+ \ los \nriesgos identificados son: \n \nI. Diseño Hidráulico: \nx Crecida\
162
+ \ del río La Ligua, asociado a un periodo de retorno de 10.000 años. Considerando\
163
+ \ este \ncriterio extremo (abordado en el Anexo 2 Informe Técnico Diseño Hidráulico),\
164
+ \ se obtuvo que para la \ncondición actual de diseño de la defensa ribereña, en\
165
+ \ ciertos puntos de éstas no se cumplen con el \nrequerimiento mínimo de revancha\
166
+ \ (0,5 m.), es decir, existen sectores del río en que el agua llegaría \na la\
167
+ \ cota de coronamiento de la protección de la Ribera. \nx Desborde de Aguas lluvias,\
168
+ \ acumuladas en la cubeta del tranque, provenientes de zonas \naledañas y las\
169
+ \ que precipitan directamente sobre él."
170
+ - source_sentence: ¿Cuál es la distancia peligrosa estimada para el Depósito de Relaves
171
+ Filtrados Doña Rosa?
172
+ sentences:
173
+ - "A continuación, se presenta un resumen de los análisis d esarrollados para el\
174
+ \ botadero Sur. \nAl igual que en el análisis del botadero Norte, las secciones\
175
+ \ para analizar en el botadero Sur fueron definidas en base \nla estimación de\
176
+ \ perfiles más críticos, escogiendo aquellos con mayor altura y/o mayor ángulo\
177
+ \ global. Se utilizó la \nconfiguración de suelo de fundación más desfavorable\
178
+ \ (11,5 m de material aluvial sobre 5 m de material piroclástico) \nen todas las\
179
+ \ secciones. Este escenario no es necesariamente real a lo largo de la sección,\
180
+ \ pero es un criterio más \nconservador. \nDado que el botadero Sur servirá de\
181
+ \ plataforma para el depósito de relaves filtrados, se analizaron dos secciones\
182
+ \ \npara la configuración final del botadero Sur en conjunto con el depósito de\
183
+ \ relaves filtrados en su condición final, \ndenominadas Sección 1 y Sección 2.\
184
+ \ Una vista general del botadero Sur y el depósito de relaves filtrados, junto\
185
+ \ a las \ndos secciones nombradas anteriormente, se presentan en la Figura 8-20.\
186
+ \ La Sección 1 es perpendicular al botadero \nSur y el depósito de relaves (mayor\
187
+ \ ángulo global), mientras que la Sección 2 corresponde al perfil con mayor altura.\
188
+ \ \nEn la Sección 1, la plataforma 4.432 del botadero Sur tiene una altura de\
189
+ \ 64 m, con un ángulo global de 26° y ángulo \ncara entre bancos de 38°. El depósito\
190
+ \ de relaves filtrados tiene 40 m de altura, con un ángulo global de 20° y un\
191
+ \ \nángulo cara entre bancos de 21°. Juntos, el botadero Sur y el depósito de\
192
+ \ relaves filtrados alcanzan una altu ra de \n104 m y un ángulo global de 17°."
193
+ - "El ángulo global del depósito es de 20°. \nEl depósito de relaves filtrados se\
194
+ \ rá construido considerando una distancia de exclusión de 90 metros desde el\
195
+ \ pie \ndel depósito de relaves hasta el borde del botadero Sur y con una distancia\
196
+ \ de 41 metros entre el depósito de relaves \nfiltrados y el ROM STOCK. Las figuras\
197
+ \ siguientes muestran estas distancias. \n \nFuente: SRK \nFigura 8-30: Distancia\
198
+ \ de Exclusión entre el Depósito de Relaves Filtrados y el borde de la Plataforma\
199
+ \ 4.432"
200
+ - "PLAN DE CIERRE TEMPORAL – FAENA MINERA EL TOQUI \n Sociedad Contractual Minera\
201
+ \ El Toqui \nCapítulo 7 – Análisis de las Instalaciones \n \n \nREVISIÓN [0]\
202
+ \ \n7-84 \n \nFigura 7-21: Fotografía Muro de Confinamiento Frontal Depósito\
203
+ \ de Relave Doña Rosa \n \nFuente: SCMET, fotografía tomada en terreno 20 de\
204
+ \ Enero de 2016. \nEstimación de Distancia Peligrosa \nPara el cálculo de la distancia\
205
+ \ peligrosa del Depósito de Relaves Filtrados Doña Rosa, s e utiliza la \nmetodología\
206
+ \ propuesta por P.C. Lucia, J.M. Duncan y H.B. Seed . El método analiza la relación\
207
+ \ \ngeométrica entre la altura de la cuña de de splazamiento del flujo de relaves\
208
+ \ ante una falla por \nlicuefacción, la altura final de la misma, y la pendiente\
209
+ \ de terreno natural aguas debajo de la obra. \nPara el caso del Depósito de\
210
+ \ relaves Filtrados Doña Rosa, la distancia peligrosa final estimada por \neste\
211
+ \ método sería de 600 m. escurriendo el flujo de relaves por una quebrada adyacente,\
212
+ \ llegando \nhasta las inmed iaciones de una cancha de acopio de mine rales de\
213
+ \ zinc en Ia zona de la Planta de \nConcentración; no afectando ninguna obra habitacional.\
214
+ \ \nCabe destacar que la probabilidad de licuefacción de los relaves filtrados\
215
+ \ es muy baja, y por ende, \nes poco probable que el depósito colapse. \nb) Evaluación\
216
+ \ de riesgos de la instalación \nEn la Tabla 7-11 se muestra el resultado de la\
217
+ \ evaluación de riesgos para el depósito de relaves \nDoña Rosa."
218
+ - source_sentence: ¿Cuáles son las etapas para evaluar los riesgos de las instalaciones
219
+ mineras analizadas?
220
+ sentences:
221
+ - "23 \n \n \n85/11382/13328 Proyecto de Cierre Tranque de Relave N°4 Planta\
222
+ \ Cabildo, Región de Valparaíso \nPlan de Cierre \nprevio al inicio del periodo\
223
+ \ de lluvias, la cual consiste en desmalezados, raleos y limpieza de los \nelementos\
224
+ \ que pueden haber caído al interior del canal. \nPor otra parte, para interceptar\
225
+ \ toda la escorrentía generada por las aguas lluvias provenientes del \nexterior\
226
+ \ y evitar la entrada de aguas lluvias al tranque, se proyecta una extensión del\
227
+ \ canal perimetral, \ndesarrollándose desde el sur-poniente del depósito, hasta\
228
+ \ el canal actual, el cual debe transportar un \ncaudal de 0,17 m3/s, poseerá\
229
+ \ una pendiente de un 1% su sección será prefabricada de hormigón con la \ngeometría\
230
+ \ especificada en el apartado de Diseños Hidráulicos del presente informe. \n\
231
+ 7.2.5 Cierre de Accesos. \nSe prohíbe o restringe el acceso de personas al tranque,\
232
+ \ para evitar potenciales accidentes mediante \ncierres perimetrales. No obstante,\
233
+ \ se tendrá un ingreso restringido a personal dedicado a las actividades \ndel\
234
+ \ control y mantención, mientras MLC continúe con sus actividades. El cerco utilizado\
235
+ \ actualmente, \ncorresponde a postes de madera y alambre púa, éste será el mismo\
236
+ \ que se utilizará en el sector cerro \nque actualmente no cuenta con cerco, tal\
237
+ \ como se indica en el Plano N° 8511382_H002. Por otro lado, \nse cercará el\
238
+ \ sector de la cubeta donde se encuentra el canal perimetral, equivalente a 1379\
239
+ \ m. Para el \ncerco se utilizarán Polines Sulfatados de 3 a 4 pulgadas, la distancia\
240
+ \ entre estos será de 3 m. y contará \ncon 3 corridas de alambre púa, más una\
241
+ \ malla galvanizada."
242
+ - "Las instalaciones que fueron analizadas comprenden Seis (6) Minas Subterráneas:\
243
+ \ Concordia, Doña \nRosa, Estatuas, Antolín-Zúñiga, San Antonio y Mallín Mónica;\
244
+ \ Cinco (5) Depósitos de Relaves: Doña \nRosa, La Leñera, El Toqui, Auxiliar y\
245
+ \ Confluencia. \nPara evaluar los riesgos de las instalaciones, se realizaron\
246
+ \ las siguientes etapas: \n● Identificación de los riesgos. \n● Análisis de la\
247
+ \ probabilidad de ocurrencia del hecho. \n● Análisis de la severidad de las consecuencias\
248
+ \ para las personas y para el medio ambiente. \n● Evaluación de riesgos, donde\
249
+ \ se determina si este es significativo o no. \nLa evaluación de riesgos (riesgo\
250
+ \ puro) asociados a las principales instalaciones de la Faena, sirve \npara identificar\
251
+ \ las instalaciones que presentan un riesgo significativo, previo a la adopción\
252
+ \ de las \nmedidas de cierre propuestas, y que por lo tanto requieren de medidas\
253
+ \ de control para el cierre \ntemporal. \nComo resultado de la evaluación de riesgos,\
254
+ \ se obtuvie ron las medidas de cierre para cada una de \nlas instalaciones que\
255
+ \ se presentan en la siguiente tabla."
256
+ - "La superficie de la corona será paralela a la \nsuperficie del depósito. \nTabla\
257
+ \ 26. Características geométricas del depósito de relaves seco \nParámetro Valor\
258
+ \ \nCapacidad final del deposito 2,54 M m3/4,07 M ton \nÁrea basal del deposito\
259
+ \ 216.457 m2 \nAltura nivel 1 10 m \nAltura nivel 2 5 m \nTalud de depositación\
260
+ \ entre bermas 4:1 (H:V) \nPendiente final de la corona del depósito (pendiente\
261
+ \ \nentre 1 y 3%) \nParalela a superficie \nmejorada \nAncho del banco de estabilidad\
262
+ \ 5m (min) \nElevación máxima de corona 2.796 m.s.n.m. \nElevación mínima de corona\
263
+ \ 2770 m.s.n.m \n \nLos materiales de empréstito a utilizar en el depósito de\
264
+ \ relaves corresponden al material \ndestinado a: \n• Construcción del muro;\
265
+ \ corresponden a 34,437 m3 estimados de material de lastre de \ntamaños máximos\
266
+ \ superiores a 12”. \n• Recubrimiento de canaletas de aguas lluvias; consistente\
267
+ \ en 785 m3 de material de \ngrava angulosa, con tamaño de 4” promedio. \nTabla\
268
+ \ 27. Características del depósito de relaves secos \nParámetro Valor \nSuperficie\
269
+ \ (ha) 20,6 \nPerímetro (mL) 1781 \nCapacidad 4 M ton"
270
+ pipeline_tag: sentence-similarity
271
+ library_name: sentence-transformers
272
+ ---
273
+
274
+ # SentenceTransformer based on sentence-transformers/all-MiniLM-L6-v2
275
+
276
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/all-MiniLM-L6-v2](https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
277
+
278
+ ## Model Details
279
+
280
+ ### Model Description
281
+ - **Model Type:** Sentence Transformer
282
+ - **Base model:** [sentence-transformers/all-MiniLM-L6-v2](https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2) <!-- at revision c9745ed1d9f207416be6d2e6f8de32d1f16199bf -->
283
+ - **Maximum Sequence Length:** 256 tokens
284
+ - **Output Dimensionality:** 384 dimensions
285
+ - **Similarity Function:** Cosine Similarity
286
+ <!-- - **Training Dataset:** Unknown -->
287
+ <!-- - **Language:** Unknown -->
288
+ <!-- - **License:** Unknown -->
289
+
290
+ ### Model Sources
291
+
292
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
293
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
294
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
295
+
296
+ ### Full Model Architecture
297
+
298
+ ```
299
+ SentenceTransformer(
300
+ (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: BertModel
301
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
302
+ (2): Normalize()
303
+ )
304
+ ```
305
+
306
+ ## Usage
307
+
308
+ ### Direct Usage (Sentence Transformers)
309
+
310
+ First install the Sentence Transformers library:
311
+
312
+ ```bash
313
+ pip install -U sentence-transformers
314
+ ```
315
+
316
+ Then you can load this model and run inference.
317
+ ```python
318
+ from sentence_transformers import SentenceTransformer
319
+
320
+ # Download from the 🤗 Hub
321
+ model = SentenceTransformer("GbrlOl/fine-tune_utilizando_la_MNRL")
322
+ # Run inference
323
+ sentences = [
324
+ '¿Cuáles son las etapas para evaluar los riesgos de las instalaciones mineras analizadas?',
325
+ 'Las instalaciones que fueron analizadas comprenden Seis (6) Minas Subterráneas: Concordia, Doña \nRosa, Estatuas, Antolín-Zúñiga, San Antonio y Mallín Mónica; Cinco (5) Depósitos de Relaves: Doña \nRosa, La Leñera, El Toqui, Auxiliar y Confluencia. \nPara evaluar los riesgos de las instalaciones, se realizaron las siguientes etapas: \n● Identificación de los riesgos. \n● Análisis de la probabilidad de ocurrencia del hecho. \n● Análisis de la severidad de las consecuencias para las personas y para el medio ambiente. \n● Evaluación de riesgos, donde se determina si este es significativo o no. \nLa evaluación de riesgos (riesgo puro) asociados a las principales instalaciones de la Faena, sirve \npara identificar las instalaciones que presentan un riesgo significativo, previo a la adopción de las \nmedidas de cierre propuestas, y que por lo tanto requieren de medidas de control para el cierre \ntemporal. \nComo resultado de la evaluación de riesgos, se obtuvie ron las medidas de cierre para cada una de \nlas instalaciones que se presentan en la siguiente tabla.',
326
+ '23 \n \n \n85/11382/13328 Proyecto de Cierre Tranque de Relave N°4 Planta Cabildo, Región de Valparaíso \nPlan de Cierre \nprevio al inicio del periodo de lluvias, la cual consiste en desmalezados, raleos y limpieza de los \nelementos que pueden haber caído al interior del canal. \nPor otra parte, para interceptar toda la escorrentía generada por las aguas lluvias provenientes del \nexterior y evitar la entrada de aguas lluvias al tranque, se proyecta una extensión del canal perimetral, \ndesarrollándose desde el sur-poniente del depósito, hasta el canal actual, el cual debe transportar un \ncaudal de 0,17 m3/s, poseerá una pendiente de un 1% su sección será prefabricada de hormigón con la \ngeometría especificada en el apartado de Diseños Hidráulicos del presente informe. \n7.2.5 Cierre de Accesos. \nSe prohíbe o restringe el acceso de personas al tranque, para evitar potenciales accidentes mediante \ncierres perimetrales. No obstante, se tendrá un ingreso restringido a personal dedicado a las actividades \ndel control y mantención, mientras MLC continúe con sus actividades. El cerco utilizado actualmente, \ncorresponde a postes de madera y alambre púa, éste será el mismo que se utilizará en el sector cerro \nque actualmente no cuenta con cerco, tal como se indica en el Plano N° 8511382_H002. Por otro lado, \nse cercará el sector de la cubeta donde se encuentra el canal perimetral, equivalente a 1379 m. Para el \ncerco se utilizarán Polines Sulfatados de 3 a 4 pulgadas, la distancia entre estos será de 3 m. y contará \ncon 3 corridas de alambre púa, más una malla galvanizada.',
327
+ ]
328
+ embeddings = model.encode(sentences)
329
+ print(embeddings.shape)
330
+ # [3, 384]
331
+
332
+ # Get the similarity scores for the embeddings
333
+ similarities = model.similarity(embeddings, embeddings)
334
+ print(similarities.shape)
335
+ # [3, 3]
336
+ ```
337
+
338
+ <!--
339
+ ### Direct Usage (Transformers)
340
+
341
+ <details><summary>Click to see the direct usage in Transformers</summary>
342
+
343
+ </details>
344
+ -->
345
+
346
+ <!--
347
+ ### Downstream Usage (Sentence Transformers)
348
+
349
+ You can finetune this model on your own dataset.
350
+
351
+ <details><summary>Click to expand</summary>
352
+
353
+ </details>
354
+ -->
355
+
356
+ <!--
357
+ ### Out-of-Scope Use
358
+
359
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
360
+ -->
361
+
362
+ <!--
363
+ ## Bias, Risks and Limitations
364
+
365
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
366
+ -->
367
+
368
+ <!--
369
+ ### Recommendations
370
+
371
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
372
+ -->
373
+
374
+ ## Training Details
375
+
376
+ ### Training Dataset
377
+
378
+ #### Unnamed Dataset
379
+
380
+ * Size: 527 training samples
381
+ * Columns: <code>anchor</code> and <code>positive</code>
382
+ * Approximate statistics based on the first 527 samples:
383
+ | | anchor | positive |
384
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
385
+ | type | string | string |
386
+ | details | <ul><li>min: 5 tokens</li><li>mean: 32.24 tokens</li><li>max: 69 tokens</li></ul> | <ul><li>min: 44 tokens</li><li>mean: 236.35 tokens</li><li>max: 256 tokens</li></ul> |
387
+ * Samples:
388
+ | anchor | positive |
389
+ |:------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
390
+ | <code>¿Cuántas minas componen las minas a rajo abierto en la Mina Guanaco?</code> | <code>B ORRA DOR <br> <br> <br> <br>iii <br> <br>La Mina Guanaco, está ubicada en la Comuna de Taltal, Provincia de Antofagasta, a 220 km al <br>sureste de la ciudad de la ciudad homónima, a una altitud cercana a los 2.700 msnm. <br> <br>Cuenta con seis minas donde el tipo de explotación es a rajo abierto y subterránea. Las minas que <br>componen las minas a rajo abierto son cuatro y corresponden a: “Defensa, Dumbo, Perseverancia <br>y Quillota”. Las minas subterráneas son dos y corresponden a “Cachinalito y Salvadora”. <br> <br>El distrito minero El Guanaco es conocido desde fine s del siglo pasado, cuando habitantes del <br>poblado de la Aguada de Ca chinal, que surtían agua a las minas de Cachinal de la Sierra, <br>descubrieron evidencias de mineralización aurífera en vetas de baritina. El mineral producido a <br>partir de 1886 fue tratado por amalgamación en Taltal. Hasta el año 1890, se habrían producido <br>más de 6.000 kg de oro, transportando la producción en ferrocarril que unía El Guanaco con Taltal. <br> <br>La mayor parte de la acti...</code> |
391
+ | <code>¿Altura máxima del depósito de relaves filtrado?</code> | <code>Plan de Cierre – Faena Salares <br>Norte <br> <br>Anexo 18 <br>Análisis de Estabilidad Botadero Sur y Depósito <br>de Relaves Filtrados <br> <br>Febrero, 2020</code> |
392
+ | <code>¿Cuál es el objetivo del análisis de estabilidad realizado para el diseño del rajo en Salares Norte?</code> | <code>Plan de Cierre - Faena Minera Salares Norte | 67 <br> <br> <br>Fase 1 – Rajo Salares Norte Fase 2 – Rajo Salares Norte <br> <br>Fase 3 – Rajo Salares Norte Fase 4 – Rajo Salares Norte <br> <br>Fase 5 – Rajo Salares Norte Fase 6 – Rajo Salares Norte <br>Fuente: SRK <br>Figura 8-1: Fases Rajo Salares Norte <br>Para el diseño del rajo se realizó un análisis de estabilidad cuyo objetivo es la evaluación de una configuración de <br>bancos que pueda contener las posibles inestabilidades locales que pudieran afectar la estabilidad a escala de <br>bancos.</code> |
393
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
394
+ ```json
395
+ {
396
+ "scale": 20.0,
397
+ "similarity_fct": "cos_sim"
398
+ }
399
+ ```
400
+
401
+ ### Evaluation Dataset
402
+
403
+ #### Unnamed Dataset
404
+
405
+ * Size: 132 evaluation samples
406
+ * Columns: <code>anchor</code> and <code>positive</code>
407
+ * Approximate statistics based on the first 132 samples:
408
+ | | anchor | positive |
409
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
410
+ | type | string | string |
411
+ | details | <ul><li>min: 14 tokens</li><li>mean: 32.58 tokens</li><li>max: 69 tokens</li></ul> | <ul><li>min: 54 tokens</li><li>mean: 226.33 tokens</li><li>max: 256 tokens</li></ul> |
412
+ * Samples:
413
+ | anchor | positive |
414
+ |:------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
415
+ | <code>¿Cuáles son las características que deben ser evaluadas en un rango de 1 a 5 según la Guía mencionada en el texto?</code> | <code>La Guía establece una serie de características, las cuales deben ser evaluadas en un rango de 1 a 5, y además establece <br>las condiciones que se deben dar para establecer el rango. <br>En la Tabla 7-1 se presentan las características de las personas y los rangos para la evaluación. <br>Por otro lado, al igual que en la det erminación de la probabilidad de ocurrencia, también se ha considerado como <br>parte del análisis de la severidad de las consecuencias, la efectividad de las medidas de cierre comprometidas en la <br>evaluación ambiental. <br>Así, la severidad de las consecuencias a las personas estará determinada por la sumatoria de los rangos de las <br>características de las personas combinada con la efectividad de las medidas de cierre propuestas, si existieran. <br>De la misma forma, la Severidad de las Consecuencias al Medio Ambiente se determina a partir de las características <br>del entorno (selección de un rango) y de la efectividad de las medidas de cierre comprometidas en la evaluación <br>ambient...</code> |
416
+ | <code>¿Cuál es el ángulo de banco o de terraza del depósito de relaves filtrado?</code> | <code>A continuación, se presenta un resumen de los análisis d esarrollados para el botadero Sur. <br>Al igual que en el análisis del botadero Norte, las secciones para analizar en el botadero Sur fueron definidas en base <br>la estimación de perfiles más críticos, escogiendo aquellos con mayor altura y/o mayor ángulo global. Se utilizó la <br>configuración de suelo de fundación más desfavorable (11,5 m de material aluvial sobre 5 m de material piroclástico) <br>en todas las secciones. Este escenario no es necesariamente real a lo largo de la sección, pero es un criterio más <br>conservador. <br>Dado que el botadero Sur servirá de plataforma para el depósito de relaves filtrados, se analizaron dos secciones <br>para la configuración final del botadero Sur en conjunto con el depósito de relaves filtrados en su condición final, <br>denominadas Sección 1 y Sección 2. Una vista general del botadero Sur y el depósito de relaves filtrados, junto a las <br>dos secciones nombradas anteriormente, se presentan en la Figura 8-...</code> |
417
+ | <code>¿Qué medidas se están tomando para mejorar el drenaje y minimizar la erosión en las piscinas del sector Pilas Estáticas y del sector SX?</code> | <code>(RNP) <br>Manejo de residuos peligrosos (RP) <br>Piscinas ILS-PLS (sector Pilas Estáticas) <br>Cubrimiento de piscinas con suelo de valor edafológico <br>Reperfilamiento del área para mejorar drenaje y minimizar erosión <br>Piscina refino (sector SX) <br>Cubrimiento de piscinas con suelo de valor edafológico <br>Reperfilamiento del área para mejorar drenaje y minimizar erosión</code> |
418
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
419
+ ```json
420
+ {
421
+ "scale": 20.0,
422
+ "similarity_fct": "cos_sim"
423
+ }
424
+ ```
425
+
426
+ ### Training Hyperparameters
427
+ #### Non-Default Hyperparameters
428
+
429
+ - `per_device_train_batch_size`: 16
430
+ - `per_device_eval_batch_size`: 16
431
+ - `learning_rate`: 2e-05
432
+ - `num_train_epochs`: 100
433
+ - `warmup_ratio`: 0.1
434
+ - `fp16`: True
435
+ - `batch_sampler`: no_duplicates
436
+
437
+ #### All Hyperparameters
438
+ <details><summary>Click to expand</summary>
439
+
440
+ - `overwrite_output_dir`: False
441
+ - `do_predict`: False
442
+ - `eval_strategy`: no
443
+ - `prediction_loss_only`: True
444
+ - `per_device_train_batch_size`: 16
445
+ - `per_device_eval_batch_size`: 16
446
+ - `per_gpu_train_batch_size`: None
447
+ - `per_gpu_eval_batch_size`: None
448
+ - `gradient_accumulation_steps`: 1
449
+ - `eval_accumulation_steps`: None
450
+ - `torch_empty_cache_steps`: None
451
+ - `learning_rate`: 2e-05
452
+ - `weight_decay`: 0.0
453
+ - `adam_beta1`: 0.9
454
+ - `adam_beta2`: 0.999
455
+ - `adam_epsilon`: 1e-08
456
+ - `max_grad_norm`: 1.0
457
+ - `num_train_epochs`: 100
458
+ - `max_steps`: -1
459
+ - `lr_scheduler_type`: linear
460
+ - `lr_scheduler_kwargs`: {}
461
+ - `warmup_ratio`: 0.1
462
+ - `warmup_steps`: 0
463
+ - `log_level`: passive
464
+ - `log_level_replica`: warning
465
+ - `log_on_each_node`: True
466
+ - `logging_nan_inf_filter`: True
467
+ - `save_safetensors`: True
468
+ - `save_on_each_node`: False
469
+ - `save_only_model`: False
470
+ - `restore_callback_states_from_checkpoint`: False
471
+ - `no_cuda`: False
472
+ - `use_cpu`: False
473
+ - `use_mps_device`: False
474
+ - `seed`: 42
475
+ - `data_seed`: None
476
+ - `jit_mode_eval`: False
477
+ - `use_ipex`: False
478
+ - `bf16`: False
479
+ - `fp16`: True
480
+ - `fp16_opt_level`: O1
481
+ - `half_precision_backend`: auto
482
+ - `bf16_full_eval`: False
483
+ - `fp16_full_eval`: False
484
+ - `tf32`: None
485
+ - `local_rank`: 0
486
+ - `ddp_backend`: None
487
+ - `tpu_num_cores`: None
488
+ - `tpu_metrics_debug`: False
489
+ - `debug`: []
490
+ - `dataloader_drop_last`: False
491
+ - `dataloader_num_workers`: 0
492
+ - `dataloader_prefetch_factor`: None
493
+ - `past_index`: -1
494
+ - `disable_tqdm`: False
495
+ - `remove_unused_columns`: True
496
+ - `label_names`: None
497
+ - `load_best_model_at_end`: False
498
+ - `ignore_data_skip`: False
499
+ - `fsdp`: []
500
+ - `fsdp_min_num_params`: 0
501
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
502
+ - `tp_size`: 0
503
+ - `fsdp_transformer_layer_cls_to_wrap`: None
504
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
505
+ - `deepspeed`: None
506
+ - `label_smoothing_factor`: 0.0
507
+ - `optim`: adamw_torch
508
+ - `optim_args`: None
509
+ - `adafactor`: False
510
+ - `group_by_length`: False
511
+ - `length_column_name`: length
512
+ - `ddp_find_unused_parameters`: None
513
+ - `ddp_bucket_cap_mb`: None
514
+ - `ddp_broadcast_buffers`: False
515
+ - `dataloader_pin_memory`: True
516
+ - `dataloader_persistent_workers`: False
517
+ - `skip_memory_metrics`: True
518
+ - `use_legacy_prediction_loop`: False
519
+ - `push_to_hub`: False
520
+ - `resume_from_checkpoint`: None
521
+ - `hub_model_id`: None
522
+ - `hub_strategy`: every_save
523
+ - `hub_private_repo`: None
524
+ - `hub_always_push`: False
525
+ - `gradient_checkpointing`: False
526
+ - `gradient_checkpointing_kwargs`: None
527
+ - `include_inputs_for_metrics`: False
528
+ - `include_for_metrics`: []
529
+ - `eval_do_concat_batches`: True
530
+ - `fp16_backend`: auto
531
+ - `push_to_hub_model_id`: None
532
+ - `push_to_hub_organization`: None
533
+ - `mp_parameters`:
534
+ - `auto_find_batch_size`: False
535
+ - `full_determinism`: False
536
+ - `torchdynamo`: None
537
+ - `ray_scope`: last
538
+ - `ddp_timeout`: 1800
539
+ - `torch_compile`: False
540
+ - `torch_compile_backend`: None
541
+ - `torch_compile_mode`: None
542
+ - `include_tokens_per_second`: False
543
+ - `include_num_input_tokens_seen`: False
544
+ - `neftune_noise_alpha`: None
545
+ - `optim_target_modules`: None
546
+ - `batch_eval_metrics`: False
547
+ - `eval_on_start`: False
548
+ - `use_liger_kernel`: False
549
+ - `eval_use_gather_object`: False
550
+ - `average_tokens_across_devices`: False
551
+ - `prompts`: None
552
+ - `batch_sampler`: no_duplicates
553
+ - `multi_dataset_batch_sampler`: proportional
554
+
555
+ </details>
556
+
557
+ ### Training Logs
558
+ | Epoch | Step | Training Loss |
559
+ |:-------:|:----:|:-------------:|
560
+ | 5.8824 | 100 | 1.1853 |
561
+ | 11.7647 | 200 | 0.2591 |
562
+ | 17.6471 | 300 | 0.1023 |
563
+ | 23.5294 | 400 | 0.0656 |
564
+ | 29.4118 | 500 | 0.0575 |
565
+ | 35.2941 | 600 | 0.0478 |
566
+ | 41.1765 | 700 | 0.0386 |
567
+ | 47.0588 | 800 | 0.0347 |
568
+ | 52.9412 | 900 | 0.0397 |
569
+ | 58.8235 | 1000 | 0.0334 |
570
+ | 64.7059 | 1100 | 0.0317 |
571
+ | 70.5882 | 1200 | 0.0353 |
572
+ | 76.4706 | 1300 | 0.0336 |
573
+ | 82.3529 | 1400 | 0.032 |
574
+ | 88.2353 | 1500 | 0.0313 |
575
+ | 94.1176 | 1600 | 0.0345 |
576
+ | 100.0 | 1700 | 0.0279 |
577
+
578
+
579
+ ### Framework Versions
580
+ - Python: 3.10.16
581
+ - Sentence Transformers: 4.1.0
582
+ - Transformers: 4.51.3
583
+ - PyTorch: 2.6.0+cu124
584
+ - Accelerate: 1.6.0
585
+ - Datasets: 3.5.0
586
+ - Tokenizers: 0.21.1
587
+
588
+ ## Citation
589
+
590
+ ### BibTeX
591
+
592
+ #### Sentence Transformers
593
+ ```bibtex
594
+ @inproceedings{reimers-2019-sentence-bert,
595
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
596
+ author = "Reimers, Nils and Gurevych, Iryna",
597
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
598
+ month = "11",
599
+ year = "2019",
600
+ publisher = "Association for Computational Linguistics",
601
+ url = "https://arxiv.org/abs/1908.10084",
602
+ }
603
+ ```
604
+
605
+ #### MultipleNegativesRankingLoss
606
+ ```bibtex
607
+ @misc{henderson2017efficient,
608
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
609
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
610
+ year={2017},
611
+ eprint={1705.00652},
612
+ archivePrefix={arXiv},
613
+ primaryClass={cs.CL}
614
+ }
615
+ ```
616
+
617
+ <!--
618
+ ## Glossary
619
+
620
+ *Clearly define terms in order to be accessible across audiences.*
621
+ -->
622
+
623
+ <!--
624
+ ## Model Card Authors
625
+
626
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
627
+ -->
628
+
629
+ <!--
630
+ ## Model Card Contact
631
+
632
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
633
+ -->
config.json ADDED
@@ -0,0 +1,25 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "BertModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "classifier_dropout": null,
7
+ "gradient_checkpointing": false,
8
+ "hidden_act": "gelu",
9
+ "hidden_dropout_prob": 0.1,
10
+ "hidden_size": 384,
11
+ "initializer_range": 0.02,
12
+ "intermediate_size": 1536,
13
+ "layer_norm_eps": 1e-12,
14
+ "max_position_embeddings": 512,
15
+ "model_type": "bert",
16
+ "num_attention_heads": 12,
17
+ "num_hidden_layers": 6,
18
+ "pad_token_id": 0,
19
+ "position_embedding_type": "absolute",
20
+ "torch_dtype": "float32",
21
+ "transformers_version": "4.51.3",
22
+ "type_vocab_size": 2,
23
+ "use_cache": true,
24
+ "vocab_size": 30522
25
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "4.1.0",
4
+ "transformers": "4.51.3",
5
+ "pytorch": "2.6.0+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:dcc0ffcad558b32471885386ef840fbc335512a7d360cd5c7c800cf6e23c083c
3
+ size 90864192
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 256,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": {
3
+ "content": "[CLS]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "mask_token": {
10
+ "content": "[MASK]",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "[PAD]",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "sep_token": {
24
+ "content": "[SEP]",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "unk_token": {
31
+ "content": "[UNK]",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ }
37
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "100": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "101": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "102": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "103": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": false,
45
+ "cls_token": "[CLS]",
46
+ "do_basic_tokenize": true,
47
+ "do_lower_case": true,
48
+ "extra_special_tokens": {},
49
+ "mask_token": "[MASK]",
50
+ "max_length": 128,
51
+ "model_max_length": 256,
52
+ "never_split": null,
53
+ "pad_to_multiple_of": null,
54
+ "pad_token": "[PAD]",
55
+ "pad_token_type_id": 0,
56
+ "padding_side": "right",
57
+ "sep_token": "[SEP]",
58
+ "stride": 0,
59
+ "strip_accents": null,
60
+ "tokenize_chinese_chars": true,
61
+ "tokenizer_class": "BertTokenizer",
62
+ "truncation_side": "right",
63
+ "truncation_strategy": "longest_first",
64
+ "unk_token": "[UNK]"
65
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff