GbrlOl commited on
Commit
756acf1
·
verified ·
1 Parent(s): ac90f2b

Add new SentenceTransformer model

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,628 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:1412
8
+ - loss:CoSENTLoss
9
+ base_model: sentence-transformers/all-MiniLM-L6-v2
10
+ widget:
11
+ - source_sentence: ¿Qué elementos se consideran en el costo de la demolición de hormigón?
12
+ sentences:
13
+ - "Ordinario N° 57 de fecha 25 de Enero de 2011 \ninformó favorablemente. \n5.\
14
+ \ Que, en lo relativo a los efectos, características y circunstancias señalados\
15
+ \ en los literales “a”, \"b\", “c”, \n“d”, “e” y “f”, del artículo 11 de la Ley\
16
+ \ 19.300, y sobre la base de los antecedentes que constan en el \nexpediente de\
17
+ \ la evaluación, debe indicarse que el proyecto \"Depósito de Relaves Filtrados\
18
+ \ Doña Rosa” \nno genera ni presenta ninguno de tales efectos, características\
19
+ \ y circunstancias. \n6.- Que, en el proceso de evolución de proyecto \" Depósito\
20
+ \ de Relaves Filtrados Doña Rosa”, el titular \nha adquirido los siguientes compromisos\
21
+ \ ambientales voluntarios: \nEl proyecto contempla el monitoreo de aguas superficiales\
22
+ \ y subterráneas. Respecto a la periodicidad de \nmonitoreo, este será cuatrimestral\
23
+ \ durante los tres primeros años de operación del proyecto. Una vez \ncumplidos\
24
+ \ los tres años iniciales, se analizarán los resultados. Sobre la base de dicho\
25
+ \ análisis el titular \npropondrá fundadamente cambios a los parámetros, puntos\
26
+ \ y frecuencias de monitoreo, si es que los \nresultados así lo ameritan. \n\
27
+ En la siguiente tabla se presentan las coordenadas de los puntos de control de\
28
+ \ calidad de aguas, tanto \nsuperficiales como subterráneas."
29
+ - "d) Aplicación de gravilla \n \nEl monto considera la adquisición de la gravilla,\
30
+ \ el retiro y puesto en obra de la misma, la \nmaquinaria dispuesta para su esparcimiento,\
31
+ \ la nivelación del terreno y las HH/ hombre \ninvolucradas en su esparcimiento.\
32
+ \ \n \ne) Movimiento de tierra para fundaciones \nEl monto del movimiento de\
33
+ \ tierra incluye el arriendo de la maquinaria y su traslado para el \nlugar donde\
34
+ \ se efectuaron los movimientos de tierra, además de las hh/hombre involucradas\
35
+ \ de \nlos profesionales y jornales que participaron en el proyecto. \nf) Demolición\
36
+ \ de hormigón \nEl costo de la demolición de hormigón,\
37
+ \ incluye el arriendo de la maquinaria y su traslado para \nel lugar donde se\
38
+ \ efectuó la demolición, las hh/hombre involucradas de los profesionales y \n\
39
+ jornales que partic iparon en el proyecto, y el traslado y disposición final en\
40
+ \ vertederos \nautorizados del resultado de la demolición."
41
+ - "Cobertura \nSe considera la cobertura de la superficie (coronamiento) del depósito\
42
+ \ de relaves filtrados con una capa de material \ngranular de manera de minimizar\
43
+ \ la erosión eólica. Los taludes del depósito se encontrarán cubiertos al momento\
44
+ \ \ndel cierre de acuerdo con su método constructivo. \nEn relación con la estabilidad\
45
+ \ física de las instalaciones remanen tes al cierre (rajo, botaderos de estéril\
46
+ \ y depósito \nde relaves filtrados), éstas han sido diseñadas en su etapa de\
47
+ \ ingeniería considerando como criterio de estabilidad \nel sismo máxim o creíble,\
48
+ \ con lo cual se asegura un diseño final estable en el largo pla zo, sin requerir\
49
+ \ medidas de \ncierre adicionales en este ámbito. \nLa Tabla 7-3 presenta un resumen\
50
+ \ de los compromisos ambientales adquiridos para cada una de las instalaciones\
51
+ \ de \nla faena."
52
+ - source_sentence: ¿Se utilizaron antecedentes topográficos?
53
+ sentences:
54
+ - "Las piscinas de PLS e ILS tienen una capacidad operacional de 5.193 m3\n y la\
55
+ \ de emergencia de \n9.952 m3. \n \n4.3.9. Depósito de Relaves Secos \nEl Depósito\
56
+ \ de R elaves Secos no ha sido construido hasta ahora, y dicho P royecto fue\
57
+ \ \npresentado al Sernageomin para su aprobación por medi o de carta conductora\
58
+ \ el 17 de \ndiciembre 2015 (ver proyecto y carta presentado en el Anexo 2). \n\
59
+ El depósito se ubicará al Norte de las pilas de lixiviación existentes , de acuerdo\
60
+ \ a los espacios \ndisponibles, evitando la interferencia con quebradas y otras\
61
+ \ instalaciones, y considerando los \nlímites de propiedad y uso de suelos. \n\
62
+ El depósito tiene posibilidad de ampliarse hacia el Norte en unos 7.000 m 2, y\
63
+ \ hacia el Oeste en \ncerca de 23.000 m 2, moviendo el límite del depósito proyectado\
64
+ \ más cerca del borde de la \nquebrada existente. \nA continuación se entregan\
65
+ \ las coordenadas de ubicación del depósito de relaves:"
66
+ - "64 \nFigura 5.42: Caminos internos de acceso (2) . 64 \nFigura 5.43: Patio de\
67
+ \ RISES . 65 \nFigura 5.44: Bodega de almacenamiento temporal de residuos peligrosos\
68
+ \ . 66 \nFigura 5.45: Bodega de almacenamiento de residuos domésticos . 67 \n\
69
+ Figura 5.46: Ubicación Pozo Monitoreos . 100 \nFigura 5.47: Caminos internos Planta\
70
+ \ Catemu . 107 \n \nANEXOS \n \nANEXO A : . ANTECEDENTES LEGALES \nANEXO B :\
71
+ \ . RESOLUCIONES \nANEXO C: . PROPIEDAD MINERA \nANEXO D: . INFORME DE VIDA\
72
+ \ ÚTIL \nANEXO E: . PLANOS \nANEXO F: . EVALUACIÓN DE RIESGOS \nANEXO G: .\
73
+ \ PLANILLA DE VALORIZACIÓN \nANEXO H: . RESPALDO DE PRECIOS UNITARIOS \nANEXO\
74
+ \ I: . GARANTÍA FINANCIERA"
75
+ - "Geológicamente el sector está controlado por sistemas de fallas paralelas y pequeñas\
76
+ \ con eje \nlongitudinal en sentido norte- sur, una de las cuales es conocida\
77
+ \ como Catalina, situada en la \nvecindad de las instalaciones del Proyecto. \n\
78
+ \ \nAdemás del geo- control estructural provocado por el sistema de fallas mencionado,\
79
+ \ el área de \nproyecto se caracteriza geológicamente por estar implantado sobre\
80
+ \ roca de origen andesítico \ndirectamente relacionada con las cordiller as de\
81
+ \ Domeyko y del Centro, que aparecen en este \nsector de la Región de Antofagasta:\
82
+ \ Sierras de Catalina y Sierras de Julia. \n \nEl material de roca descompuesta\
83
+ \ (suelo) más superficial, bajo las capas aluvionales descritas \nanteriormente,\
84
+ \ tienen su origen en el Mioceno y se han generado por fenómenos metamórficos\
85
+ \ \ntempranos, que molieron las cumbres de los mantos rocosos que hoy están bajo\
86
+ \ tierra. En todo \ncaso, las cubiertas cenozoicas son terciarias a cuaternarias\
87
+ \ y siempre con fuerte predominio de \nmateriales volcánicos provenientes de centros\
88
+ \ emisores radicados en la Cordillera de los Andes \ny el Altiplano. Generalmente\
89
+ \ se presentan compactos y con algún grado de mitificación, de \nmanera que sus\
90
+ \ permeabilidades son habitualmente pequeñas, esto especialmente para el \ncaso\
91
+ \ de los depósitos terciarios que suelen tener alto grado de litificación y a\
92
+ \ menudo se \naprecian muy compactos y con características propias de rocas macizas."
93
+ - source_sentence: ¿Cuál es el talud del muro de confinamiento del depósito?
94
+ sentences:
95
+ - "Los antecedentes a evaluar por parte del SERNAGEOMIN, son: \nD.S. 248 de 2006\
96
+ \ del \nMin. de Minería y \nEnergía \nReglamento para la Aprobación de Proyectos\
97
+ \ de Diseño, Construcción, Operación y Cierre de los \nDepósitos de Relaves \n\
98
+ \ El EIA o DIA Indica la ubicación del Depósito, Incluyendo: \nARTICULO 14, LETRA\
99
+ \ c. \n- Plano Regulador de la comuna donde se ubicará el depósito, si lo hubiere,\
100
+ \ o plano de la \ncomuna o provincia. \n- Las Distancias al Concentrador y a los\
101
+ \ centros poblados cercanos. \n- Plano escala 1:2.500 de ubicación del depósito,\
102
+ \ señalando las coordenadas UTM. de sus \nprincipales vértices. \n- Ilustrar la\
103
+ \ hoya hidrológica afectada, sobre un plano a una escala adecuada, en coordenadas\
104
+ \ \nU.T.M. \nARTICULO 14, LETRA f. - Presentación de Antecedentes geológicos,\
105
+ \ Geotécnicos, Hidrológico, Hidrogeológico, Sísmicos, \nMetereológico, Topográfico.\
106
+ \ \nARTICULO 14, LETRA q. \n- Determinación de la distancia peligrosa, en kilómetros\
107
+ \ y análisis de la situación en terreno. \n- Plano de la hoya hidrológica afectada\
108
+ \ por la trayectoria más probable del relave en el evento \nde colapsar el depósito.\
109
+ \ \nARTICULO 14, LETRA r. - Medidas de Control, mitigación, restauración y compensación\
110
+ \ de los efectos de accidentes, \nsituaciones de emergencia y eventos naturales,\
111
+ \ según corresponda."
112
+ - "o Evaluar y diseñar un vertedero de emergencia y una conducción para la descarga\
113
+ \ de las \naguas que se acumulen en la cubeta, y que sobrepasen el pretil de protección.\
114
+ \ \nLa ingeniería de detalle de la estabilidad de los muros y considerados en\
115
+ \ el D.S. N° 132/04, se indica en el \nInforme Técnico de Estabilidad de Talud,\
116
+ \ incluido en el Anexo 3, del presente documento. \nII. Estabilidad de Taludes\
117
+ \ \no Verificar la estabilidad del muro de arena a través de método pseudoestático\
118
+ \ y post-sísmico \npara un coeficiente sísmico acorde al “Sismo Máximo Creíble”\
119
+ \ (Kh = 0,14). \no Indica que, en caso de existir bajos factores de seguridad,\
120
+ \ se tomarán medidas como tender \nel talud y/o colocar estructuras de contención\
121
+ \ mediante enrocados. \nIII. Construcción de Muro de Protección al Pie del Talud\
122
+ \ \no Contemplar un enrocado de protección en todo el sector donde hay gaviones.\
123
+ \ \no En el resto de los sectores del pie del muro de arena se contempla un muro\
124
+ \ de protección \nde enrocado de 2m de altura. \nPor otro lado, los aspectos\
125
+ \ técnicos señalados en el artículo 495 (Título X) del D.S. N° 132/04 y que forman\
126
+ \ \nparte de este documento, son:"
127
+ - "00 \n \n833,91 \n \n833,91 \nDisposición de estrato\
128
+ \ de suelo vegetal \nsobre la superficie y taludes del depósito \nCapa de 0,3\
129
+ \ metros de espesor sobre \nuna superficie de 50.400 m2 m3 \n15.481,20\
130
+ \ \n \n0,17 \n \n2.617,58 \nNivelación de la superficie\
131
+ \ del depósito \n(tipo \"domo\") \nNivelación en una superficie estimada \nde\
132
+ \ 51.604 m2 m2 \n51.604,00 \n \n0,01 \n \n\
133
+ 607,84 \nCierre de accesos Pretil de 1,5 m de altura y 3 m de \nextensión (2\
134
+ \ pretiles) m3 \n45,00 \n \n0,18 \n \
135
+ \ \n8,17 \nInstalación de señalética de advertencia 1 letrero por cada pretil\
136
+ \ de bloqueo de \naccesos (2) Unidad \n2,00 \n \
137
+ \ \n8,40 \n \n16,80 \nDepósito de \nripios N°3 \nLavado de ripios\
138
+ \ con agua Valor estimado en UF 1.959,1 \n(documento plan de cierre) gl \
139
+ \ \n1,00 \n \n1.959,10 \n \n1.959,10 \n \n\
140
+ 7.827,70 \nEstabilización de taludes Reperfilamiento de 1.330 metros \nlíneales\
141
+ \ x 5 metros de ancho de talud m2 \n6.650,00 \n \n\
142
+ 0,01 \n \n78,33 \nReparación del pretil de contención de \nderrames\
143
+ \ \nMantención y reparación durante la \nfase de cierre gl \n\
144
+ 1,00 \n \n502,97 \n \n502,97 \nDisposición de limos arcillosos\
145
+ \ sobre los \ntaludes y superficie del depósito \nCapa de 0,15 metros de espesor\
146
+ \ \nsobre una superficie de 50.400 m2 m3 \n7.560,00 \n \
147
+ \ \n0,17 \n \n1.278,25 \nCosto del material (limos) \nEstimación del\
148
+ \ costo del material a \nutilizar para el cubrimiento del \ndepósito \ngl \
149
+ \ \n1,"
150
+ - source_sentence: ¿Cuál es el ángulo de banco o de terraza del depósito de relaves
151
+ filtrado?
152
+ sentences:
153
+ - "SRK Consulting: 01-2028-64 Salares Norte Análisis de Estabilidad Botadero Sur\
154
+ \ y Depósito de Relaves Filtrados Página 14 \nAT/br SRK-GFCH74-FS-6100-CE-RP-0003_00P1\
155
+ \ mayo.18 \n8.4 Verificación de Distancia de Exclusión \n8.4.1 Distancia desde\
156
+ \ el pie del Depósito de Relaves Filtrados al Borde de la \nPlataforma-4432 del\
157
+ \ botadero sur \nEl diseño del depósito de relaves filtrados considera , en su\
158
+ \ configuración final , una distancia de \nexclusión de 90 m entre el pie d el\
159
+ \ relave y el borde de la plataforma -4432 del botadero Sur. Esta \ndistancia\
160
+ \ es considerada para evitar que cualquier falla del botadero sur afecte el comportamiento\
161
+ \ del \ndepósito de relaves filtrados. \nPara verificar la distancia de exclusión,\
162
+ \ se desarrollaron análisis de estabilidad específicos, los cuales \nconsideraron\
163
+ \ fallas globales que afectasen la plataforma -4432 del botadero Sur en una condición\
164
+ \ \nsísmica. El análisis consideró la sección más crítica (Sección 2) identificada\
165
+ \ en el capítulo anterior, \nademás, para asegurarse de que ninguna falla global\
166
+ \ del botadero Sur afecte al depósito de relaves, \nse utilizó el máximo sismo\
167
+ \ creíble ICOLD (Kh=0,16). \nLa Figura 8-3 presenta los resultados del análisis\
168
+ \ de estabilidad para el máximo sismo creíble ICOLD. \nEl análisis indica que\
169
+ \ con una zona de exclusión mayor o igual a 50 m, el criterio de diseño se cumple\
170
+ \ \n(FS>1,1). Por tanto, los 90 metros de distancia de exclusión ha sido verificada\
171
+ \ ante cualquier evento \nsísmico y el depósito de relaves filtrados no sería\
172
+ \ afectado ante una falla global de la plataforma-4432 \ndel botadero Sur. \n\
173
+ \ \n \nFigura 8-3."
174
+ - "46 \nb) Retiro de suelos contaminados \nEl monto estimado para el retiro de suelos\
175
+ \ contaminados incluye el traslado de la maquinaria \nnecesaria para el movimiento\
176
+ \ de tierra (retroexcavadora y camión) las HH/ hombre \ninvolucradas y el traslado\
177
+ \ y disposición final, de residuos peligrosos en lugares autorizados. \n Además,\
178
+ \ para el manejo adecuado de los eventuales los suelos impactados la empresa cuenta\
179
+ \ \ncon un sistema de gestión ambiental, el que considera que cada vez que ocurre\
180
+ \ algún derrame \nse informe de inmediato a las líneas de mando. Estas acciones\
181
+ \ serán reforzadas realizando \ncharlas de inducción específica. El manejo de\
182
+ \ estos sitios se realiza permanentemente, \nretirando los suelos y llevándolos\
183
+ \ a sitios autorizados. \n \nPrevio al cierre todas las zonas que eventualmente\
184
+ \ presenten estos suelos (debido a su retiro \npermanente que se realiza durante\
185
+ \ la operación de la faena, se estima que la superficie \nafectada será mínima).\
186
+ \ \n \nEn el cierre se realizará un delimitado de estas áreas y dependiendo del\
187
+ \ tamaño se realizará \ncon maquinaria o mediante palas. Para esto se extraerá\
188
+ \ la capa de 50 cm o más, y será tratada \ncomo residuo peligroso y trasladado\
189
+ \ a sitio autorizado. \n \nc) Instalación de señalética \n \nEl monto de la\
190
+ \ instalación de señalética incluye el diseño y la mano factura de la señalética,\
191
+ \ el \ntraslado de la señalética hasta el lugar de la instalación, el hormigón\
192
+ \ base (poyo) para la \ninstalación, y las HH/ hombre involucradas en su instalación."
193
+ - "1). \n4.2 Del Proyecto de Depósito de Relaves \n4.2.1 Definición \n\x7F Cierre:\
194
+ \ Hecho que el depósito de relaves deje de operar por un plazo mayor de dos años\
195
+ \ o en forma \ndefinitiva o cuando se da por terminada su vida útil y se han\
196
+ \ efectuado las acciones tendientes a \nasegurar la obra en el tiempo. \n\x7F\
197
+ \ Proyecto de Depósitos de Relaves: el conjunto de estudios técnicos requeridos\
198
+ \ para la definición de \nun sistema de disposición de relaves, incluyendo etapas\
199
+ \ de investigación, prospección, diseño, \nevaluación y construcción, cuyos resultados\
200
+ \ se encuentran en una serie de documentos que para \ngarantizar la estabilidad\
201
+ \ física y química del depósito y su entorno, con el fin de proteger a las \n\
202
+ personas, bienes y medio ambiente. (Art. 5). \n\x7F Cierre final: Conclusión\
203
+ \ definitiva de las actividades para el cierre de todas las labores,\
204
+ \ áreas \ne instalaciones de una unidad minera, que por razones operativas, no\
205
+ \ hayan podido cerrarse \ndurante la etapa productiva o comercial, de modo tal\
206
+ \ que se garantice el cumplimiento de los \nobjetivos de cierre contemplados\
207
+ \ en el Plan de Cierre de Minas aprobado y cuya adecuada \nejecución\
208
+ \ ha sido verificada a través de una auditoría integral dispuesta por\
209
+ \ la autoridad \ncompetente, sin perjuicio de las actividades de post cierre\
210
+ \ que deberán continuar ejecutándose en \nel marco de la legislación ambiental\
211
+ \ vigente. \n\x7F Estabilidad física: Comportamiento estable en el corto, mediano\
212
+ \ y largo plazo de los componentes o"
213
+ - source_sentence: ¿Cuál fue la vida útil estimada del Proyecto Reapertura Mina Guanaco
214
+ en 2009?
215
+ sentences:
216
+ - "Proyecto que finalmente no se materializó por parte \nde Amax Guanaco. \n \n\
217
+ En 1998 Compañía Minera Amax Guanaco es adquirida por Kinross Gold Corporation\
218
+ \ formando \nuna sociedad llamada Minera Kinam Guanaco. Las faenas de extracción\
219
+ \ fueron paralizadas ese \nmismo año manteniéndose sólo la irrigación de las pilas\
220
+ \ para extraer el mineral remanente, \nproceso que se detuvo en Julio de 2001.\
221
+ \ Entre esa fec ha y el año 2003 se continuó lavando las \npilas para extraer\
222
+ \ el cianuro remanente y durante los años ven ideros se mantuvo la recirculación\
223
+ \ \nde las soluciones (sin cianuro) para evaporar el agua retenida en las pilas.\
224
+ \ \n \nEn la actualidad Guanaco Compañía Minera SpA es la actual dueña de la\
225
+ \ faena. Guanaco es una \nfaena de la mediana minería ( de acuerdo a la modificación\
226
+ \ de la ley 20.551), la cual se encuentra \ndedicada a la explotación y procesamiento\
227
+ \ de minerales de oro y plata, a una tasa máxima de \nprocesamiento de 2000 tpd,\
228
+ \ de acuerdo a la Res.Nº992/2010 y Res N° 506/2013."
229
+ - "No obstante, se tendrá un ingreso restringido a personal dedicado a las \nactividades\
230
+ \ del control y mantención, mientras MLC continúe con sus actividades; \nx Se\
231
+ \ adoptarán medidas de control de emisiones de material particulado y erosión\
232
+ \ hídrica, tales \ncomo; forestación, malla corta vientos, malla tendida a nivel\
233
+ \ de suelo en el sector del tranque donde \nse producen mayores corrientes de\
234
+ \ aire. \nx Minimizar los requerimientos de mantención post cierre a un grado\
235
+ \ práctico, en relación a la \nmantención del canal perimetral y vigilancia para\
236
+ \ garantizar el acceso restringido mientras MLC \ncontinua sus actividades; \n\
237
+ x Dejar el canal de contorno asociado un periodo de retorno de 20 años; \nx Dejar\
238
+ \ las defensas ribereñas asociado un periodo de retorno de 10.000 años; \nx Verificar\
239
+ \ la estabilidad de los taludes del tranque. \nCon estos últimos, se logra controlar\
240
+ \ condiciones climáticas extremas, tales como: \nx Evitar el ingreso de las aguas\
241
+ \ lluvias provenientes desde las zonas aledañas exteriores al tranque y \nque\
242
+ \ constituyen una cuenca aportante a éste, conduciendo estas aguas mediante una\
243
+ \ canalización \nperimetral para finalmente descargar al río La Ligua. \nx Proteger\
244
+ \ el Tranque de Relave N°4 de las crecidas del río La Ligua. \nx Evacuar las aguas\
245
+ \ lluvias que ingresen al interior de la cubeta mediante un vertedero de \nemergencia.\
246
+ \ \nx Conducir las aguas desde el vertedero, mediante tuberías hasta una piscina\
247
+ \ de emergencia, la cual \ntiene como objetivo almacenar y retener este volumen\
248
+ \ para su evaporación."
249
+ - "B ORRA DOR \n \n \n \niv \n \nEn Mayo de 2008, Guanaco Compañía Minera sometió\
250
+ \ al Sistema de Evaluación de Impacto \nAmbiental el Proyecto Reapertura Mina\
251
+ \ Guanaco, el que fue evaluado por la COREMA Región de \nAntofagasta y calificado\
252
+ \ ambientalmente en forma favorable según consta en la Resolución Exenta \n0251/2009\
253
+ \ de fecha 15 de Julio de 2009. \n \nDicho Proyecto tuvo como objetivo la continuación\
254
+ \ de la explotación de depósitos minerales de oro \nsituados en formaciones adyacentes\
255
+ \ a la Mina Guanaco mediante el desarrollo de minas a cielo \nabierto y subterráneas\
256
+ \ para, posteriormente, procesar los minerales y obtener metal doré. La vida\
257
+ \ \nútil estimada del Proyecto Reapertura Mina Guanaco en 2009 ascendía a 10 incluyendo\
258
+ \ 1 año de \nconstrucción, con base en un ritmo de procesamiento del mineral\
259
+ \ de entre 750 a 2.000 tpd de \nmineral fresco de las minas tanto subterráneas\
260
+ \ como a rajo abierto. \n \nSe estimó que durante la vida útil del Proyecto, se\
261
+ \ removerían desde los rajos entre 2 y 3 millones \nde toneladas de material y\
262
+ \ otros 10 a 12 millones de toneladas de material provendrían de las \nminas subterráneas.\
263
+ \ Con ello el material total a remover sería del orden de las 12 a 15 millones\
264
+ \ \ntoneladas y el material estéril correspondería a 7 a 9 millones de toneladas.\
265
+ \ Dependiendo de la \ntasa de procesamiento del mineral la producción anual sería\
266
+ \ de aproximadamente de 100 a 150 mil \nonzas de plata y 100 mil onzas de oro\
267
+ \ contenidas en metal doré. \n \nEl proyecto de Reapertura estableció la utilización\
268
+ \ de sus antiguas instalaciones, complementadas \ncon los nuevos procesos implementados."
269
+ pipeline_tag: sentence-similarity
270
+ library_name: sentence-transformers
271
+ ---
272
+
273
+ # SentenceTransformer based on sentence-transformers/all-MiniLM-L6-v2
274
+
275
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/all-MiniLM-L6-v2](https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2) on the json dataset. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
276
+
277
+ ## Model Details
278
+
279
+ ### Model Description
280
+ - **Model Type:** Sentence Transformer
281
+ - **Base model:** [sentence-transformers/all-MiniLM-L6-v2](https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2) <!-- at revision fa97f6e7cb1a59073dff9e6b13e2715cf7475ac9 -->
282
+ - **Maximum Sequence Length:** 256 tokens
283
+ - **Output Dimensionality:** 384 dimensions
284
+ - **Similarity Function:** Cosine Similarity
285
+ - **Training Dataset:**
286
+ - json
287
+ <!-- - **Language:** Unknown -->
288
+ <!-- - **License:** Unknown -->
289
+
290
+ ### Model Sources
291
+
292
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
293
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
294
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
295
+
296
+ ### Full Model Architecture
297
+
298
+ ```
299
+ SentenceTransformer(
300
+ (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: BertModel
301
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
302
+ (2): Normalize()
303
+ )
304
+ ```
305
+
306
+ ## Usage
307
+
308
+ ### Direct Usage (Sentence Transformers)
309
+
310
+ First install the Sentence Transformers library:
311
+
312
+ ```bash
313
+ pip install -U sentence-transformers
314
+ ```
315
+
316
+ Then you can load this model and run inference.
317
+ ```python
318
+ from sentence_transformers import SentenceTransformer
319
+
320
+ # Download from the 🤗 Hub
321
+ model = SentenceTransformer("GbrlOl/finetune-embedding-all-MiniLM-L6-v2-geotechnical-test-v2")
322
+ # Run inference
323
+ sentences = [
324
+ '¿Cuál fue la vida útil estimada del Proyecto Reapertura Mina Guanaco en 2009?',
325
+ 'B ORRA DOR \n \n \n \niv \n \nEn Mayo de 2008, Guanaco Compañía Minera sometió al Sistema de Evaluación de Impacto \nAmbiental el Proyecto Reapertura Mina Guanaco, el que fue evaluado por la COREMA Región de \nAntofagasta y calificado ambientalmente en forma favorable según consta en la Resolución Exenta \n0251/2009 de fecha 15 de Julio de 2009. \n \nDicho Proyecto tuvo como objetivo la continuación de la explotación de depósitos minerales de oro \nsituados en formaciones adyacentes a la Mina Guanaco mediante el desarrollo de minas a cielo \nabierto y subterráneas para, posteriormente, procesar los minerales y obtener metal doré. La vida \nútil estimada del Proyecto Reapertura Mina Guanaco en 2009 ascendía a 10 incluyendo 1 año de \nconstrucción, con base en un ritmo de procesamiento del mineral de entre 750 a 2.000 tpd de \nmineral fresco de las minas tanto subterráneas como a rajo abierto. \n \nSe estimó que durante la vida útil del Proyecto, se removerían desde los rajos entre 2 y 3 millones \nde toneladas de material y otros 10 a 12 millones de toneladas de material provendrían de las \nminas subterráneas. Con ello el material total a remover sería del orden de las 12 a 15 millones \ntoneladas y el material estéril correspondería a 7 a 9 millones de toneladas. Dependiendo de la \ntasa de procesamiento del mineral la producción anual sería de aproximadamente de 100 a 150 mil \nonzas de plata y 100 mil onzas de oro contenidas en metal doré. \n \nEl proyecto de Reapertura estableció la utilización de sus antiguas instalaciones, complementadas \ncon los nuevos procesos implementados.',
326
+ 'Proyecto que finalmente no se materializó por parte \nde Amax Guanaco. \n \nEn 1998 Compañía Minera Amax Guanaco es adquirida por Kinross Gold Corporation formando \nuna sociedad llamada Minera Kinam Guanaco. Las faenas de extracción fueron paralizadas ese \nmismo año manteniéndose sólo la irrigación de las pilas para extraer el mineral remanente, \nproceso que se detuvo en Julio de 2001. Entre esa fec ha y el año 2003 se continuó lavando las \npilas para extraer el cianuro remanente y durante los años ven ideros se mantuvo la recirculación \nde las soluciones (sin cianuro) para evaporar el agua retenida en las pilas. \n \nEn la actualidad Guanaco Compañía Minera SpA es la actual dueña de la faena. Guanaco es una \nfaena de la mediana minería ( de acuerdo a la modificación de la ley 20.551), la cual se encuentra \ndedicada a la explotación y procesamiento de minerales de oro y plata, a una tasa máxima de \nprocesamiento de 2000 tpd, de acuerdo a la Res.Nº992/2010 y Res N° 506/2013.',
327
+ ]
328
+ embeddings = model.encode(sentences)
329
+ print(embeddings.shape)
330
+ # [3, 384]
331
+
332
+ # Get the similarity scores for the embeddings
333
+ similarities = model.similarity(embeddings, embeddings)
334
+ print(similarities.shape)
335
+ # [3, 3]
336
+ ```
337
+
338
+ <!--
339
+ ### Direct Usage (Transformers)
340
+
341
+ <details><summary>Click to see the direct usage in Transformers</summary>
342
+
343
+ </details>
344
+ -->
345
+
346
+ <!--
347
+ ### Downstream Usage (Sentence Transformers)
348
+
349
+ You can finetune this model on your own dataset.
350
+
351
+ <details><summary>Click to expand</summary>
352
+
353
+ </details>
354
+ -->
355
+
356
+ <!--
357
+ ### Out-of-Scope Use
358
+
359
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
360
+ -->
361
+
362
+ <!--
363
+ ## Bias, Risks and Limitations
364
+
365
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
366
+ -->
367
+
368
+ <!--
369
+ ### Recommendations
370
+
371
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
372
+ -->
373
+
374
+ ## Training Details
375
+
376
+ ### Training Dataset
377
+
378
+ #### json
379
+
380
+ * Dataset: json
381
+ * Size: 1,412 training samples
382
+ * Columns: <code>query</code>, <code>sentence</code>, and <code>label</code>
383
+ * Approximate statistics based on the first 1000 samples:
384
+ | | query | sentence | label |
385
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------|
386
+ | type | string | string | int |
387
+ | details | <ul><li>min: 9 tokens</li><li>mean: 25.89 tokens</li><li>max: 69 tokens</li></ul> | <ul><li>min: 54 tokens</li><li>mean: 237.63 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>0: ~54.60%</li><li>1: ~45.40%</li></ul> |
388
+ * Samples:
389
+ | query | sentence | label |
390
+ |:-----------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
391
+ | <code>¿Se utilizaron antecedentes geológicos?</code> | <code>B ORRA DOR <br> <br> <br> <br>iii <br> <br>La Mina Guanaco, está ubicada en la Comuna de Taltal, Provincia de Antofagasta, a 220 km al <br>sureste de la ciudad de la ciudad homónima, a una altitud cercana a los 2.700 msnm. <br> <br>Cuenta con seis minas donde el tipo de explotación es a rajo abierto y subterránea. Las minas que <br>componen las minas a rajo abierto son cuatro y corresponden a: “Defensa, Dumbo, Perseverancia <br>y Quillota”. Las minas subterráneas son dos y corresponden a “Cachinalito y Salvadora”. <br> <br>El distrito minero El Guanaco es conocido desde fine s del siglo pasado, cuando habitantes del <br>poblado de la Aguada de Ca chinal, que surtían agua a las minas de Cachinal de la Sierra, <br>descubrieron evidencias de mineralización aurífera en vetas de baritina. El mineral producido a <br>partir de 1886 fue tratado por amalgamación en Taltal. Hasta el año 1890, se habrían producido <br>más de 6.000 kg de oro, transportando la producción en ferrocarril que unía El Guanaco con Taltal. <br> <br>La mayor parte de la acti...</code> | <code>0</code> |
392
+ | <code>La compactación de los relaves filtrados es por Proctor Normal o Estándar, o Proctor Modificado?</code> | <code>Configuración intermedia del Botadero Sur y secciones para el análisis ...................................... 12 <br>Figura 8-3. Verificación de la distancia de exclusión, para un sismo máximo sismo creíble ICOLD (Depósito <br>de Relaves Filtrados y borde de la Plataforma-4432) ............................................................... 14 <br>Figura 8-4. Verificación de la distancia de exclusión, para un máximo sismo creíble del ICOLD (Acopio de <br>Mineral y Plataforma-4473) ........................................................................................................ 15 <br>Figura 8-5. Esquema de distancia de afectación en caso hipotético de falla del depósit o de relaves ............ 16 <br>Figura 8-6. Esquema de distancia de afectación en caso hipotético de falla del depósito de relaves y <br>botadero Sur .............................................................................................................................. 17 <br> <br>Apéndice <br>Apéndice A: Análisis de Estabilidad Config...</code> | <code>0</code> |
393
+ | <code>¿Cuál es el método de compactación del muro de embalse: proctor modificado, proctor normal o densidad relativa?</code> | <code>43 <br> <br> <br>6.1. Identificación de las Medidas de Cierre de las Instalaciones <br> <br>La identificación de medidas específicas que se realizarán se detalla en las tablas N° 34 y N° 35 <br>del presente Informe. <br> <br>Tabla 34. Identificación actividades de cierre del plan de cierre minero y RCA <br>RCA Instalación Compromisos <br>251/2009 <br>Equipos de Proceso <br>e Instalaciones <br>Auxiliares <br>Se retirarán todos los equipos de proceso, como el chancador, <br>correas transportadoras, tuberías de proceso, líneas eléctricas, <br>estanques de proceso, etc., en el caso de que estos no se <br>requieran para actividades o proyectos posteriores. <br>Se retirarán las estructuras y elementos arquitectónicos de los <br>edificios e instalaciones auxiliares si éstos crearan situaciones de <br>riesgo para las personas. El área del Proyecto se dejará libre de <br>chatarras y desechos que puedan constituir riesgos para las <br>personas. <br>Los terrenos alterados con rellenos o cortes para el <br>emplazamiento de edificios, piscinas de proceso e instalacio...</code> | <code>0</code> |
394
+ * Loss: [<code>CoSENTLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosentloss) with these parameters:
395
+ ```json
396
+ {
397
+ "scale": 20.0,
398
+ "similarity_fct": "pairwise_cos_sim"
399
+ }
400
+ ```
401
+
402
+ ### Training Hyperparameters
403
+ #### Non-Default Hyperparameters
404
+
405
+ - `per_device_train_batch_size`: 16
406
+ - `per_device_eval_batch_size`: 16
407
+ - `learning_rate`: 2e-05
408
+ - `num_train_epochs`: 100
409
+ - `warmup_ratio`: 0.1
410
+ - `fp16`: True
411
+ - `batch_sampler`: no_duplicates
412
+
413
+ #### All Hyperparameters
414
+ <details><summary>Click to expand</summary>
415
+
416
+ - `overwrite_output_dir`: False
417
+ - `do_predict`: False
418
+ - `eval_strategy`: no
419
+ - `prediction_loss_only`: True
420
+ - `per_device_train_batch_size`: 16
421
+ - `per_device_eval_batch_size`: 16
422
+ - `per_gpu_train_batch_size`: None
423
+ - `per_gpu_eval_batch_size`: None
424
+ - `gradient_accumulation_steps`: 1
425
+ - `eval_accumulation_steps`: None
426
+ - `torch_empty_cache_steps`: None
427
+ - `learning_rate`: 2e-05
428
+ - `weight_decay`: 0.0
429
+ - `adam_beta1`: 0.9
430
+ - `adam_beta2`: 0.999
431
+ - `adam_epsilon`: 1e-08
432
+ - `max_grad_norm`: 1.0
433
+ - `num_train_epochs`: 100
434
+ - `max_steps`: -1
435
+ - `lr_scheduler_type`: linear
436
+ - `lr_scheduler_kwargs`: {}
437
+ - `warmup_ratio`: 0.1
438
+ - `warmup_steps`: 0
439
+ - `log_level`: passive
440
+ - `log_level_replica`: warning
441
+ - `log_on_each_node`: True
442
+ - `logging_nan_inf_filter`: True
443
+ - `save_safetensors`: True
444
+ - `save_on_each_node`: False
445
+ - `save_only_model`: False
446
+ - `restore_callback_states_from_checkpoint`: False
447
+ - `no_cuda`: False
448
+ - `use_cpu`: False
449
+ - `use_mps_device`: False
450
+ - `seed`: 42
451
+ - `data_seed`: None
452
+ - `jit_mode_eval`: False
453
+ - `use_ipex`: False
454
+ - `bf16`: False
455
+ - `fp16`: True
456
+ - `fp16_opt_level`: O1
457
+ - `half_precision_backend`: auto
458
+ - `bf16_full_eval`: False
459
+ - `fp16_full_eval`: False
460
+ - `tf32`: None
461
+ - `local_rank`: 0
462
+ - `ddp_backend`: None
463
+ - `tpu_num_cores`: None
464
+ - `tpu_metrics_debug`: False
465
+ - `debug`: []
466
+ - `dataloader_drop_last`: False
467
+ - `dataloader_num_workers`: 0
468
+ - `dataloader_prefetch_factor`: None
469
+ - `past_index`: -1
470
+ - `disable_tqdm`: False
471
+ - `remove_unused_columns`: True
472
+ - `label_names`: None
473
+ - `load_best_model_at_end`: False
474
+ - `ignore_data_skip`: False
475
+ - `fsdp`: []
476
+ - `fsdp_min_num_params`: 0
477
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
478
+ - `fsdp_transformer_layer_cls_to_wrap`: None
479
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
480
+ - `deepspeed`: None
481
+ - `label_smoothing_factor`: 0.0
482
+ - `optim`: adamw_torch
483
+ - `optim_args`: None
484
+ - `adafactor`: False
485
+ - `group_by_length`: False
486
+ - `length_column_name`: length
487
+ - `ddp_find_unused_parameters`: None
488
+ - `ddp_bucket_cap_mb`: None
489
+ - `ddp_broadcast_buffers`: False
490
+ - `dataloader_pin_memory`: True
491
+ - `dataloader_persistent_workers`: False
492
+ - `skip_memory_metrics`: True
493
+ - `use_legacy_prediction_loop`: False
494
+ - `push_to_hub`: False
495
+ - `resume_from_checkpoint`: None
496
+ - `hub_model_id`: None
497
+ - `hub_strategy`: every_save
498
+ - `hub_private_repo`: None
499
+ - `hub_always_push`: False
500
+ - `gradient_checkpointing`: False
501
+ - `gradient_checkpointing_kwargs`: None
502
+ - `include_inputs_for_metrics`: False
503
+ - `include_for_metrics`: []
504
+ - `eval_do_concat_batches`: True
505
+ - `fp16_backend`: auto
506
+ - `push_to_hub_model_id`: None
507
+ - `push_to_hub_organization`: None
508
+ - `mp_parameters`:
509
+ - `auto_find_batch_size`: False
510
+ - `full_determinism`: False
511
+ - `torchdynamo`: None
512
+ - `ray_scope`: last
513
+ - `ddp_timeout`: 1800
514
+ - `torch_compile`: False
515
+ - `torch_compile_backend`: None
516
+ - `torch_compile_mode`: None
517
+ - `dispatch_batches`: None
518
+ - `split_batches`: None
519
+ - `include_tokens_per_second`: False
520
+ - `include_num_input_tokens_seen`: False
521
+ - `neftune_noise_alpha`: None
522
+ - `optim_target_modules`: None
523
+ - `batch_eval_metrics`: False
524
+ - `eval_on_start`: False
525
+ - `use_liger_kernel`: False
526
+ - `eval_use_gather_object`: False
527
+ - `average_tokens_across_devices`: False
528
+ - `prompts`: None
529
+ - `batch_sampler`: no_duplicates
530
+ - `multi_dataset_batch_sampler`: proportional
531
+
532
+ </details>
533
+
534
+ ### Training Logs
535
+ | Epoch | Step | Training Loss |
536
+ |:-------:|:----:|:-------------:|
537
+ | 2.7222 | 100 | 4.5637 |
538
+ | 5.4167 | 200 | 1.6848 |
539
+ | 8.1111 | 300 | 0.4771 |
540
+ | 10.8333 | 400 | 0.1894 |
541
+ | 13.5278 | 500 | 0.0413 |
542
+ | 16.2222 | 600 | 0.019 |
543
+ | 18.9444 | 700 | 0.0085 |
544
+ | 21.6389 | 800 | 0.0088 |
545
+ | 24.3333 | 900 | 0.0097 |
546
+ | 27.0278 | 1000 | 0.0 |
547
+ | 29.75 | 1100 | 0.0001 |
548
+ | 32.4444 | 1200 | 0.0 |
549
+ | 35.1389 | 1300 | 0.0 |
550
+ | 37.8611 | 1400 | 0.0 |
551
+ | 40.5556 | 1500 | 0.0 |
552
+ | 43.25 | 1600 | 0.0 |
553
+ | 45.9722 | 1700 | 0.0 |
554
+ | 48.6667 | 1800 | 0.0 |
555
+ | 51.3611 | 1900 | 0.0 |
556
+ | 54.0556 | 2000 | 0.0 |
557
+ | 56.7778 | 2100 | 0.0 |
558
+ | 59.4722 | 2200 | 0.0 |
559
+ | 62.1667 | 2300 | 0.0 |
560
+ | 64.8889 | 2400 | 0.0 |
561
+ | 67.5833 | 2500 | 0.0 |
562
+ | 70.2778 | 2600 | 0.0 |
563
+ | 73.0 | 2700 | 0.0 |
564
+ | 75.6944 | 2800 | 0.0 |
565
+ | 78.3889 | 2900 | 0.0 |
566
+ | 81.0833 | 3000 | 0.0 |
567
+ | 83.8056 | 3100 | 0.0 |
568
+ | 86.5 | 3200 | 0.0 |
569
+ | 89.1944 | 3300 | 0.0 |
570
+ | 91.9167 | 3400 | 0.0 |
571
+ | 94.6111 | 3500 | 0.0 |
572
+ | 97.3056 | 3600 | 0.0 |
573
+
574
+
575
+ ### Framework Versions
576
+ - Python: 3.10.16
577
+ - Sentence Transformers: 3.3.1
578
+ - Transformers: 4.48.1
579
+ - PyTorch: 2.5.1+cu124
580
+ - Accelerate: 1.3.0
581
+ - Datasets: 3.2.0
582
+ - Tokenizers: 0.21.0
583
+
584
+ ## Citation
585
+
586
+ ### BibTeX
587
+
588
+ #### Sentence Transformers
589
+ ```bibtex
590
+ @inproceedings{reimers-2019-sentence-bert,
591
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
592
+ author = "Reimers, Nils and Gurevych, Iryna",
593
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
594
+ month = "11",
595
+ year = "2019",
596
+ publisher = "Association for Computational Linguistics",
597
+ url = "https://arxiv.org/abs/1908.10084",
598
+ }
599
+ ```
600
+
601
+ #### CoSENTLoss
602
+ ```bibtex
603
+ @online{kexuefm-8847,
604
+ title={CoSENT: A more efficient sentence vector scheme than Sentence-BERT},
605
+ author={Su Jianlin},
606
+ year={2022},
607
+ month={Jan},
608
+ url={https://kexue.fm/archives/8847},
609
+ }
610
+ ```
611
+
612
+ <!--
613
+ ## Glossary
614
+
615
+ *Clearly define terms in order to be accessible across audiences.*
616
+ -->
617
+
618
+ <!--
619
+ ## Model Card Authors
620
+
621
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
622
+ -->
623
+
624
+ <!--
625
+ ## Model Card Contact
626
+
627
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
628
+ -->
config.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "embedding_finetune/checkpoint-3600",
3
+ "architectures": [
4
+ "BertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "gradient_checkpointing": false,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 384,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 1536,
14
+ "layer_norm_eps": 1e-12,
15
+ "max_position_embeddings": 512,
16
+ "model_type": "bert",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 6,
19
+ "pad_token_id": 0,
20
+ "position_embedding_type": "absolute",
21
+ "torch_dtype": "float32",
22
+ "transformers_version": "4.48.1",
23
+ "type_vocab_size": 2,
24
+ "use_cache": true,
25
+ "vocab_size": 30522
26
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.1",
4
+ "transformers": "4.48.1",
5
+ "pytorch": "2.5.1+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:2c070551a596f103df2c1811316767bd54b653673f0de67f05856b837760b371
3
+ size 90864192
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 256,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": {
3
+ "content": "[CLS]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "mask_token": {
10
+ "content": "[MASK]",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "[PAD]",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "sep_token": {
24
+ "content": "[SEP]",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "unk_token": {
31
+ "content": "[UNK]",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ }
37
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "100": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "101": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "102": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "103": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": false,
45
+ "cls_token": "[CLS]",
46
+ "do_basic_tokenize": true,
47
+ "do_lower_case": true,
48
+ "extra_special_tokens": {},
49
+ "mask_token": "[MASK]",
50
+ "max_length": 128,
51
+ "model_max_length": 256,
52
+ "never_split": null,
53
+ "pad_to_multiple_of": null,
54
+ "pad_token": "[PAD]",
55
+ "pad_token_type_id": 0,
56
+ "padding_side": "right",
57
+ "sep_token": "[SEP]",
58
+ "stride": 0,
59
+ "strip_accents": null,
60
+ "tokenize_chinese_chars": true,
61
+ "tokenizer_class": "BertTokenizer",
62
+ "truncation_side": "right",
63
+ "truncation_strategy": "longest_first",
64
+ "unk_token": "[UNK]"
65
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff