GbrlOl commited on
Commit
0bb50d5
·
verified ·
1 Parent(s): 591e5f6

Add new SentenceTransformer model

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,879 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:1622
8
+ - loss:CoSENTLoss
9
+ base_model: sentence-transformers/all-MiniLM-L6-v2
10
+ widget:
11
+ - source_sentence: ¿Qué tipo de actividades se realizarán con los trabajadores para
12
+ informar sobre los cambios que vienen en el programa de difusión?
13
+ sentences:
14
+ - "Plan de Cierre - Faena Minera Salares Norte | 111 \n \n \nFuente: SRK \nFigura\
15
+ \ 8-31: Distancia de Exclusión Entre el Pie del ROM STOCK y el Borde de la Plataforma\
16
+ \ 4.473 \n Características \nEl depósito de relaves consiste en un acopio de\
17
+ \ relaves previamente filtrados, los cuales serán depositados sobre la \nplataforma\
18
+ \ intermedia del botadero Sur (plataforma 4.432 m.s.n.m.), autosoportante que\
19
+ \ se construirá en capas de \nentre 30 a 40 c m compactadas mediante rodillo vibratorio,\
20
+ \ con un contenido de humedad menor al 20%. La base \ndel depósito de relaves\
21
+ \ filtrados, como son las laderas de los cerros y las superficies inclinadas\
22
+ \ del botadero sobre \nlas que se apoyará el relave serán impermeabi lizadas mediante\
23
+ \ una geomembrana que cubrirá aproximadamente \n533.672 m 2. La tasa de depositación\
24
+ \ promedio diaria de relaves es del o rden de 6 ktpd. Las características del\
25
+ \ \ndepósito de relaves se muestran a continuación. \nTabla 8-20: Características\
26
+ \ del Depósito de Relaves \nCaracterística Valor Aproximado Unidad \nVolumen 14,8\
27
+ \ Mm3 \nCapacidad Máxima 24,1 Mt \nCapacidad Proyectada 22,2 Mt \nSuperficie Máxima\
28
+ \ 54 ha \nSuperficie Proyectada 51,7 ha \nCota Máxima 4.472 m.s.n.m. \nCota Máxima\
29
+ \ Proyectada 4.469,2 m.s.n.m. \nCota Mínima 4.432 m.s.n.m."
30
+ - "A continuación se revisan los aspectos fundamentales que se han \nconsiderado\
31
+ \ con posterioridad al cese de operaciones del Depósito de Relaves Filtrados Doña\
32
+ \ Rosa. \n3.11.4.1. Normativa Aplicable Etapa de Cierre \nEl plan de cierre\
33
+ \ del depósito estará estructurado de manera tal de cumplir con la reglamentación\
34
+ \ legal \nvigente y aplicable en Chile, que regula los aspectos de seguridad e\
35
+ \ impacto ambiental, asociados al \nacopio o depositación de este tipo de residuos\
36
+ \ originados por tratamiento de minerales. En lo principal, la \nnormativa a considerar\
37
+ \ corresponde a los siguientes reglamentos: \n· Reglamento de Seguridad\
38
+ \ Minera \n· Decreto Supremo Nº594/1999 del Ministerio de Salud \n3.11.4.2.\
39
+ \ Obras a Realizar \nEn el presente punto se describen tanto las obras, como\
40
+ \ las actividades de control y mantenimiento de \nobras que incluirá el plan de\
41
+ \ cierre del Depósito de Relaves Filtrados Doña Rosa. Las obras estarán \ndestinadas\
42
+ \ a satisfacer los requerimientos normados conforme a la reglamentación legal\
43
+ \ vigente, y"
44
+ - "A nivel de público objetivo, la estrategia de implementación del programa de\
45
+ \ difusión considera lo siguiente: \n \na) Trabajadores \nAsambleas informativas\
46
+ \ con los trabajadores para informar en detalle sobre los cambios que vienen y\
47
+ \ que se \nhan socializado de manera paulatina. Se deberá hacer énfasis en todos\
48
+ \ los aspectos técnicos y operativos del \nPlan de Cierre. La información uno\
49
+ \ a uno debe ser abordada por la Gerencia de Recursos Humanos. \nb) Comunidad"
50
+ - source_sentence: ¿Cuál es la altura del muro de pie del depósito?
51
+ sentences:
52
+ - "40 \nTambién destaca la abundante riqueza de rapaces y en particular la abundancia\
53
+ \ de aguiluchos, \nque muestra una población dinámica, con diversos registros\
54
+ \ de eventos reproductivos como \nnidos, ejemplares volantones, juveniles y conductas\
55
+ \ de cortejo. \nDe las especies encontradas 12 se encuentran con problemas de\
56
+ \ conservación, destacando \nentre ellas como en Peligro de Extinción las especies\
57
+ \ de mamíferos Guanaco, Vicuña y \nVizcacha. \n \n5.1.9. Paisaje \n \nEl paisaje\
58
+ \ local está caracterizado por la infraestructura de caminos y faenas mineras\
59
+ \ elementos \nque definen la presencia del hombre en el área desde antaño. El\
60
+ \ paisaje natural de la zona está \ndominado por las condiciones físicas y biológicas\
61
+ \ de los sistemas desérticos de Atacama, es \ndecir aridez y ausencia casi absoluta\
62
+ \ de flora y fauna. En la zona no existen áreas declaradas \ncomo sitios de interés\
63
+ \ turístico o escénico. \n \n5.1.10. Riesgos naturales \n \nRespecto de los riesgos\
64
+ \ de remoción en masa se puede indicar que la zona en estudio \ncorresponde a\
65
+ \ una zona de depositación de antiguos mega aluviones cuyos efectos \ncorresponden\
66
+ \ hoy a la capa superior de sedimentos que conforman la superficie terrestre.\
67
+ \ \n \nEl riesgo por remoción en masa en la zona en estudio, es de carácter medio\
68
+ \ a bajo, capaz de \nser mitigado con obras civiles como encauzamientos, canalizaciones\
69
+ \ y zanjas de drenaje para \naguas lluvias, evitando socavaciones y facilitando\
70
+ \ el flujo de las aguas lluvias transformadas en \nescorrentías superficiales."
71
+ - "Plan de Cierre - Faena Minera Salares Norte | 95 \n \nTabla 8-13: Criterios\
72
+ \ para el Análisis de Estabilidad del Botadero Sur \nCondición FS Mínimo \nCorto\
73
+ \ Plazo \n(operacional) \nFalla Superficial Estático 1,0 \nSísmico (1) \nFalla\
74
+ \ Profunda Estático 1,5 \nSísmico 1,2 \nLargo Plazo \n(post-cierre) \nFalla Superficial\
75
+ \ Estático 1,1 \nSísmico (1) \nFalla Profunda Estático 1,5 \nSísmico 1,1 \n\
76
+ (1): El material es depositado me diante volteo de camiones y queda con su ángulo\
77
+ \ de reposo. Las fallas \nsuperficiales pueden ocurrir, pero las bermas de seguridad\
78
+ \ evitarán mayores deslizamientos de material. \nPara los análisis que involucren\
79
+ \ al depósito de relaves filtrados, ya sea por si solo o junto al botadero Sur,\
80
+ \ el factor \nde seguridad mínimo para el corto plazo es de 1,5 para casos estáticos\
81
+ \ y 1,2 para la condición sísmica. Para el largo \nplazo, en tanto, el factor\
82
+ \ de seguridad mínimo para la condición sísmica es de 1,1. \nLos factores de seguridad\
83
+ \ obtenidos de los análisis de estabilidad son presentados en la Tabla 8-14 y\
84
+ \ en la Tabla 8-15. \nTodos los análisis indican que; tanto el diseño del botadero\
85
+ \ Sur, como el diseño del depósito de relaves filtrados, por \nsí solos como en\
86
+ \ conjunto, cumplen con los diseños de criterios d e los factores de seguridad.\
87
+ \ \nLos análisis de fallas profundas han incorporado la determinación del factor\
88
+ \ de seguridad mínimo para fallas que \nimplican la totalidad del depósito, así\
89
+ \ como fallas que involucran 2 o 3 bancos, que pueden ser más críticos que \n\
90
+ aquellos que involucran la totalidad del depósito."
91
+ - "Los antecedentes a evaluar por parte del SERNAGEOMIN, son: \nD.S. 248 de 2006\
92
+ \ del \nMin. de Minería y \nEnergía \nReglamento para la Aprobación de Proyectos\
93
+ \ de Diseño, Construcción, Operación y Cierre de los \nDepósitos de Relaves \n\
94
+ \ El EIA o DIA Indica la ubicación del Depósito, Incluyendo: \nARTICULO 14, LETRA\
95
+ \ c. \n- Plano Regulador de la comuna donde se ubicará el depósito, si lo hubiere,\
96
+ \ o plano de la \ncomuna o provincia. \n- Las Distancias al Concentrador y a los\
97
+ \ centros poblados cercanos. \n- Plano escala 1:2.500 de ubicación del depósito,\
98
+ \ señalando las coordenadas UTM. de sus \nprincipales vértices. \n- Ilustrar la\
99
+ \ hoya hidrológica afectada, sobre un plano a una escala adecuada, en coordenadas\
100
+ \ \nU.T.M. \nARTICULO 14, LETRA f. - Presentación de Antecedentes geológicos,\
101
+ \ Geotécnicos, Hidrológico, Hidrogeológico, Sísmicos, \nMetereológico, Topográfico.\
102
+ \ \nARTICULO 14, LETRA q. \n- Determinación de la distancia peligrosa, en kilómetros\
103
+ \ y análisis de la situación en terreno. \n- Plano de la hoya hidrológica afectada\
104
+ \ por la trayectoria más probable del relave en el evento \nde colapsar el depósito.\
105
+ \ \nARTICULO 14, LETRA r. - Medidas de Control, mitigación, restauración y compensación\
106
+ \ de los efectos de accidentes, \nsituaciones de emergencia y eventos naturales,\
107
+ \ según corresponda."
108
+ - source_sentence: Indica la altura máxima del depósito
109
+ sentences:
110
+ - "El trabajo se realizará \nbásicamente con bulldozer y se estima una superficie\
111
+ \ a cubrir de 31.410 m 2 para el depósito N°1 y 51.604 m2 \npara el depósito N°2.\
112
+ \ \n \nv. Disposición de estrato de suelo vegetal sobre la superficie y taludes\
113
+ \ del depósito \nSe realizará la dispo sición de una capa de suelo vegetal de\
114
+ \ 0,3 metros de espesor en la superficie y taludes \nde los depósitos de ripios,\
115
+ \ lo que limitará la infiltración de aguas lluvia producto de precipitaciones.\
116
+ \ El \nmaterial a utilizar para la cobertura se extraerá de movimie ntos de tierra\
117
+ \ locales. El trabajo se realizará con \nmaquinaria convencional y se estima un\
118
+ \ volumen a cubrir para los de los depósitos de ripios N°1 y N°2, será \nde 9.423\
119
+ \ m3 y 15.481,2 m3 respectivamente. \n \nvi. Nivelación de la superficie del depósito\
120
+ \ \nSe realizará una nivelación de la superficie de los depósitos de ripios de\
121
+ \ modo de darles una terminación \ngeométrica tipo “domo” o “convexa” con el objeto\
122
+ \ de evitar la acumulación de aguas lluvia. Con la citada \nfigura, la superficie\
123
+ \ tendrá la capacidad de bombeo del agua acumulada hacia los taludes de los bancos\
124
+ \ para \nsu escurrimiento natural de evacuación hacia las canaletas recolectoras\
125
+ \ de soluciones y la piscina de \nsedimentación. Se estima una superficie a cubrir\
126
+ \ de 31.410 m 2 para el depósito N°1 y 51.604 m 2 para el \ndepósito N°2. \n\
127
+ \ \nvii. Cierre de accesos"
128
+ - "Para el control de la velocidad del agua en la descarga de la tubería, se ha\
129
+ \ considerado la inclusión de \ncámaras para provocar caídas que permiten disminuir\
130
+ \ la pendiente, con esto se logra controlar la velocidad \nmáxima a 5.5 m/s, además\
131
+ \ se contempla una estructura amortiguadora que genera un resalto contenido en\
132
+ \ \nella, para luego trasladar el flujo hacia una canaleta, la cual finalmente\
133
+ \ descarga en una piscina de \nemergencia que posee una capacidad de 3.000 m3,\
134
+ \ aproximadamente. \nPara un mayor detalle del diseño de las obras a proyectar,\
135
+ \ ver el apartado de Diseños Hidráulicos del \npresente informe y el Plano N°85_11382_H004_Piscina\
136
+ \ de Emergencia. \nBajo estas condiciones de diseño, se prevé el control total\
137
+ \ de las aguas lluvias provenientes desde el \nexterior de la cubeta como también\
138
+ \ de aquellas acumuladas por la precipitación directamente en ésta."
139
+ - "44 \nRCA Instalación Compromisos \nDepósito de \nRelaves Secos \nA los taludes\
140
+ \ y superficie del relave depositado se realizará un \ntratamiento de protección\
141
+ \ a través de la colocación de una capa \nde material grueso u otro material diseñado\
142
+ \ especialmente y \nadecuado para evitar la emisión de material particulado. Previo\
143
+ \ a \nello los taludes serán reperfilados, emparejándose en una \npendiente única,\
144
+ \ suave, que evite cualquier derrame o “chorreo” \nmenor y que facilite la posterior\
145
+ \ colocación de la cubierta \nprotectora mencionada anteriormente. Así mismo se\
146
+ \ ubicará \nseñalética que identifique la zona cubierta por el depósito de \n\
147
+ relave. \n0256/2010 Bodega de cianuro \nse procederá a desmantelar la infraestructura\
148
+ \ correspondiente a \nla bodega de almacenamiento de este producto, como parte\
149
+ \ del \ndesmantelamiento de otras unidades de la mina, plantas e \ninfraestructura\
150
+ \ de servicios de acuerdo a lo que se establezca en \nel Plan de Cierre. \n209/2012\
151
+ \ Rajo Quillota \n- La configuración final corresponderá a la del último año de\
152
+ \ \nexplotación. \n- Guanaco Compañía Minera analizará la seguridad final del\
153
+ \ rajo y \nbotadero Quillota, y adoptará las medidas técnicas que \ncorrespondan\
154
+ \ para otorgar estabilidad de largo plazo los bancos \ndel rajo y el sellado\
155
+ \ de todas las vías de acceso a éste. \n- Se instalarán señalizaciones referidas\
156
+ \ a las labores o sectores \n“cerrados”. \n- Asimismo, Guanaco Compañía Minera\
157
+ \ instalará las \nseñalizaciones necesarias previniendo sobre los posibles riesgos\
158
+ \ \nde ingreso al botadero y rajos. \n- Se estabilizarán los taludes en rajo y\
159
+ \ botadero Quillota."
160
+ - source_sentence: Indica si se utiliza Proctor Modificado, o Normal o Estándar para
161
+ compactar el relave filtrado, y cuál es el nivel de compactación
162
+ sentences:
163
+ - "Este programa incluiría \ndos inspecciones al año. Estas inspecciones se pueden\
164
+ \ integrar fácilmente a otras \nactividades de inspección y monitoreo continuas.\
165
+ \ También se anticipa que se necesitará \ninspección y/o reparaciones después\
166
+ \ de la ocurrencia de grandes crecidas. \nInforme Final \nComo parte del fin\
167
+ \ de las operaciones, se consulta elaborar un Informe Final de las condiciones\
168
+ \ de cierre \ndel depósito, conteniendo los aspectos técnicos fundamentales que\
169
+ \ se presentan a la fecha del cierre. Tal \ninforme contendrá al menos los siguientes\
170
+ \ aspectos: \n· Planos topográficos con registro de dimensiones y geometría\
171
+ \ final alcanzada. \n· Volumen de material almacenado. \n· Perfil\
172
+ \ de densidades y humedades del material depositado y consolidado en el depósito\
173
+ \ \nde relaves filtrados, de acuerdo a una campaña de exploraciones geotécnicas.\
174
+ \ \n· Estabilidad de las estructuras. \n3.11.4.3. Manejo de Residuos\
175
+ \ \nDurante la etapa de cierre se generarán residuos domiciliarios e industriales\
176
+ \ no peligrosos. El manejo de \nlos residuos se mantendrá de acuerdo con el Plan\
177
+ \ de Manejo de Residuos de SCMET."
178
+ - "x Desborde de Aguas lluvias, acumuladas en la cubeta del tranque, provenientes\
179
+ \ de zonas \naledañas y las que precipitan directamente sobre él. Teniendo en\
180
+ \ cuenta las siguientes \nexigencias para el Canal Perimetral; vale decir, que\
181
+ \ posea una capacidad suficiente para captar \naguas lluvias generadas en la cuenca\
182
+ \ aportante externa, asociadas a un periodo de retorno de 20 \naños, y con ello\
183
+ \ ser capaz de evitar el ingreso de estas aguas lluvias a la cubeta. Para este\
184
+ \ criterio y \nbajo las condiciones actuales, el canal no satisface estas exigencias\
185
+ \ (detallado en el Anexo 2, \nInforme Técnico Diseño Hidráulico). \n \nII. Estabilidad\
186
+ \ del Muro: \nx Estabilidad de talud del material de arena para condiciones estáticas\
187
+ \ y dinámicas. \nConsiderando los últimos antecedentes sísmicos y reglamentaciones,\
188
+ \ es necesario garantizar la \nestabilidad del muro . El análisis detallado se\
189
+ \ encuentra en el Anexo 3, Informe Técnico de \nEstabilidad de Talud, se emplean\
190
+ \ dos condiciones de carga: \nx Condición de Carga Estática. Considera sólo \
191
+ \ el estado tensional del material provocado \npor el peso propio. Además\
192
+ \ se incluyó en el modelo la acción de un posible nivel freático \nextremo; \n\
193
+ x Condición de Carga Sísmica. Se simula usando una aproximación pseudo-estática.\
194
+ \ Para un \nevento sísmico, la aceleración máxima se mantendrá por sólo una\
195
+ \ fracción de segundos. El \nanálisis pseudo-estático modela los eventos sísmicos\
196
+ \ conservadoramente con aceleración y \ndirección constantes, es decir, como un\
197
+ \ pulso infinito."
198
+ - "Configuración intermedia del Botadero Sur y secciones para el análisis ......................................\
199
+ \ 12 \nFigura 8-3. Verificación de la distancia de exclusión, para un sismo máximo\
200
+ \ sismo creíble ICOLD (Depósito \nde Relaves Filtrados y borde de la Plataforma-4432)\
201
+ \ ............................................................... 14 \nFigura\
202
+ \ 8-4. Verificación de la distancia de exclusión, para un máximo sismo creíble\
203
+ \ del ICOLD (Acopio de \nMineral y Plataforma-4473) ........................................................................................................\
204
+ \ 15 \nFigura 8-5. Esquema de distancia de afectación en caso hipotético de falla\
205
+ \ del depósit o de relaves ............ 16 \nFigura 8-6. Esquema de distancia\
206
+ \ de afectación en caso hipotético de falla del depósito de relaves y \nbotadero\
207
+ \ Sur ..............................................................................................................................\
208
+ \ 17 \n \nApéndice \nApéndice A: Análisis de Estabilidad Configuración Final \n\
209
+ Apéndice B: Análisis de Estabilidad Configuración Intermedia"
210
+ - source_sentence: ¿Cuál es el factor de seguridad mínimo para el corto plazo en caso
211
+ de falla superficial estática en el botadero Sur?
212
+ sentences:
213
+ - "Sin perjuicio de ello, en este \nplan de cierre temporal se ha hecho un análisis\
214
+ \ a nive l de juicio experto respecto de los riesgos \nque se indican en la siguiente\
215
+ \ tabla. \nTabla 3-3: Riesgos evaluados Instalaciones Complementarias y Auxiliares.\
216
+ \ \nInstalación Riesgos evaluados \nInstalaciones \nComplementarias \ny Auxiliares\
217
+ \ \nIA.1) Caída de Personas o animales a desnivel \nIA.2) Caída de objetos o materiales\
218
+ \ sobre personas o animales \nIA.3) Afectación a la salud de las personas por\
219
+ \ estructuras, \nmateriales y/o suelos contaminados \nFuente: Elaborado por MYMA,\
220
+ \ 2019 \n3.1 Evaluación de Riesgos \na) Evaluación de Riesgos previo a la definición\
221
+ \ de las medidas de cierre \nUna vez establecida la probabilidad de ocurrencia\
222
+ \ de los eventos y la severidad de las \nconsecuencias para las personas y el\
223
+ \ medio ambiente, se debe catalogar el límite de aceptabilidad \ndel riesgo."
224
+ - "Plan de Cierre - Faena Minera Salares Norte | 95 \n \nTabla 8-13: Criterios\
225
+ \ para el Análisis de Estabilidad del Botadero Sur \nCondición FS Mínimo \nCorto\
226
+ \ Plazo \n(operacional) \nFalla Superficial Estático 1,0 \nSísmico (1) \nFalla\
227
+ \ Profunda Estático 1,5 \nSísmico 1,2 \nLargo Plazo \n(post-cierre) \nFalla Superficial\
228
+ \ Estático 1,1 \nSísmico (1) \nFalla Profunda Estático 1,5 \nSísmico 1,1 \n\
229
+ (1): El material es depositado me diante volteo de camiones y queda con su ángulo\
230
+ \ de reposo. Las fallas \nsuperficiales pueden ocurrir, pero las bermas de seguridad\
231
+ \ evitarán mayores deslizamientos de material. \nPara los análisis que involucren\
232
+ \ al depósito de relaves filtrados, ya sea por si solo o junto al botadero Sur,\
233
+ \ el factor \nde seguridad mínimo para el corto plazo es de 1,5 para casos estáticos\
234
+ \ y 1,2 para la condición sísmica. Para el largo \nplazo, en tanto, el factor\
235
+ \ de seguridad mínimo para la condición sísmica es de 1,1. \nLos factores de seguridad\
236
+ \ obtenidos de los análisis de estabilidad son presentados en la Tabla 8-14 y\
237
+ \ en la Tabla 8-15. \nTodos los análisis indican que; tanto el diseño del botadero\
238
+ \ Sur, como el diseño del depósito de relaves filtrados, por \nsí solos como en\
239
+ \ conjunto, cumplen con los diseños de criterios d e los factores de seguridad.\
240
+ \ \nLos análisis de fallas profundas han incorporado la determinación del factor\
241
+ \ de seguridad mínimo para fallas que \nimplican la totalidad del depósito, así\
242
+ \ como fallas que involucran 2 o 3 bancos, que pueden ser más críticos que \n\
243
+ aquellos que involucran la totalidad del depósito."
244
+ - "El diseño del depósito de relaves filtrados considera, en su configuración final,\
245
+ \ una distancia de exclu sión de 90 m \nentre el pie del relave y el borde de\
246
+ \ la plataforma 4.432 del botadero Sur, tal como se muestra en la Figura 8-22.\
247
+ \ \nEsta distancia es considerada para evitar que cualquier falla del botadero\
248
+ \ sur afecte el comportamiento del depósito \nde relaves filtrados. \n \nFuente:\
249
+ \ SRK \nFigura 8-22: Distancia de Exclusión entre el Depósito de Relaves Filtrados\
250
+ \ y el borde de la Plataforma 4.432"
251
+ pipeline_tag: sentence-similarity
252
+ library_name: sentence-transformers
253
+ metrics:
254
+ - pearson_cosine
255
+ - spearman_cosine
256
+ - pearson_euclidean
257
+ - spearman_euclidean
258
+ - pearson_manhattan
259
+ - spearman_manhattan
260
+ - pearson_dot
261
+ - spearman_dot
262
+ - pearson_max
263
+ - spearman_max
264
+ - cosine_accuracy
265
+ - cosine_accuracy_threshold
266
+ - cosine_f1
267
+ - cosine_f1_threshold
268
+ - cosine_precision
269
+ - cosine_recall
270
+ - cosine_ap
271
+ - euclidean_accuracy
272
+ - euclidean_accuracy_threshold
273
+ - euclidean_f1
274
+ - euclidean_f1_threshold
275
+ - euclidean_precision
276
+ - euclidean_recall
277
+ - euclidean_ap
278
+ - manhattan_accuracy
279
+ - manhattan_accuracy_threshold
280
+ - manhattan_f1
281
+ - manhattan_f1_threshold
282
+ - manhattan_precision
283
+ - manhattan_recall
284
+ - manhattan_ap
285
+ - dot_accuracy
286
+ - dot_accuracy_threshold
287
+ - dot_f1
288
+ - dot_f1_threshold
289
+ - dot_precision
290
+ - dot_recall
291
+ - dot_ap
292
+ - max_accuracy
293
+ - max_accuracy_threshold
294
+ - max_f1
295
+ - max_f1_threshold
296
+ - max_precision
297
+ - max_recall
298
+ - max_ap
299
+ model-index:
300
+ - name: SentenceTransformer based on sentence-transformers/all-MiniLM-L6-v2
301
+ results:
302
+ - task:
303
+ type: semantic-similarity
304
+ name: Semantic Similarity
305
+ dataset:
306
+ name: sts dev
307
+ type: sts_dev
308
+ metrics:
309
+ - type: pearson_cosine
310
+ value: 0.5693948496372567
311
+ name: Pearson Cosine
312
+ - type: spearman_cosine
313
+ value: 0.5455714394030226
314
+ name: Spearman Cosine
315
+ - type: pearson_euclidean
316
+ value: 0.5739611056710028
317
+ name: Pearson Euclidean
318
+ - type: spearman_euclidean
319
+ value: 0.5455714394030226
320
+ name: Spearman Euclidean
321
+ - type: pearson_manhattan
322
+ value: 0.5797473609677822
323
+ name: Pearson Manhattan
324
+ - type: spearman_manhattan
325
+ value: 0.553447054259303
326
+ name: Spearman Manhattan
327
+ - type: pearson_dot
328
+ value: 0.5693948483606246
329
+ name: Pearson Dot
330
+ - type: spearman_dot
331
+ value: 0.5455714394030226
332
+ name: Spearman Dot
333
+ - type: pearson_max
334
+ value: 0.5797473609677822
335
+ name: Pearson Max
336
+ - type: spearman_max
337
+ value: 0.553447054259303
338
+ name: Spearman Max
339
+ - task:
340
+ type: binary-classification
341
+ name: Binary Classification
342
+ dataset:
343
+ name: quora duplicates dev
344
+ type: quora_duplicates_dev
345
+ metrics:
346
+ - type: cosine_accuracy
347
+ value: 0.7938461538461539
348
+ name: Cosine Accuracy
349
+ - type: cosine_accuracy_threshold
350
+ value: 0.5778889060020447
351
+ name: Cosine Accuracy Threshold
352
+ - type: cosine_f1
353
+ value: 0.696
354
+ name: Cosine F1
355
+ - type: cosine_f1_threshold
356
+ value: 0.5186799764633179
357
+ name: Cosine F1 Threshold
358
+ - type: cosine_precision
359
+ value: 0.7016129032258065
360
+ name: Cosine Precision
361
+ - type: cosine_recall
362
+ value: 0.6904761904761905
363
+ name: Cosine Recall
364
+ - type: cosine_ap
365
+ value: 0.8070386734063438
366
+ name: Cosine Ap
367
+ - type: euclidean_accuracy
368
+ value: 0.6153846153846154
369
+ name: Euclidean Accuracy
370
+ - type: euclidean_accuracy_threshold
371
+ value: -1.2038187980651855
372
+ name: Euclidean Accuracy Threshold
373
+ - type: euclidean_f1
374
+ value: 0.5555555555555556
375
+ name: Euclidean F1
376
+ - type: euclidean_f1_threshold
377
+ value: -0.5824911594390869
378
+ name: Euclidean F1 Threshold
379
+ - type: euclidean_precision
380
+ value: 0.38580246913580246
381
+ name: Euclidean Precision
382
+ - type: euclidean_recall
383
+ value: 0.9920634920634921
384
+ name: Euclidean Recall
385
+ - type: euclidean_ap
386
+ value: 0.2643967106429702
387
+ name: Euclidean Ap
388
+ - type: manhattan_accuracy
389
+ value: 0.6153846153846154
390
+ name: Manhattan Accuracy
391
+ - type: manhattan_accuracy_threshold
392
+ value: -18.68866729736328
393
+ name: Manhattan Accuracy Threshold
394
+ - type: manhattan_f1
395
+ value: 0.5555555555555556
396
+ name: Manhattan F1
397
+ - type: manhattan_f1_threshold
398
+ value: -9.128787994384766
399
+ name: Manhattan F1 Threshold
400
+ - type: manhattan_precision
401
+ value: 0.38580246913580246
402
+ name: Manhattan Precision
403
+ - type: manhattan_recall
404
+ value: 0.9920634920634921
405
+ name: Manhattan Recall
406
+ - type: manhattan_ap
407
+ value: 0.2631529584545813
408
+ name: Manhattan Ap
409
+ - type: dot_accuracy
410
+ value: 0.7938461538461539
411
+ name: Dot Accuracy
412
+ - type: dot_accuracy_threshold
413
+ value: 0.5778889060020447
414
+ name: Dot Accuracy Threshold
415
+ - type: dot_f1
416
+ value: 0.696
417
+ name: Dot F1
418
+ - type: dot_f1_threshold
419
+ value: 0.5186799764633179
420
+ name: Dot F1 Threshold
421
+ - type: dot_precision
422
+ value: 0.7016129032258065
423
+ name: Dot Precision
424
+ - type: dot_recall
425
+ value: 0.6904761904761905
426
+ name: Dot Recall
427
+ - type: dot_ap
428
+ value: 0.8070386734063438
429
+ name: Dot Ap
430
+ - type: max_accuracy
431
+ value: 0.7938461538461539
432
+ name: Max Accuracy
433
+ - type: max_accuracy_threshold
434
+ value: 0.5778889060020447
435
+ name: Max Accuracy Threshold
436
+ - type: max_f1
437
+ value: 0.696
438
+ name: Max F1
439
+ - type: max_f1_threshold
440
+ value: 0.5186799764633179
441
+ name: Max F1 Threshold
442
+ - type: max_precision
443
+ value: 0.7016129032258065
444
+ name: Max Precision
445
+ - type: max_recall
446
+ value: 0.9920634920634921
447
+ name: Max Recall
448
+ - type: max_ap
449
+ value: 0.8070386734063438
450
+ name: Max Ap
451
+ ---
452
+
453
+ # SentenceTransformer based on sentence-transformers/all-MiniLM-L6-v2
454
+
455
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/all-MiniLM-L6-v2](https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2) on the json dataset. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
456
+
457
+ ## Model Details
458
+
459
+ ### Model Description
460
+ - **Model Type:** Sentence Transformer
461
+ - **Base model:** [sentence-transformers/all-MiniLM-L6-v2](https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2) <!-- at revision fa97f6e7cb1a59073dff9e6b13e2715cf7475ac9 -->
462
+ - **Maximum Sequence Length:** 256 tokens
463
+ - **Output Dimensionality:** 384 dimensions
464
+ - **Similarity Function:** Cosine Similarity
465
+ - **Training Dataset:**
466
+ - json
467
+ <!-- - **Language:** Unknown -->
468
+ <!-- - **License:** Unknown -->
469
+
470
+ ### Model Sources
471
+
472
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
473
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
474
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
475
+
476
+ ### Full Model Architecture
477
+
478
+ ```
479
+ SentenceTransformer(
480
+ (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: BertModel
481
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
482
+ (2): Normalize()
483
+ )
484
+ ```
485
+
486
+ ## Usage
487
+
488
+ ### Direct Usage (Sentence Transformers)
489
+
490
+ First install the Sentence Transformers library:
491
+
492
+ ```bash
493
+ pip install -U sentence-transformers
494
+ ```
495
+
496
+ Then you can load this model and run inference.
497
+ ```python
498
+ from sentence_transformers import SentenceTransformer
499
+
500
+ # Download from the 🤗 Hub
501
+ model = SentenceTransformer("GbrlOl/finetune-embedding-all-MiniLM-L6-v2-geotechnical-test-v4")
502
+ # Run inference
503
+ sentences = [
504
+ '¿Cuál es el factor de seguridad mínimo para el corto plazo en caso de falla superficial estática en el botadero Sur?',
505
+ 'Plan de Cierre - Faena Minera Salares Norte | 95 \n \nTabla 8-13: Criterios para el Análisis de Estabilidad del Botadero Sur \nCondición FS Mínimo \nCorto Plazo \n(operacional) \nFalla Superficial Estático 1,0 \nSísmico (1) \nFalla Profunda Estático 1,5 \nSísmico 1,2 \nLargo Plazo \n(post-cierre) \nFalla Superficial Estático 1,1 \nSísmico (1) \nFalla Profunda Estático 1,5 \nSísmico 1,1 \n(1): El material es depositado me diante volteo de camiones y queda con su ángulo de reposo. Las fallas \nsuperficiales pueden ocurrir, pero las bermas de seguridad evitarán mayores deslizamientos de material. \nPara los análisis que involucren al depósito de relaves filtrados, ya sea por si solo o junto al botadero Sur, el factor \nde seguridad mínimo para el corto plazo es de 1,5 para casos estáticos y 1,2 para la condición sísmica. Para el largo \nplazo, en tanto, el factor de seguridad mínimo para la condición sísmica es de 1,1. \nLos factores de seguridad obtenidos de los análisis de estabilidad son presentados en la Tabla 8-14 y en la Tabla 8-15. \nTodos los análisis indican que; tanto el diseño del botadero Sur, como el diseño del depósito de relaves filtrados, por \nsí solos como en conjunto, cumplen con los diseños de criterios d e los factores de seguridad. \nLos análisis de fallas profundas han incorporado la determinación del factor de seguridad mínimo para fallas que \nimplican la totalidad del depósito, así como fallas que involucran 2 o 3 bancos, que pueden ser más críticos que \naquellos que involucran la totalidad del depósito.',
506
+ 'Sin perjuicio de ello, en este \nplan de cierre temporal se ha hecho un análisis a nive l de juicio experto respecto de los riesgos \nque se indican en la siguiente tabla. \nTabla 3-3: Riesgos evaluados Instalaciones Complementarias y Auxiliares. \nInstalación Riesgos evaluados \nInstalaciones \nComplementarias \ny Auxiliares \nIA.1) Caída de Personas o animales a desnivel \nIA.2) Caída de objetos o materiales sobre personas o animales \nIA.3) Afectación a la salud de las personas por estructuras, \nmateriales y/o suelos contaminados \nFuente: Elaborado por MYMA, 2019 \n3.1 Evaluación de Riesgos \na) Evaluación de Riesgos previo a la definición de las medidas de cierre \nUna vez establecida la probabilidad de ocurrencia de los eventos y la severidad de las \nconsecuencias para las personas y el medio ambiente, se debe catalogar el límite de aceptabilidad \ndel riesgo.',
507
+ ]
508
+ embeddings = model.encode(sentences)
509
+ print(embeddings.shape)
510
+ # [3, 384]
511
+
512
+ # Get the similarity scores for the embeddings
513
+ similarities = model.similarity(embeddings, embeddings)
514
+ print(similarities.shape)
515
+ # [3, 3]
516
+ ```
517
+
518
+ <!--
519
+ ### Direct Usage (Transformers)
520
+
521
+ <details><summary>Click to see the direct usage in Transformers</summary>
522
+
523
+ </details>
524
+ -->
525
+
526
+ <!--
527
+ ### Downstream Usage (Sentence Transformers)
528
+
529
+ You can finetune this model on your own dataset.
530
+
531
+ <details><summary>Click to expand</summary>
532
+
533
+ </details>
534
+ -->
535
+
536
+ <!--
537
+ ### Out-of-Scope Use
538
+
539
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
540
+ -->
541
+
542
+ ## Evaluation
543
+
544
+ ### Metrics
545
+
546
+ #### Semantic Similarity
547
+
548
+ * Dataset: `sts_dev`
549
+ * Evaluated with [<code>EmbeddingSimilarityEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.EmbeddingSimilarityEvaluator)
550
+
551
+ | Metric | Value |
552
+ |:-------------------|:-----------|
553
+ | pearson_cosine | 0.5694 |
554
+ | spearman_cosine | 0.5456 |
555
+ | pearson_euclidean | 0.574 |
556
+ | spearman_euclidean | 0.5456 |
557
+ | pearson_manhattan | 0.5797 |
558
+ | spearman_manhattan | 0.5534 |
559
+ | pearson_dot | 0.5694 |
560
+ | spearman_dot | 0.5456 |
561
+ | pearson_max | 0.5797 |
562
+ | **spearman_max** | **0.5534** |
563
+
564
+ #### Binary Classification
565
+
566
+ * Dataset: `quora_duplicates_dev`
567
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
568
+
569
+ | Metric | Value |
570
+ |:-----------------------------|:----------|
571
+ | cosine_accuracy | 0.7938 |
572
+ | cosine_accuracy_threshold | 0.5779 |
573
+ | cosine_f1 | 0.696 |
574
+ | cosine_f1_threshold | 0.5187 |
575
+ | cosine_precision | 0.7016 |
576
+ | cosine_recall | 0.6905 |
577
+ | cosine_ap | 0.807 |
578
+ | euclidean_accuracy | 0.6154 |
579
+ | euclidean_accuracy_threshold | -1.2038 |
580
+ | euclidean_f1 | 0.5556 |
581
+ | euclidean_f1_threshold | -0.5825 |
582
+ | euclidean_precision | 0.3858 |
583
+ | euclidean_recall | 0.9921 |
584
+ | euclidean_ap | 0.2644 |
585
+ | manhattan_accuracy | 0.6154 |
586
+ | manhattan_accuracy_threshold | -18.6887 |
587
+ | manhattan_f1 | 0.5556 |
588
+ | manhattan_f1_threshold | -9.1288 |
589
+ | manhattan_precision | 0.3858 |
590
+ | manhattan_recall | 0.9921 |
591
+ | manhattan_ap | 0.2632 |
592
+ | dot_accuracy | 0.7938 |
593
+ | dot_accuracy_threshold | 0.5779 |
594
+ | dot_f1 | 0.696 |
595
+ | dot_f1_threshold | 0.5187 |
596
+ | dot_precision | 0.7016 |
597
+ | dot_recall | 0.6905 |
598
+ | dot_ap | 0.807 |
599
+ | max_accuracy | 0.7938 |
600
+ | max_accuracy_threshold | 0.5779 |
601
+ | max_f1 | 0.696 |
602
+ | max_f1_threshold | 0.5187 |
603
+ | max_precision | 0.7016 |
604
+ | max_recall | 0.9921 |
605
+ | **max_ap** | **0.807** |
606
+
607
+ <!--
608
+ ## Bias, Risks and Limitations
609
+
610
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
611
+ -->
612
+
613
+ <!--
614
+ ### Recommendations
615
+
616
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
617
+ -->
618
+
619
+ ## Training Details
620
+
621
+ ### Training Dataset
622
+
623
+ #### json
624
+
625
+ * Dataset: json
626
+ * Size: 1,622 training samples
627
+ * Columns: <code>query</code>, <code>sentence</code>, and <code>label</code>
628
+ * Approximate statistics based on the first 1000 samples:
629
+ | | query | sentence | label |
630
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------|
631
+ | type | string | string | int |
632
+ | details | <ul><li>min: 9 tokens</li><li>mean: 25.34 tokens</li><li>max: 69 tokens</li></ul> | <ul><li>min: 54 tokens</li><li>mean: 233.59 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>0: ~59.70%</li><li>1: ~40.30%</li></ul> |
633
+ * Samples:
634
+ | query | sentence | label |
635
+ |:------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
636
+ | <code>Indica si se utiliza Proctor Modificado, o Normal o Estándar para compactar el relave filtrado, y cuál es el nivel de compactación</code> | <code>PLAN DE CIERRE TEMPO RAL – FAENA MINERA EL TOQUI <br> Sociedad Contractual Minera El Toqui <br>Capítulo 7 – Análisis de las Instalaciones <br> <br> <br>REVISIÓN [ 0] <br>7-107 <br> <br>Figura 7-38: Ubicación Parque Eólico <br> <br>Fuente: SCMET, 2018 <br>- Red de Abastecimiento de Energía : Está compuesta por todas las instalaciones utilizadas <br>para la distribución de la energía hacia todos los sectores de la faena, se compone de: <br>o Líneas de alta tensión: 30.000 metros lineales. <br>o Líneas de baja tensión: 2.000 metros lineales. <br>o Estaciones de combustible: Las minas que cuentan con estaciones de combustible <br>corresponden a Concordia, Estatuas, Doña Rosa. <br>o Subestaciones eléctricas: A continuación se presenta una tabla con las <br>subestaciones significativas y sus características. <br>o Sala eléctrica de la Planta de Procesos <br>o Subestación eléctrica TDR Confluencia (fue desmantelada).</code> | <code>0</code> |
637
+ | <code>¿Cuál es la ubicación del Pozo Monitoreos?</code> | <code>64 <br>Figura 5.42: Caminos internos de acceso (2) . 64 <br>Figura 5.43: Patio de RISES . 65 <br>Figura 5.44: Bodega de almacenamiento temporal de residuos peligrosos . 66 <br>Figura 5.45: Bodega de almacenamiento de residuos domésticos . 67 <br>Figura 5.46: Ubicación Pozo Monitoreos . 100 <br>Figura 5.47: Caminos internos Planta Catemu . 107 <br> <br>ANEXOS <br> <br>ANEXO A : . ANTECEDENTES LEGALES <br>ANEXO B : . RESOLUCIONES <br>ANEXO C: . PROPIEDAD MINERA <br>ANEXO D: . INFORME DE VIDA ÚTIL <br>ANEXO E: . PLANOS <br>ANEXO F: . EVALUACIÓN DE RIESGOS <br>ANEXO G: . PLANILLA DE VALORIZACIÓN <br>ANEXO H: . RESPALDO DE PRECIOS UNITARIOS <br>ANEXO I: . GARANTÍA FINANCIERA</code> | <code>1</code> |
638
+ | <code>se especifican antecedentes geofísicos?</code> | <code>Hay numerosas comunidades edáficas, una <br>de las cuales es el bosque de arrayán (Luma apiculata), de las orillas de ríos y lagos. <br>Considerando la clasificación de la vegetación natural de Chile de Gajardo (1993), las instalaciones <br>en cuestión se ubican en la formación del Bosque caducifolio de Aysén, que engloba básicamente <br>a bosques de lenga (Nothofagus pumilio), los que pueden encontrarse desde el sur de la X Región, <br>pero están representados en su forma característica en la XI Región. Son relativamente <br>homogéneos en composición florística y en su estructura, distribuyéndose en un ambiente con un <br>fuerte gradiente de precipitación de oeste a este, sobre un relieve de grandes variaciones en la <br>altitud. Ha sido muy afectado por la intervención humana, persistiendo su condición original <br>solamente en sectores locales. <br>Con relación a las especies de flora terrestre en categoría de conservación, en la undécima región <br>existen 2 especies que se encuentran incluidas en el listado naci...</code> | <code>0</code> |
639
+ * Loss: [<code>CoSENTLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosentloss) with these parameters:
640
+ ```json
641
+ {
642
+ "scale": 20.0,
643
+ "similarity_fct": "pairwise_cos_sim"
644
+ }
645
+ ```
646
+
647
+ ### Training Hyperparameters
648
+ #### Non-Default Hyperparameters
649
+
650
+ - `per_device_train_batch_size`: 16
651
+ - `per_device_eval_batch_size`: 16
652
+ - `learning_rate`: 2e-05
653
+ - `num_train_epochs`: 100
654
+ - `warmup_ratio`: 0.1
655
+ - `fp16`: True
656
+ - `batch_sampler`: no_duplicates
657
+
658
+ #### All Hyperparameters
659
+ <details><summary>Click to expand</summary>
660
+
661
+ - `overwrite_output_dir`: False
662
+ - `do_predict`: False
663
+ - `eval_strategy`: no
664
+ - `prediction_loss_only`: True
665
+ - `per_device_train_batch_size`: 16
666
+ - `per_device_eval_batch_size`: 16
667
+ - `per_gpu_train_batch_size`: None
668
+ - `per_gpu_eval_batch_size`: None
669
+ - `gradient_accumulation_steps`: 1
670
+ - `eval_accumulation_steps`: None
671
+ - `torch_empty_cache_steps`: None
672
+ - `learning_rate`: 2e-05
673
+ - `weight_decay`: 0.0
674
+ - `adam_beta1`: 0.9
675
+ - `adam_beta2`: 0.999
676
+ - `adam_epsilon`: 1e-08
677
+ - `max_grad_norm`: 1.0
678
+ - `num_train_epochs`: 100
679
+ - `max_steps`: -1
680
+ - `lr_scheduler_type`: linear
681
+ - `lr_scheduler_kwargs`: {}
682
+ - `warmup_ratio`: 0.1
683
+ - `warmup_steps`: 0
684
+ - `log_level`: passive
685
+ - `log_level_replica`: warning
686
+ - `log_on_each_node`: True
687
+ - `logging_nan_inf_filter`: True
688
+ - `save_safetensors`: True
689
+ - `save_on_each_node`: False
690
+ - `save_only_model`: False
691
+ - `restore_callback_states_from_checkpoint`: False
692
+ - `no_cuda`: False
693
+ - `use_cpu`: False
694
+ - `use_mps_device`: False
695
+ - `seed`: 42
696
+ - `data_seed`: None
697
+ - `jit_mode_eval`: False
698
+ - `use_ipex`: False
699
+ - `bf16`: False
700
+ - `fp16`: True
701
+ - `fp16_opt_level`: O1
702
+ - `half_precision_backend`: auto
703
+ - `bf16_full_eval`: False
704
+ - `fp16_full_eval`: False
705
+ - `tf32`: None
706
+ - `local_rank`: 0
707
+ - `ddp_backend`: None
708
+ - `tpu_num_cores`: None
709
+ - `tpu_metrics_debug`: False
710
+ - `debug`: []
711
+ - `dataloader_drop_last`: False
712
+ - `dataloader_num_workers`: 0
713
+ - `dataloader_prefetch_factor`: None
714
+ - `past_index`: -1
715
+ - `disable_tqdm`: False
716
+ - `remove_unused_columns`: True
717
+ - `label_names`: None
718
+ - `load_best_model_at_end`: False
719
+ - `ignore_data_skip`: False
720
+ - `fsdp`: []
721
+ - `fsdp_min_num_params`: 0
722
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
723
+ - `fsdp_transformer_layer_cls_to_wrap`: None
724
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
725
+ - `deepspeed`: None
726
+ - `label_smoothing_factor`: 0.0
727
+ - `optim`: adamw_torch
728
+ - `optim_args`: None
729
+ - `adafactor`: False
730
+ - `group_by_length`: False
731
+ - `length_column_name`: length
732
+ - `ddp_find_unused_parameters`: None
733
+ - `ddp_bucket_cap_mb`: None
734
+ - `ddp_broadcast_buffers`: False
735
+ - `dataloader_pin_memory`: True
736
+ - `dataloader_persistent_workers`: False
737
+ - `skip_memory_metrics`: True
738
+ - `use_legacy_prediction_loop`: False
739
+ - `push_to_hub`: False
740
+ - `resume_from_checkpoint`: None
741
+ - `hub_model_id`: None
742
+ - `hub_strategy`: every_save
743
+ - `hub_private_repo`: None
744
+ - `hub_always_push`: False
745
+ - `gradient_checkpointing`: False
746
+ - `gradient_checkpointing_kwargs`: None
747
+ - `include_inputs_for_metrics`: False
748
+ - `include_for_metrics`: []
749
+ - `eval_do_concat_batches`: True
750
+ - `fp16_backend`: auto
751
+ - `push_to_hub_model_id`: None
752
+ - `push_to_hub_organization`: None
753
+ - `mp_parameters`:
754
+ - `auto_find_batch_size`: False
755
+ - `full_determinism`: False
756
+ - `torchdynamo`: None
757
+ - `ray_scope`: last
758
+ - `ddp_timeout`: 1800
759
+ - `torch_compile`: False
760
+ - `torch_compile_backend`: None
761
+ - `torch_compile_mode`: None
762
+ - `dispatch_batches`: None
763
+ - `split_batches`: None
764
+ - `include_tokens_per_second`: False
765
+ - `include_num_input_tokens_seen`: False
766
+ - `neftune_noise_alpha`: None
767
+ - `optim_target_modules`: None
768
+ - `batch_eval_metrics`: False
769
+ - `eval_on_start`: False
770
+ - `use_liger_kernel`: False
771
+ - `eval_use_gather_object`: False
772
+ - `average_tokens_across_devices`: False
773
+ - `prompts`: None
774
+ - `batch_sampler`: no_duplicates
775
+ - `multi_dataset_batch_sampler`: proportional
776
+
777
+ </details>
778
+
779
+ ### Training Logs
780
+ | Epoch | Step | Training Loss | sts_dev_spearman_max | quora_duplicates_dev_max_ap |
781
+ |:-------:|:----:|:-------------:|:--------------------:|:---------------------------:|
782
+ | 0 | 0 | - | 0.5534 | 0.8070 |
783
+ | 2.3902 | 100 | 4.6587 | - | - |
784
+ | 4.7805 | 200 | 2.3234 | - | - |
785
+ | 7.1463 | 300 | 0.869 | - | - |
786
+ | 9.5366 | 400 | 0.2738 | - | - |
787
+ | 11.9268 | 500 | 0.328 | - | - |
788
+ | 14.2927 | 600 | 0.1296 | - | - |
789
+ | 16.6829 | 700 | 0.1233 | - | - |
790
+ | 19.0488 | 800 | 0.1024 | - | - |
791
+ | 21.4390 | 900 | 0.0337 | - | - |
792
+ | 23.8293 | 1000 | 0.0033 | - | - |
793
+ | 26.1951 | 1100 | 0.0508 | - | - |
794
+ | 28.5854 | 1200 | 0.0221 | - | - |
795
+ | 30.9756 | 1300 | 0.0167 | - | - |
796
+ | 33.3415 | 1400 | 0.0003 | - | - |
797
+ | 35.7317 | 1500 | 0.0 | - | - |
798
+ | 38.0976 | 1600 | 0.0 | - | - |
799
+ | 40.4878 | 1700 | 0.0 | - | - |
800
+ | 42.8780 | 1800 | 0.0 | - | - |
801
+ | 45.2439 | 1900 | 0.0 | - | - |
802
+ | 47.6341 | 2000 | 0.0 | - | - |
803
+ | 50.0244 | 2100 | 0.0 | - | - |
804
+ | 52.3902 | 2200 | 0.0 | - | - |
805
+ | 54.7805 | 2300 | 0.0 | - | - |
806
+ | 57.1463 | 2400 | 0.0 | - | - |
807
+ | 59.5366 | 2500 | 0.0 | - | - |
808
+ | 61.9268 | 2600 | 0.0 | - | - |
809
+ | 64.2927 | 2700 | 0.0 | - | - |
810
+ | 66.6829 | 2800 | 0.0 | - | - |
811
+ | 69.0488 | 2900 | 0.0 | - | - |
812
+ | 71.4390 | 3000 | 0.0 | - | - |
813
+ | 73.8293 | 3100 | 0.0 | - | - |
814
+ | 76.1951 | 3200 | 0.0 | - | - |
815
+ | 78.5854 | 3300 | 0.0 | - | - |
816
+ | 80.9756 | 3400 | 0.0 | - | - |
817
+ | 83.3415 | 3500 | 0.0 | - | - |
818
+ | 85.7317 | 3600 | 0.0 | - | - |
819
+ | 88.0976 | 3700 | 0.0 | - | - |
820
+ | 90.4878 | 3800 | 0.0 | - | - |
821
+ | 92.8780 | 3900 | 0.0 | - | - |
822
+ | 95.2439 | 4000 | 0.0 | - | - |
823
+ | 97.6341 | 4100 | 0.0 | - | - |
824
+
825
+
826
+ ### Framework Versions
827
+ - Python: 3.10.16
828
+ - Sentence Transformers: 3.3.1
829
+ - Transformers: 4.48.1
830
+ - PyTorch: 2.5.1+cu124
831
+ - Accelerate: 1.3.0
832
+ - Datasets: 3.2.0
833
+ - Tokenizers: 0.21.0
834
+
835
+ ## Citation
836
+
837
+ ### BibTeX
838
+
839
+ #### Sentence Transformers
840
+ ```bibtex
841
+ @inproceedings{reimers-2019-sentence-bert,
842
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
843
+ author = "Reimers, Nils and Gurevych, Iryna",
844
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
845
+ month = "11",
846
+ year = "2019",
847
+ publisher = "Association for Computational Linguistics",
848
+ url = "https://arxiv.org/abs/1908.10084",
849
+ }
850
+ ```
851
+
852
+ #### CoSENTLoss
853
+ ```bibtex
854
+ @online{kexuefm-8847,
855
+ title={CoSENT: A more efficient sentence vector scheme than Sentence-BERT},
856
+ author={Su Jianlin},
857
+ year={2022},
858
+ month={Jan},
859
+ url={https://kexue.fm/archives/8847},
860
+ }
861
+ ```
862
+
863
+ <!--
864
+ ## Glossary
865
+
866
+ *Clearly define terms in order to be accessible across audiences.*
867
+ -->
868
+
869
+ <!--
870
+ ## Model Card Authors
871
+
872
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
873
+ -->
874
+
875
+ <!--
876
+ ## Model Card Contact
877
+
878
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
879
+ -->
config.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "embedding_finetune/checkpoint-4100",
3
+ "architectures": [
4
+ "BertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "gradient_checkpointing": false,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 384,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 1536,
14
+ "layer_norm_eps": 1e-12,
15
+ "max_position_embeddings": 512,
16
+ "model_type": "bert",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 6,
19
+ "pad_token_id": 0,
20
+ "position_embedding_type": "absolute",
21
+ "torch_dtype": "float32",
22
+ "transformers_version": "4.48.1",
23
+ "type_vocab_size": 2,
24
+ "use_cache": true,
25
+ "vocab_size": 30522
26
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.1",
4
+ "transformers": "4.48.1",
5
+ "pytorch": "2.5.1+cu124"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:7c62983dff3444e6f424204b666eba368a3f164d4d496bce51c7a2d834233591
3
+ size 90864192
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 256,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": {
3
+ "content": "[CLS]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "mask_token": {
10
+ "content": "[MASK]",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "[PAD]",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "sep_token": {
24
+ "content": "[SEP]",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "unk_token": {
31
+ "content": "[UNK]",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ }
37
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "100": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "101": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "102": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "103": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": false,
45
+ "cls_token": "[CLS]",
46
+ "do_basic_tokenize": true,
47
+ "do_lower_case": true,
48
+ "extra_special_tokens": {},
49
+ "mask_token": "[MASK]",
50
+ "max_length": 128,
51
+ "model_max_length": 256,
52
+ "never_split": null,
53
+ "pad_to_multiple_of": null,
54
+ "pad_token": "[PAD]",
55
+ "pad_token_type_id": 0,
56
+ "padding_side": "right",
57
+ "sep_token": "[SEP]",
58
+ "stride": 0,
59
+ "strip_accents": null,
60
+ "tokenize_chinese_chars": true,
61
+ "tokenizer_class": "BertTokenizer",
62
+ "truncation_side": "right",
63
+ "truncation_strategy": "longest_first",
64
+ "unk_token": "[UNK]"
65
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff