ModernBERT-large trained on German RAG Pairs (GPU)
This is a Cross Encoder model finetuned from answerdotai/ModernBERT-large using the sentence-transformers library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.
Model Details
Model Description
- Model Type: Cross Encoder
- Base model: answerdotai/ModernBERT-large
- Maximum Sequence Length: 8192 tokens
- Number of Output Labels: 1 label
- Language: en
- License: apache-2.0
Model Sources
- Documentation: Sentence Transformers Documentation
- Documentation: Cross Encoder Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Cross Encoders on Hugging Face
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import CrossEncoder
# Download from the ๐ค Hub
model = CrossEncoder("sp-embraceable/reranker-ModernBERT-base-german-rag-triples")
# Get scores for pairs of texts
pairs = [
['Das nationale Statistikbรผro in England und Wales fรผhrt seit 1982 regelmรครige Viktimisierungsstudien durch. Die Ergebnisse zeigen einen Anstieg bis 1995 und seither einen Kriminalitรคtsrรผckgang.', 'England und Wales ist eine Region mit gemeinsamer Rechtsprechung innerhalb des Vereinigten Kรถnigreichs. Das nationale Statistikbรผro fรผhrt hier seit 1982 in regelmรครigen Abstรคnden Viktimisierungsstudien durch. Zufรคllig ausgewรคhlte Personen werden dabei befragt, ob und gegebenenfalls in welcher Form sie im vergangenen Jahr Kriminalitรคtsopfer geworden sind. Es zeigt sich ein Anstieg bis 1995 und seither ein Kriminalitรคtsrรผckgang. Das entspricht dem typischen Verlauf in einem Land der westlichen Welt.'],
['Das nationale Statistikbรผro in England und Wales fรผhrt seit 1982 regelmรครige Viktimisierungsstudien durch. Die Ergebnisse zeigen einen Anstieg bis 1995 und seither einen Kriminalitรคtsrรผckgang.', 'Auf subnationaler Ebene verfรผgt das Vereinigte Kรถnigreich รผber drei Rechtssysteme, die jeweils aus einem bestimmten geografischen Gebiet mit verschiedenen historischen Hintergrรผnden stammen: englisches Recht, schottisches Recht und nordirisches Recht. Seit 2007 besteht infolge der Verabschiedung des Government of Wales Act 2006 durch das Parlament des Vereinigten Kรถnigreichs auch rein walisisches Recht, das aber im Gegensatz zu den drei anderen kein eigenstรคndiges Rechtssystem an sich ist. Es handelt sich lediglich um das Primรคr- und Sekundรคrrecht, das von der Nationalversammlung fรผr Wales erstellt und gemรคร den Lehren des englischen Rechts ausgelegt wurde. Es hat keinen Einfluss auf das englische Common Law (es sei denn, ein solches Gesetz ersetzt eine Common-Law-Regel, weil es eine รผbergeordnete Rechtsform ist). Es besteht eine erhebliche รberschneidung zwischen diesen drei Rechtssystemen und den drei Gerichtsbarkeiten des Vereinigten Kรถnigreichs, nรคmlich England und Wales, Schottland und Nordirland. Jedes Rechtssystem ist standardmรครig jeder Gerichtsbarkeit unterworfen, und die Rechtssysteme der jeweiligen Rechtsordnungen unterstรผtzen das einschlรคgige Rechtssystem durch Rechtsprechung. Es sei jedoch darauf hingewiesen, dass im Privatrecht eine Person in bestimmten Rechtsordnungen das Recht anderer Rechtsordnungen in Anspruch nehmen kann, z. B. eine Gesellschaft in Edinburgh (Schottland) und eine Gesellschaft in Belfast (Nordirland), die nach englischem Recht Vertrรคge schlieรen kรถnnen. Dies ist im รถffentlichen Recht (z. B. im Strafrecht) nicht anwendbar, wenn in jeder Rechtsordnung eine Verfahrensordnung festgelegt ist. รbergeordnete sind Gesetze des Vereinigten Kรถnigreichs, die auch (seltener) als britisches Recht bezeichnet werden. Britisches Recht entsteht, wenn Gesetze fรผr das Vereinigte Kรถnigreich und / oder seine Bรผrger insgesamt gelten, am offensichtlichsten das Verfassungsrecht, aber auch andere Bereiche, beispielsweise das Steuerrecht.'],
['Das nationale Statistikbรผro in England und Wales fรผhrt seit 1982 regelmรครige Viktimisierungsstudien durch. Die Ergebnisse zeigen einen Anstieg bis 1995 und seither einen Kriminalitรคtsrรผckgang.', 'Eine Volkszรคhlung wird gleichzeitig in allen Teilen Groรbritanniens alle zehn Jahre durchgefรผhrt. Das Office for National Statistics sammelt die Daten in England und Wales. Fรผr Schottland ist die dortige Regierungsbehรถrde "National Records of Scotland" zustรคndig, fรผr Nordirland die "Northern Ireland Statistics and Research Agency".'],
['Das nationale Statistikbรผro in England und Wales fรผhrt seit 1982 regelmรครige Viktimisierungsstudien durch. Die Ergebnisse zeigen einen Anstieg bis 1995 und seither einen Kriminalitรคtsrรผckgang.', 'Eine Volkszรคhlung wird gleichzeitig in allen Teilen Groรbritanniens alle zehn Jahre durchgefรผhrt. Das Office for National Statistics sammelt die Daten in England und Wales. Fรผr Schottland ist die dortige Regierungsbehรถrde "National Records of Scotland" zustรคndig, fรผr Nordirland die "Northern Ireland Statistics and Research Agency".'],
['Das nationale Statistikbรผro in England und Wales fรผhrt seit 1982 regelmรครige Viktimisierungsstudien durch. Die Ergebnisse zeigen einen Anstieg bis 1995 und seither einen Kriminalitรคtsrรผckgang.', 'Ein Vorteil von Viktimisierungsstudien gegenรผber Polizeistatistiken ist, dass auch das Dunkelfeld betrachtet wird. Bei der Analyse langjรคhriger Trends kann sich jedoch der sich verรคndernde, gesellschaftliche Toleranzlevel verfรคlschend auswirken. Vor allem Fรคlle von Kรถrperverletzung und sexuelle รbergriffe werden heute eher als kriminell eingestuft als noch vor Jahrzehnten.'],
]
scores = model.predict(pairs)
print(scores.shape)
# (5,)
# Or rank different texts based on similarity to a single text
ranks = model.rank(
'Das nationale Statistikbรผro in England und Wales fรผhrt seit 1982 regelmรครige Viktimisierungsstudien durch. Die Ergebnisse zeigen einen Anstieg bis 1995 und seither einen Kriminalitรคtsrรผckgang.',
[
'England und Wales ist eine Region mit gemeinsamer Rechtsprechung innerhalb des Vereinigten Kรถnigreichs. Das nationale Statistikbรผro fรผhrt hier seit 1982 in regelmรครigen Abstรคnden Viktimisierungsstudien durch. Zufรคllig ausgewรคhlte Personen werden dabei befragt, ob und gegebenenfalls in welcher Form sie im vergangenen Jahr Kriminalitรคtsopfer geworden sind. Es zeigt sich ein Anstieg bis 1995 und seither ein Kriminalitรคtsrรผckgang. Das entspricht dem typischen Verlauf in einem Land der westlichen Welt.',
'Auf subnationaler Ebene verfรผgt das Vereinigte Kรถnigreich รผber drei Rechtssysteme, die jeweils aus einem bestimmten geografischen Gebiet mit verschiedenen historischen Hintergrรผnden stammen: englisches Recht, schottisches Recht und nordirisches Recht. Seit 2007 besteht infolge der Verabschiedung des Government of Wales Act 2006 durch das Parlament des Vereinigten Kรถnigreichs auch rein walisisches Recht, das aber im Gegensatz zu den drei anderen kein eigenstรคndiges Rechtssystem an sich ist. Es handelt sich lediglich um das Primรคr- und Sekundรคrrecht, das von der Nationalversammlung fรผr Wales erstellt und gemรคร den Lehren des englischen Rechts ausgelegt wurde. Es hat keinen Einfluss auf das englische Common Law (es sei denn, ein solches Gesetz ersetzt eine Common-Law-Regel, weil es eine รผbergeordnete Rechtsform ist). Es besteht eine erhebliche รberschneidung zwischen diesen drei Rechtssystemen und den drei Gerichtsbarkeiten des Vereinigten Kรถnigreichs, nรคmlich England und Wales, Schottland und Nordirland. Jedes Rechtssystem ist standardmรครig jeder Gerichtsbarkeit unterworfen, und die Rechtssysteme der jeweiligen Rechtsordnungen unterstรผtzen das einschlรคgige Rechtssystem durch Rechtsprechung. Es sei jedoch darauf hingewiesen, dass im Privatrecht eine Person in bestimmten Rechtsordnungen das Recht anderer Rechtsordnungen in Anspruch nehmen kann, z. B. eine Gesellschaft in Edinburgh (Schottland) und eine Gesellschaft in Belfast (Nordirland), die nach englischem Recht Vertrรคge schlieรen kรถnnen. Dies ist im รถffentlichen Recht (z. B. im Strafrecht) nicht anwendbar, wenn in jeder Rechtsordnung eine Verfahrensordnung festgelegt ist. รbergeordnete sind Gesetze des Vereinigten Kรถnigreichs, die auch (seltener) als britisches Recht bezeichnet werden. Britisches Recht entsteht, wenn Gesetze fรผr das Vereinigte Kรถnigreich und / oder seine Bรผrger insgesamt gelten, am offensichtlichsten das Verfassungsrecht, aber auch andere Bereiche, beispielsweise das Steuerrecht.',
'Eine Volkszรคhlung wird gleichzeitig in allen Teilen Groรbritanniens alle zehn Jahre durchgefรผhrt. Das Office for National Statistics sammelt die Daten in England und Wales. Fรผr Schottland ist die dortige Regierungsbehรถrde "National Records of Scotland" zustรคndig, fรผr Nordirland die "Northern Ireland Statistics and Research Agency".',
'Eine Volkszรคhlung wird gleichzeitig in allen Teilen Groรbritanniens alle zehn Jahre durchgefรผhrt. Das Office for National Statistics sammelt die Daten in England und Wales. Fรผr Schottland ist die dortige Regierungsbehรถrde "National Records of Scotland" zustรคndig, fรผr Nordirland die "Northern Ireland Statistics and Research Agency".',
'Ein Vorteil von Viktimisierungsstudien gegenรผber Polizeistatistiken ist, dass auch das Dunkelfeld betrachtet wird. Bei der Analyse langjรคhriger Trends kann sich jedoch der sich verรคndernde, gesellschaftliche Toleranzlevel verfรคlschend auswirken. Vor allem Fรคlle von Kรถrperverletzung und sexuelle รbergriffe werden heute eher als kriminell eingestuft als noch vor Jahrzehnten.',
]
)
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
Evaluation
Metrics
Cross Encoder Reranking
- Dataset:
german-rag-pairs-dev
- Evaluated with
CrossEncoderRerankingEvaluator
with these parameters:{ "at_k": 10, "always_rerank_positives": false }
Metric | Value |
---|---|
map | 1.0000 (+0.0000) |
mrr@10 | 1.0000 (+0.0000) |
ndcg@10 | 1.0000 (+0.0000) |
Cross Encoder Reranking
- Datasets:
NanoMSMARCO_R100
,NanoNFCorpus_R100
andNanoNQ_R100
- Evaluated with
CrossEncoderRerankingEvaluator
with these parameters:{ "at_k": 10, "always_rerank_positives": true }
Metric | NanoMSMARCO_R100 | NanoNFCorpus_R100 | NanoNQ_R100 |
---|---|---|---|
map | 0.0981 (-0.3914) | 0.3122 (+0.0512) | 0.3568 (-0.0628) |
mrr@10 | 0.0746 (-0.4029) | 0.4604 (-0.0394) | 0.3510 (-0.0757) |
ndcg@10 | 0.1689 (-0.3715) | 0.3286 (+0.0035) | 0.4064 (-0.0943) |
Cross Encoder Nano BEIR
- Dataset:
NanoBEIR_R100_mean
- Evaluated with
CrossEncoderNanoBEIREvaluator
with these parameters:{ "dataset_names": [ "msmarco", "nfcorpus", "nq" ], "rerank_k": 100, "at_k": 10, "always_rerank_positives": true }
Metric | Value |
---|---|
map | 0.2557 (-0.1343) |
mrr@10 | 0.2953 (-0.1727) |
ndcg@10 | 0.3013 (-0.1541) |
Training Details
Training Dataset
Unnamed Dataset
- Size: 54,000 training samples
- Columns:
question
,answer
, andlabel
- Approximate statistics based on the first 1000 samples:
question answer label type string string int details - min: 100 characters
- mean: 173.53 characters
- max: 544 characters
- min: 107 characters
- mean: 715.26 characters
- max: 3589 characters
- 0: ~83.30%
- 1: ~16.70%
- Samples:
question answer label Das nationale Statistikbรผro in England und Wales fรผhrt seit 1982 regelmรครige Viktimisierungsstudien durch. Die Ergebnisse zeigen einen Anstieg bis 1995 und seither einen Kriminalitรคtsrรผckgang.
England und Wales ist eine Region mit gemeinsamer Rechtsprechung innerhalb des Vereinigten Kรถnigreichs. Das nationale Statistikbรผro fรผhrt hier seit 1982 in regelmรครigen Abstรคnden Viktimisierungsstudien durch. Zufรคllig ausgewรคhlte Personen werden dabei befragt, ob und gegebenenfalls in welcher Form sie im vergangenen Jahr Kriminalitรคtsopfer geworden sind. Es zeigt sich ein Anstieg bis 1995 und seither ein Kriminalitรคtsrรผckgang. Das entspricht dem typischen Verlauf in einem Land der westlichen Welt.
1
Das nationale Statistikbรผro in England und Wales fรผhrt seit 1982 regelmรครige Viktimisierungsstudien durch. Die Ergebnisse zeigen einen Anstieg bis 1995 und seither einen Kriminalitรคtsrรผckgang.
Auf subnationaler Ebene verfรผgt das Vereinigte Kรถnigreich รผber drei Rechtssysteme, die jeweils aus einem bestimmten geografischen Gebiet mit verschiedenen historischen Hintergrรผnden stammen: englisches Recht, schottisches Recht und nordirisches Recht. Seit 2007 besteht infolge der Verabschiedung des Government of Wales Act 2006 durch das Parlament des Vereinigten Kรถnigreichs auch rein walisisches Recht, das aber im Gegensatz zu den drei anderen kein eigenstรคndiges Rechtssystem an sich ist. Es handelt sich lediglich um das Primรคr- und Sekundรคrrecht, das von der Nationalversammlung fรผr Wales erstellt und gemรคร den Lehren des englischen Rechts ausgelegt wurde. Es hat keinen Einfluss auf das englische Common Law (es sei denn, ein solches Gesetz ersetzt eine Common-Law-Regel, weil es eine รผbergeordnete Rechtsform ist). Es besteht eine erhebliche รberschneidung zwischen diesen drei Rechtssystemen und den drei Gerichtsbarkeiten des Vereinigten Kรถnigreichs, nรคmlich England und Wales, Schottlan...
0
Das nationale Statistikbรผro in England und Wales fรผhrt seit 1982 regelmรครige Viktimisierungsstudien durch. Die Ergebnisse zeigen einen Anstieg bis 1995 und seither einen Kriminalitรคtsrรผckgang.
Eine Volkszรคhlung wird gleichzeitig in allen Teilen Groรbritanniens alle zehn Jahre durchgefรผhrt. Das Office for National Statistics sammelt die Daten in England und Wales. Fรผr Schottland ist die dortige Regierungsbehรถrde "National Records of Scotland" zustรคndig, fรผr Nordirland die "Northern Ireland Statistics and Research Agency".
0
- Loss:
BinaryCrossEntropyLoss
with these parameters:{ "activation_fn": "torch.nn.modules.linear.Identity", "pos_weight": 5.0 }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: stepsper_device_train_batch_size
: 1per_device_eval_batch_size
: 1learning_rate
: 2e-05num_train_epochs
: 1warmup_ratio
: 0.1bf16
: Truedataloader_num_workers
: 8dataloader_prefetch_factor
: 2remove_unused_columns
: Falseload_best_model_at_end
: True
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 1per_device_eval_batch_size
: 1per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 2e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 1max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Truefp16
: Falsefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 8dataloader_prefetch_factor
: 2past_index
: -1disable_tqdm
: Falseremove_unused_columns
: Falselabel_names
: Noneload_best_model_at_end
: Trueignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsehub_revision
: Nonegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseliger_kernel_config
: Noneeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: batch_samplermulti_dataset_batch_sampler
: proportionalrouter_mapping
: {}learning_rate_mapping
: {}
Training Logs
Click to expand
Epoch | Step | Training Loss | german-rag-pairs-dev_ndcg@10 | NanoMSMARCO_R100_ndcg@10 | NanoNFCorpus_R100_ndcg@10 | NanoNQ_R100_ndcg@10 | NanoBEIR_R100_mean_ndcg@10 |
---|---|---|---|---|---|---|---|
-1 | -1 | - | 0.5623 (-0.4377) | 0.0316 (-0.5088) | 0.2276 (-0.0975) | 0.0220 (-0.4786) | 0.0937 (-0.3616) |
0.0000 | 1 | 4.3021 | - | - | - | - | - |
0.0019 | 100 | 1.1885 | - | - | - | - | - |
0.0037 | 200 | 5.2748 | - | - | - | - | - |
0.0056 | 300 | 5.1335 | - | - | - | - | - |
0.0074 | 400 | 5.2304 | - | - | - | - | - |
0.0093 | 500 | 6.2023 | - | - | - | - | - |
0.0111 | 600 | 5.8409 | - | - | - | - | - |
0.0130 | 700 | 6.0427 | - | - | - | - | - |
0.0148 | 800 | 4.8947 | - | - | - | - | - |
0.0167 | 900 | 3.074 | - | - | - | - | - |
0.0185 | 1000 | 2.7722 | 1.0000 (+0.0000) | 0.0503 (-0.4902) | 0.2383 (-0.0867) | 0.0885 (-0.4121) | 0.1257 (-0.3297) |
0.0204 | 1100 | 1.8631 | - | - | - | - | - |
0.0222 | 1200 | 1.6925 | - | - | - | - | - |
0.0241 | 1300 | 3.6154 | - | - | - | - | - |
0.0259 | 1400 | 1.1883 | - | - | - | - | - |
0.0278 | 1500 | 1.4043 | - | - | - | - | - |
0.0296 | 1600 | 2.0894 | - | - | - | - | - |
0.0315 | 1700 | 1.3738 | - | - | - | - | - |
0.0333 | 1800 | 0.5864 | - | - | - | - | - |
0.0352 | 1900 | 1.7528 | - | - | - | - | - |
0.0370 | 2000 | 1.1739 | 0.9963 (-0.0037) | 0.0439 (-0.4965) | 0.2848 (-0.0402) | 0.0891 (-0.4115) | 0.1393 (-0.3161) |
0.0389 | 2100 | 1.7272 | - | - | - | - | - |
0.0407 | 2200 | 1.4319 | - | - | - | - | - |
0.0426 | 2300 | 1.9913 | - | - | - | - | - |
0.0444 | 2400 | 1.1184 | - | - | - | - | - |
0.0463 | 2500 | 0.3488 | - | - | - | - | - |
0.0481 | 2600 | 0.6489 | - | - | - | - | - |
0.05 | 2700 | 0.4085 | - | - | - | - | - |
0.0519 | 2800 | 0.0606 | - | - | - | - | - |
0.0537 | 2900 | 1.6928 | - | - | - | - | - |
0.0556 | 3000 | 0.8008 | 1.0000 (+0.0000) | 0.0563 (-0.4841) | 0.3030 (-0.0221) | 0.0675 (-0.4331) | 0.1423 (-0.3131) |
0.0574 | 3100 | 0.6568 | - | - | - | - | - |
0.0593 | 3200 | 0.6588 | - | - | - | - | - |
0.0611 | 3300 | 1.4152 | - | - | - | - | - |
0.0630 | 3400 | 0.0529 | - | - | - | - | - |
0.0648 | 3500 | 2.5332 | - | - | - | - | - |
0.0667 | 3600 | 1.4062 | - | - | - | - | - |
0.0685 | 3700 | 0.6283 | - | - | - | - | - |
0.0704 | 3800 | 1.1986 | - | - | - | - | - |
0.0722 | 3900 | 0.7668 | - | - | - | - | - |
0.0741 | 4000 | 0.0403 | 0.9950 (-0.0050) | 0.0331 (-0.5073) | 0.3004 (-0.0247) | 0.0394 (-0.4612) | 0.1243 (-0.3311) |
0.0759 | 4100 | 0.7771 | - | - | - | - | - |
0.0778 | 4200 | 0.9136 | - | - | - | - | - |
0.0796 | 4300 | 0.9788 | - | - | - | - | - |
0.0815 | 4400 | 2.4502 | - | - | - | - | - |
0.0833 | 4500 | 1.2502 | - | - | - | - | - |
0.0852 | 4600 | 0.452 | - | - | - | - | - |
0.0870 | 4700 | 0.9595 | - | - | - | - | - |
0.0889 | 4800 | 0.6621 | - | - | - | - | - |
0.0907 | 4900 | 1.178 | - | - | - | - | - |
0.0926 | 5000 | 0.038 | 1.0000 (+0.0000) | 0.0628 (-0.4776) | 0.3105 (-0.0146) | 0.1265 (-0.3742) | 0.1666 (-0.2888) |
0.0944 | 5100 | 0.8502 | - | - | - | - | - |
0.0963 | 5200 | 1.1598 | - | - | - | - | - |
0.0981 | 5300 | 1.2122 | - | - | - | - | - |
0.1 | 5400 | 0.9846 | - | - | - | - | - |
0.1019 | 5500 | 1.2905 | - | - | - | - | - |
0.1037 | 5600 | 2.0998 | - | - | - | - | - |
0.1056 | 5700 | 3.9234 | - | - | - | - | - |
0.1074 | 5800 | 4.8346 | - | - | - | - | - |
0.1093 | 5900 | 1.7315 | - | - | - | - | - |
0.1111 | 6000 | 1.0496 | 1.0000 (+0.0000) | 0.1427 (-0.3977) | 0.3484 (+0.0233) | 0.2902 (-0.2104) | 0.2604 (-0.1949) |
0.1130 | 6100 | 0.7321 | - | - | - | - | - |
0.1148 | 6200 | 0.6902 | - | - | - | - | - |
0.1167 | 6300 | 0.5469 | - | - | - | - | - |
0.1185 | 6400 | 0.9661 | - | - | - | - | - |
0.1204 | 6500 | 0.1213 | - | - | - | - | - |
0.1222 | 6600 | 1.0769 | - | - | - | - | - |
0.1241 | 6700 | 0.0001 | - | - | - | - | - |
0.1259 | 6800 | 0.1057 | - | - | - | - | - |
0.1278 | 6900 | 1.289 | - | - | - | - | - |
0.1296 | 7000 | 0.0016 | 1.0000 (+0.0000) | 0.1348 (-0.4056) | 0.3300 (+0.0049) | 0.3300 (-0.1706) | 0.2649 (-0.1904) |
0.1315 | 7100 | 0.0643 | - | - | - | - | - |
0.1333 | 7200 | 1.6014 | - | - | - | - | - |
0.1352 | 7300 | 1.0498 | - | - | - | - | - |
0.1370 | 7400 | 0.4898 | - | - | - | - | - |
0.1389 | 7500 | 1.1628 | - | - | - | - | - |
0.1407 | 7600 | 0.6333 | - | - | - | - | - |
0.1426 | 7700 | 0.146 | - | - | - | - | - |
0.1444 | 7800 | 0.9649 | - | - | - | - | - |
0.1463 | 7900 | 1.1158 | - | - | - | - | - |
0.1481 | 8000 | 1.1825 | 1.0000 (+0.0000) | 0.1039 (-0.4365) | 0.3441 (+0.0191) | 0.3031 (-0.1976) | 0.2504 (-0.2050) |
0.15 | 8100 | 2.15 | - | - | - | - | - |
0.1519 | 8200 | 0.8249 | - | - | - | - | - |
0.1537 | 8300 | 0.8459 | - | - | - | - | - |
0.1556 | 8400 | 0.9752 | - | - | - | - | - |
0.1574 | 8500 | 0.7666 | - | - | - | - | - |
0.1593 | 8600 | 0.0923 | - | - | - | - | - |
0.1611 | 8700 | 0.7894 | - | - | - | - | - |
0.1630 | 8800 | 0.896 | - | - | - | - | - |
0.1648 | 8900 | 1.1078 | - | - | - | - | - |
0.1667 | 9000 | 0.0889 | 1.0000 (+0.0000) | 0.1149 (-0.4255) | 0.3179 (-0.0072) | 0.3777 (-0.1230) | 0.2702 (-0.1852) |
0.1685 | 9100 | 1.0394 | - | - | - | - | - |
0.1704 | 9200 | 0.1387 | - | - | - | - | - |
0.1722 | 9300 | 0.6101 | - | - | - | - | - |
0.1741 | 9400 | 1.2641 | - | - | - | - | - |
0.1759 | 9500 | 2.3179 | - | - | - | - | - |
0.1778 | 9600 | 0.8498 | - | - | - | - | - |
0.1796 | 9700 | 0.3892 | - | - | - | - | - |
0.1815 | 9800 | 1.136 | - | - | - | - | - |
0.1833 | 9900 | 0.1143 | - | - | - | - | - |
0.1852 | 10000 | 0.6984 | 1.0000 (+0.0000) | 0.0889 (-0.4515) | 0.3157 (-0.0093) | 0.2872 (-0.2135) | 0.2306 (-0.2248) |
0.1870 | 10100 | 0.148 | - | - | - | - | - |
0.1889 | 10200 | 0.4943 | - | - | - | - | - |
0.1907 | 10300 | 0.4379 | - | - | - | - | - |
0.1926 | 10400 | 0.9736 | - | - | - | - | - |
0.1944 | 10500 | 0.5588 | - | - | - | - | - |
0.1963 | 10600 | 1.2462 | - | - | - | - | - |
0.1981 | 10700 | 0.7766 | - | - | - | - | - |
0.2 | 10800 | 0.0881 | - | - | - | - | - |
0.2019 | 10900 | 0.8127 | - | - | - | - | - |
0.2037 | 11000 | 0.4568 | 1.0000 (+0.0000) | 0.0933 (-0.4471) | 0.3189 (-0.0062) | 0.3052 (-0.1954) | 0.2392 (-0.2162) |
0.2056 | 11100 | 0.0117 | - | - | - | - | - |
0.2074 | 11200 | 1.2554 | - | - | - | - | - |
0.2093 | 11300 | 0.0967 | - | - | - | - | - |
0.2111 | 11400 | 0.5637 | - | - | - | - | - |
0.2130 | 11500 | 0.5817 | - | - | - | - | - |
0.2148 | 11600 | 0.3986 | - | - | - | - | - |
0.2167 | 11700 | 0.0 | - | - | - | - | - |
0.2185 | 11800 | 0.9376 | - | - | - | - | - |
0.2204 | 11900 | 0.0002 | - | - | - | - | - |
0.2222 | 12000 | 0.1746 | 1.0000 (+0.0000) | 0.1211 (-0.4194) | 0.3570 (+0.0319) | 0.3785 (-0.1221) | 0.2855 (-0.1699) |
0.2241 | 12100 | 1.245 | - | - | - | - | - |
0.2259 | 12200 | 0.9463 | - | - | - | - | - |
0.2278 | 12300 | 0.4784 | - | - | - | - | - |
0.2296 | 12400 | 0.221 | - | - | - | - | - |
0.2315 | 12500 | 0.7711 | - | - | - | - | - |
0.2333 | 12600 | 0.8941 | - | - | - | - | - |
0.2352 | 12700 | 0.4619 | - | - | - | - | - |
0.2370 | 12800 | 0.9785 | - | - | - | - | - |
0.2389 | 12900 | 0.4781 | - | - | - | - | - |
0.2407 | 13000 | 0.8747 | 0.9963 (-0.0037) | 0.0739 (-0.4665) | 0.3125 (-0.0125) | 0.3546 (-0.1460) | 0.2470 (-0.2083) |
0.2426 | 13100 | 1.3053 | - | - | - | - | - |
0.2444 | 13200 | 0.5297 | - | - | - | - | - |
0.2463 | 13300 | 0.6859 | - | - | - | - | - |
0.2481 | 13400 | 0.0735 | - | - | - | - | - |
0.25 | 13500 | 0.4249 | - | - | - | - | - |
0.2519 | 13600 | 0.097 | - | - | - | - | - |
0.2537 | 13700 | 0.7214 | - | - | - | - | - |
0.2556 | 13800 | 1.8015 | - | - | - | - | - |
0.2574 | 13900 | 0.5684 | - | - | - | - | - |
0.2593 | 14000 | 0.1073 | 1.0000 (+0.0000) | 0.1074 (-0.4330) | 0.3212 (-0.0038) | 0.3781 (-0.1225) | 0.2689 (-0.1864) |
0.2611 | 14100 | 0.7453 | - | - | - | - | - |
0.2630 | 14200 | 0.0001 | - | - | - | - | - |
0.2648 | 14300 | 1.1899 | - | - | - | - | - |
0.2667 | 14400 | 0.0001 | - | - | - | - | - |
0.2685 | 14500 | 0.0 | - | - | - | - | - |
0.2704 | 14600 | 0.9591 | - | - | - | - | - |
0.2722 | 14700 | 0.206 | - | - | - | - | - |
0.2741 | 14800 | 0.93 | - | - | - | - | - |
0.2759 | 14900 | 0.7623 | - | - | - | - | - |
0.2778 | 15000 | 0.8664 | 1.0000 (+0.0000) | 0.1070 (-0.4334) | 0.3039 (-0.0211) | 0.2953 (-0.2053) | 0.2354 (-0.2200) |
0.2796 | 15100 | 0.8114 | - | - | - | - | - |
0.2815 | 15200 | 0.6528 | - | - | - | - | - |
0.2833 | 15300 | 0.001 | - | - | - | - | - |
0.2852 | 15400 | 0.092 | - | - | - | - | - |
0.2870 | 15500 | 0.0766 | - | - | - | - | - |
0.2889 | 15600 | 0.5345 | - | - | - | - | - |
0.2907 | 15700 | 0.0843 | - | - | - | - | - |
0.2926 | 15800 | 0.5779 | - | - | - | - | - |
0.2944 | 15900 | 1.0723 | - | - | - | - | - |
0.2963 | 16000 | 0.062 | 1.0000 (+0.0000) | 0.1133 (-0.4272) | 0.3236 (-0.0014) | 0.3471 (-0.1536) | 0.2613 (-0.1940) |
0.2981 | 16100 | 0.0982 | - | - | - | - | - |
0.3 | 16200 | 0.6336 | - | - | - | - | - |
0.3019 | 16300 | 0.1888 | - | - | - | - | - |
0.3037 | 16400 | 1.0696 | - | - | - | - | - |
0.3056 | 16500 | 0.4392 | - | - | - | - | - |
0.3074 | 16600 | 0.0145 | - | - | - | - | - |
0.3093 | 16700 | 0.1596 | - | - | - | - | - |
0.3111 | 16800 | 0.6917 | - | - | - | - | - |
0.3130 | 16900 | 0.0604 | - | - | - | - | - |
0.3148 | 17000 | 0.4453 | 1.0000 (+0.0000) | 0.0585 (-0.4819) | 0.2916 (-0.0335) | 0.3118 (-0.1889) | 0.2206 (-0.2348) |
0.3167 | 17100 | 0.721 | - | - | - | - | - |
0.3185 | 17200 | 0.0001 | - | - | - | - | - |
0.3204 | 17300 | 0.1209 | - | - | - | - | - |
0.3222 | 17400 | 0.1524 | - | - | - | - | - |
0.3241 | 17500 | 0.0001 | - | - | - | - | - |
0.3259 | 17600 | 0.3735 | - | - | - | - | - |
0.3278 | 17700 | 0.0495 | - | - | - | - | - |
0.3296 | 17800 | 0.3397 | - | - | - | - | - |
0.3315 | 17900 | 0.6157 | - | - | - | - | - |
0.3333 | 18000 | 1.0012 | 1.0000 (+0.0000) | 0.1115 (-0.4290) | 0.2986 (-0.0265) | 0.4091 (-0.0916) | 0.2730 (-0.1823) |
0.3352 | 18100 | 0.1045 | - | - | - | - | - |
0.3370 | 18200 | 1.4868 | - | - | - | - | - |
0.3389 | 18300 | 0.388 | - | - | - | - | - |
0.3407 | 18400 | 1.0158 | - | - | - | - | - |
0.3426 | 18500 | 0.0001 | - | - | - | - | - |
0.3444 | 18600 | 0.4691 | - | - | - | - | - |
0.3463 | 18700 | 0.3376 | - | - | - | - | - |
0.3481 | 18800 | 1.0094 | - | - | - | - | - |
0.35 | 18900 | 0.231 | - | - | - | - | - |
0.3519 | 19000 | 0.702 | 1.0000 (+0.0000) | 0.1041 (-0.4364) | 0.2948 (-0.0302) | 0.3324 (-0.1683) | 0.2437 (-0.2116) |
0.3537 | 19100 | 0.0648 | - | - | - | - | - |
0.3556 | 19200 | 0.1101 | - | - | - | - | - |
0.3574 | 19300 | 0.1124 | - | - | - | - | - |
0.3593 | 19400 | 0.0003 | - | - | - | - | - |
0.3611 | 19500 | 0.0001 | - | - | - | - | - |
0.3630 | 19600 | 0.4251 | - | - | - | - | - |
0.3648 | 19700 | 0.5487 | - | - | - | - | - |
0.3667 | 19800 | 0.481 | - | - | - | - | - |
0.3685 | 19900 | 0.0001 | - | - | - | - | - |
0.3704 | 20000 | 0.6102 | 1.0000 (+0.0000) | 0.0252 (-0.5152) | 0.3387 (+0.0136) | 0.1679 (-0.3328) | 0.1773 (-0.2781) |
0.3722 | 20100 | 0.1851 | - | - | - | - | - |
0.3741 | 20200 | 0.4466 | - | - | - | - | - |
0.3759 | 20300 | 0.0083 | - | - | - | - | - |
0.3778 | 20400 | 0.0007 | - | - | - | - | - |
0.3796 | 20500 | 0.5438 | - | - | - | - | - |
0.3815 | 20600 | 0.2863 | - | - | - | - | - |
0.3833 | 20700 | 0.3204 | - | - | - | - | - |
0.3852 | 20800 | 0.8213 | - | - | - | - | - |
0.3870 | 20900 | 0.0001 | - | - | - | - | - |
0.3889 | 21000 | 0.4626 | 1.0000 (+0.0000) | 0.1689 (-0.3715) | 0.3286 (+0.0035) | 0.4064 (-0.0943) | 0.3013 (-0.1541) |
Framework Versions
- Python: 3.11.13
- Sentence Transformers: 5.0.0
- Transformers: 4.54.0
- PyTorch: 2.6.0+cu124
- Accelerate: 1.9.0
- Datasets: 4.0.0
- Tokenizers: 0.21.2
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
- Downloads last month
- 8
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
๐
Ask for provider support
Model tree for sp-embraceable/reranker-ModernBERT-base-german-rag-pair-hard-negativemine
Base model
answerdotai/ModernBERT-largeEvaluation results
- Map on german rag pairs devself-reported1.000
- Mrr@10 on german rag pairs devself-reported1.000
- Ndcg@10 on german rag pairs devself-reported1.000
- Map on NanoMSMARCO R100self-reported0.098
- Mrr@10 on NanoMSMARCO R100self-reported0.075
- Ndcg@10 on NanoMSMARCO R100self-reported0.169
- Map on NanoNFCorpus R100self-reported0.312
- Mrr@10 on NanoNFCorpus R100self-reported0.460
- Ndcg@10 on NanoNFCorpus R100self-reported0.329
- Map on NanoNQ R100self-reported0.357