Pubmed models
Collection
Embedding and Reranker models trained on the Turkish Pubmed 10K
•
3 items
•
Updated
This is a sentence-transformers model finetuned from NeuML/pubmedbert-base-embeddings on the pubmed_tr_10k dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'Kuşlarda saldırganlık-ilişkili davranışlar. II. AA gen ürünlerinin hücresel ekspresyonu. B1-anti-B2 ve B2-anti-B1 allosera, sırasıyla, homozygot B1/1 ve B2/2 tavukların damar içi aşısı yoluyla, aşağıdaki kaynaklardan elde edilen B1/2 hücreleriyle immunizasyon sağlanarak üretildi: periferik kan lökositleri (PBL), eritrositler, timus hücreleri ve bursa hücreleri. Bu alloseralardan saflaştırılmış süspansiyonlar, hem kırmızı kan hücrelerini hem de orijinal verici türünün kan lenfositlerinin GVH reaktivitesini güçlü biçimde inhibe eden anti-B alloserumu antikorları üretti. Aynı dört kaynaktan hücreler kullanılarak yapılan sera emilim çalışmaları, bu antikorların GVH inhibisyonunu sağlayan antikorları tamamen uzaklaştırabildiğini gösterdi. Özellikle önemli bir gerçek, eritrositler ve lenfositlerde ortak olan B-haplotype belirlenmiş antijenlerin, daha önce tanımlandığı gibi (Simonsen 1975), allo-saldırganlık loci gen ürünlerini içeriyor olabileceğidir.',
'B1-anti-B2 ve B2-anti-B1 alloseralardan elde edilen antikorların üretiminde hangi hücre kaynakları kullanılmıştır?',
'Metinde incelenen hormon ile yağ hücrelerindeki adenilat siklaz sistemi arasındaki etkileşimin amacı nedir?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
dim_768
InformationRetrievalEvaluator
with these parameters:{
"truncate_dim": 768
}
Metric | Value |
---|---|
cosine_accuracy@1 | 0.8144 |
cosine_accuracy@3 | 0.8782 |
cosine_accuracy@5 | 0.9022 |
cosine_accuracy@10 | 0.9281 |
cosine_precision@1 | 0.8144 |
cosine_precision@3 | 0.2927 |
cosine_precision@5 | 0.1804 |
cosine_precision@10 | 0.0928 |
cosine_recall@1 | 0.8144 |
cosine_recall@3 | 0.8782 |
cosine_recall@5 | 0.9022 |
cosine_recall@10 | 0.9281 |
cosine_ndcg@10 | 0.8713 |
cosine_mrr@10 | 0.8531 |
cosine_map@100 | 0.8547 |
positive
and anchor
positive | anchor | |
---|---|---|
type | string | string |
details |
|
|
positive | anchor |
---|---|
Bakteriyofaj P22'nin baz plaket parçalarının enzimik ve moleküler özellikleri. Substrat olarak 14C ile işaretlenmiş Salmonella bakteriyel hücreleri kullanılarak, P22 firkası baz plaket parçalarının enzimik ve moleküler özellikleri incelendi. Baz plaket parçası, Salmonella typhimurium, Salmonella schottmuellerie ve Salmonella typhi’nin O-antijenini kapsamlı şekilde kesen tek bir protein türünden oluşuyordu; ayrıcalıklı olarak Salmonella typhimurium ve Salmonella schottmuellerie’nin O-antijenini, Salmonella typhi’den biraz daha yavaş bir hızda kesiyor ve indirgenmiş uçta rhamnose bulunan oligoşaride ürünler salıyordu. P22’ya lizogenik olan bir Salmonella typhimurium suşunda ise çok daha az kesme gerçekleşti ve Salmonella anatum, Salmonella newington ve Salmonella minneapolis üzerinde ise anlamlı bir reaksiyon gözlenmedi. Baz plaket parçası enzim, çok ısıya dayanıklı bir protein olup, 85 derece C’de 5 dakika boyunca muamele sonrası sadece %10-20 kayıp gözlemlendi. Enzimin pH optimali yakl... |
P22 baz plaket parçasının enzimik özellikleri nelerdir ve hangi substratları keser? |
Fare T ve B lenfositlerinin nakil karşıtı reaksiyona katılımı. CBA farelerinin dalak veya lenf nodu hücreleri, kısmi dozda ışınlanmış (CBAXC57BL/6)F1 farelerine nakledildi; bu, nakil karşıtı reaksiyonun (GVHR) gelişmesine neden oldu. Lenfositler, fare T ve B lenfositlerine karşı spesifik serumlar ile in vitro muamele edildikten sonra bu reaksiyonu gerçekleştirme yeteneklerini kaybetti. Görünüşe göre, farelerde GVHR'nin gelişimi, T ve B lenfositlerinin işbirlikçi etkileşimiyle bağlantılıydı. |
Farelerde nakil karşıtı reaksiyonun (GVHR) gelişmesi hangi hücrelerin katılımıyla ilişkilidir? |
2,3-diphosphoglycerat'in insan kanındaki tamponlama özellikleri üzerindeki etkisi: kırmızı kan hücresi zarının rolü. İnsan kanının tamponlama özellikleri ve hücre dışı ile hücre içi pH (deltapHi/deltapHe) arasındaki ilişkinin eğimi (eğimi) üzerindeki 2,3-diphosphoglycerat (2,3-DPG, 0.5-21 mikromol/g hücre) konsantrasyonunun etkisi incelendi. Sonuçlar, 2,3-DPG'nin Donnan oranı rH+ = H+e/H+i üzerindeki etkisiyle ilgili önceki bulgularla bağlantılı olarak değerlendirildi. deltapHi/deltapHe değeri, kırmızı kan hücresindeki 2,3-DPG miktarının artmasıyla ve ekstrasellüler pH'nın yükselmesiyle azalmaktadır. deltapHi/deltapHe ile rH+ birbirine aşağıdaki ampirik denklemle bağlanabilir: deltapHi/deltapHe = 1 + log rH+ = 1 + pHi - pHe. Bu denklemin geçerliliği, Donnan oranı rH+'nin 0.3 ile 1 arasında değiştiği koşullarla sınırlı görünmektedir; bu değişiklikler ya 2,3-DPG gibi tamponlayıcı anyonların kırmızı kan hücrelerindeki konsantrasyonundaki değişiklikler ya da ekzosellüler pH'daki değişiklik... |
2,3-diphosphoglycerat (2,3-DPG) konsantrasyonunun artması kırmızı kan hücresinde deltapHi/deltapHe değerine nasıl etki eder? |
MultipleNegativesRankingLoss
with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
eval_strategy
: epochper_device_train_batch_size
: 32per_device_eval_batch_size
: 16gradient_accumulation_steps
: 16learning_rate
: 2e-05num_train_epochs
: 5lr_scheduler_type
: cosinewarmup_ratio
: 0.1bf16
: Truetf32
: Trueload_best_model_at_end
: Trueoptim
: adamw_torch_fusedbatch_sampler
: no_duplicatesoverwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: epochprediction_loss_only
: Trueper_device_train_batch_size
: 32per_device_eval_batch_size
: 16per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 16eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 2e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 5max_steps
: -1lr_scheduler_type
: cosinelr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Truefp16
: Falsefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Truelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Trueignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torch_fusedoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsehub_revision
: Nonegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
: auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseliger_kernel_config
: Noneeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportionalEpoch | Step | Training Loss | dim_768_cosine_ndcg@10 |
---|---|---|---|
0.5112 | 10 | 1.2023 | - |
1.0 | 20 | 0.2711 | 0.8182 |
1.5112 | 30 | 0.1766 | - |
2.0 | 40 | 0.1464 | 0.8500 |
2.5112 | 50 | 0.1112 | - |
3.0 | 60 | 0.0984 | 0.8614 |
3.5112 | 70 | 0.087 | - |
4.0 | 80 | 0.0791 | 0.8691 |
4.5112 | 90 | 0.0811 | - |
5.0 | 100 | 0.0726 | 0.8713 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}