legalkeeepitreal_v2 / README.md
Hkyun's picture
Upload folder using huggingface_hub
8ee4289 verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:32292
  - loss:TripletLoss
base_model: keepitreal/vietnamese-sbert
widget:
  - source_sentence: >-
      2. Trách nhiệm của Bộ Công an trong việc thực hiện bảo hiểm cháy, nổ bắt
      buộc?
    sentences:
      - >-
        . Nguồn thu từ bảo hiểm cháy, nổ bắt buộc cho hoạt động phòng cháy, chữa
        cháy được sử dụng như sau: a) Hỗ trợ trang bị phương tiện, thiết bị
        phòng cháy, chữa cháy cho lực lượng Cảnh sát phòng cháy và chữa cháy.
        Chi cho nội dung này không vượt quá % số tiền thực tế thu được từ bảo
        hiểm cháy, nổ bắt buộc của các doanh nghiệp bảo hiểm trong năm tài
        chính. b) Hỗ trợ tuyên truyền, phổ biến pháp luật, kiến thức phòng cháy,
        chữa cháy và bảo hiểm cháy, nổ bắt buộc. Chi cho nội dung này không vượt
        quá % số tiền thực tế thu được từ bảo hiểm cháy, nổ bắt buộc của các
        doanh nghiệp bảo hiểm trong năm tài chính. c) Hỗ trợ lực lượng Cảnh sát
        phòng cháy và chữa cháy trong các hoạt động sau: Điều tra nguyên nhân vụ
        cháy; bồi dưỡng nghiệp vụ, kiểm tra an toàn về phòng cháy và chữa cháy;
        giám sát việc tham gia bảo hiểm cháy, nổ bắt buộc của các cơ sở có nguy
        hiểm về cháy, nổ. Chi cho nội dung này không vượt quá % số tiền thực tế
        thu được từ bảo hiểm cháy, nổ bắt buộc của các doanh nghiệp bảo hiểm
        trong năm tài chính. d) Hỗ trợ khen thưởng thành tích của tổ chức, cá
        nhân trực tiếp tham gia, phối hợp trong công tác phòng cháy, chữa cháy.
        Chi cho nội dung này không vượt quá % số tiền thực tế thu được từ bảo
        hiểm cháy, nổ bắt buộc của các doanh nghiệp bảo hiểm trong năm tài
        chính”.
      - >-
        . Nghị định này quy định nguyên tắc, trình tự, thủ tục thi hành các biện
        pháp giám sát, giáo dục người dưới tuổi phạm tội được miễn trách nhiệm
        hình sự; quyền và nghĩa vụ của người được giám sát, giáo dục; trách
        nhiệm của gia đình, cơ quan, tổ chức, cá nhân có liên quan trong việc
        giám sát, giáo dục người dưới tuổi phạm tội được miễn trách nhiệm hình
        sự; trách nhiệm của các bộ, Ủy ban nhân dân các cấp trong việc tổ chức
        thi hành các biện pháp giám sát, giáo dục.
      - >-
        . Doanh nghiệp khoa học và công nghệ được miễn, giảm tiền thuê đất, thuê
        mặt nước theo quy định của pháp luật về đất đai.
  - source_sentence: >-
      Các trường hợp người trúng tuyển viên chức được miễn thực hiện chế độ tập
      sự được quy định như thế nào?
    sentences:
      - >-
        . Sửa đổi, bổ sung như sau:“. Trong thời hạn ngày làm việc, kể từ ngày
        hết thời hạn đọc hồ sơ theo quy định tại của Luật này, cơ quan lập hồ sơ
        đề nghị quy định tại và của Luật này gửi hồ sơ cho Chủ tịch Ủy ban nhân
        dân cấp xã.Trong thời hạn ngày làm việc, kể từ ngày nhận được hồ sơ, Chủ
        tịch Ủy ban nhân dân cấp xã tổ chức và chủ trì cuộc họp tư vấn với sự
        tham gia của Trưởng Công an cấp xã, công chức tư pháp - hộ tịch, đại
        diện Ủy ban Mặt trận Tổ quốc Việt Nam và một số tổ chức chính trị - xã
        hội, tổ chức xã hội cùng cấp có liên quan, đại diện dân cư ở cơ sở.
        Người bị đề nghị áp dụng biện pháp giáo dục tại xã, phường, thị trấn,
        người đại diện hợp pháp của họ, cha mẹ, người giám hộ của người chưa
        thành niên phải được mời tham gia cuộc họp và phát biểu ý kiến của mình
        về việc áp dụng biện pháp.”.
      - >-
        . Cấp có thẩm quyền bổ nhiệm chủ trì hoặc ủy quyền chủ trì thực hiện quy
        trình bổ nhiệm đối với các trường hợp sau: a) Bổ nhiệm người đứng đầu,
        cấp phó của người đứng đầu đơn vị sự nghiệp công lập mới được thành lập;
        b) Trường hợp thực hiện quy trình bổ nhiệm mà thời điểm đó đơn vị sự
        nghiệp công lập chỉ có lãnh đạo là người đứng đầu hoặc là cấp phó của
        người đứng đầu hoặc khuyết vị trí lãnh đạo hoặc thực hiện quy trình bổ
        nhiệm lãnh đạo là người đứng đầu; c) Trường hợp thực hiện quy trình bổ
        nhiệm mà thời điểm đó nội bộ lãnh đạo đơn vị sự nghiệp công lập mất đoàn
        kết, nhiều người vi phạm kỷ luật, nếu thực hiện quy trình bổ nhiệm sẽ
        thiếu khách quan; d) Trường hợp vì thiên tai, tai nạn hoặc vì các lý do
        bất khả kháng khác mà đơn vị sự nghiệp công lập không còn người lãnh
        đạo, quản lý.Người chủ trì có quyền bỏ phiếu tại các bước theo quy định.
      - >-
        . Tổ chức chứng nhận sự phù hợp thực hiện việc chứng nhận hợp chuẩn hoặc
        chứng nhận hợp quy hoặc cả chứng nhận hợp chuẩn và chứng nhận hợp quy.
  - source_sentence: Thủ tục cấp Giấy phép lưu hành xe quá tải trọng được quy định như thế nào?
    sentences:
      - >-
        . Cục Đường cao tốc Việt Nam chịu trách nhiệm công bố tải trọng và khổ
        giới hạn của các tuyến đường cao tốc được phân cấp, ủy quyền trên Trang
        Thông tin điện tử của Cục Đường cao tốc Việt Nam; đồng thời gửi số liệu
        về Cục Đường bộ Việt Nam để cập nhật trên Trang thông tin điện tử của
        Cục Đường bộ Việt Nam.
      - >-
        . Chế độ báo cáo của Sở giao dịch chứng khoán a) Sở giao dịch chứng
        khoán thực hiện chế độ báo cáo định kỳ hàng quý, hàng năm cho Ủy ban
        Chứng khoán Nhà nước về tình hình chào bán, giao dịch trái phiếu doanh
        nghiệp gồm chào bán tại thị trường trong nước và chào bán ra thị trường
        quốc tế. b) Ngoài chế độ báo cáo định kỳ theo quy định tại điểm a khoản
        này, Sở giao dịch chứng khoán báo cáo đột xuất cho Ủy ban Chứng khoán
        Nhà nước theo yêu cầu của cơ quan quản lý.
      - >-
        . Xe ô tô tải, xe ô tô tải chuyên dùng, xe ô tô chuyên dùng là loại xe ô
        tô được định nghĩa tại các tiêu chuẩn TCVN : , TCVN : .
  - source_sentence: >-
      Trình tự thực hiện thủ tục giải thể trung tâm giáo dục thường xuyên được
      quy định như thế nào?
    sentences:
      - >-
        . Trung tâm giáo dục thường xuyên bị giải thể khi xảy ra một trong các
        trường hợp sau đây: a) Vi phạm nghiêm trọng các quy định về quản lý, tổ
        chức, hoạt động của trung tâm; b) Hết thời gian đình chỉ ghi trong quyết
        định đình chỉ hoạt động mà không khắc phục được nguyên nhân dẫn đến việc
        đình chỉ; c) Mục tiêu và nội dung hoạt động trong quyết định thành lập
        trung tâm giáo dục thường xuyên không còn phù hợp với yêu cầu phát triển
        kinh tế - xã hội tại địa phương.
      - >-
        . Áp dụng thuế suất đối với hàng hóa xuất khẩu tại chỗ, nhập khẩu tại
        chỗ a) Hàng hóa xuất khẩu tại chỗ áp dụng mức thuế suất thuế xuất khẩu
        quy định tại của Chính phủ về Biểu thuế xuất khẩu, Biểu thuế nhập khẩu
        ưu đãi, Danh mục hàng hóa và mức thuế tuyệt đối, thuế hỗn hợp, thuế nhập
        khẩu ngoài hạn ngạch thuế quan (sau đây gọi là ), của Chính phủ sửa đổi,
        bổ sung một số điều của và của Chính phủ sửa đổi, bổ sung một số điều
        của (sau đây gọi là ) và văn bản sửa đổi, bổ sung, thay thế (nếu có). b)
        Hàng hóa nhập khẩu tại chỗ (trừ hàng hóa nhập khẩu tại chỗ từ khu phi
        thuế quan quy định tại điểm c khoản này) áp dụng mức thuế suất thuế nhập
        khẩu ưu đãi quy định tại , và văn bản sửa đổi, bổ sung, thay thế (nếu
        có). c) Hàng hóa đáp ứng điều kiện xuất xứ từ nước, nhóm nước hoặc vùng
        lãnh thổ thực hiện đối xử tối huệ quốc trong quan hệ thương mại với Việt
        Nam nhập khẩu tại chỗ từ khu phi thuế quan vào thị trường trong nước;
        hàng hóa sản xuất, gia công, tái chế, lắp ráp tại khu phi thuế quan
        không đáp ứng các điều kiện để hưởng thuế suất thuế nhập khẩu ưu đãi đặc
        biệt nhập khẩu tại chỗ từ khu phi thuế quan vào thị trường trong nước,
        áp dụng mức thuế suất thuế nhập khẩu ưu đãi quy định tại , và văn bản
        sửa đổi, bổ sung, thay thế (nếu có).Hàng hóa đáp ứng điều kiện xuất xứ
        từ nước, nhóm nước hoặc vùng lãnh thổ có thỏa thuận ưu đãi đặc biệt về
        thuế nhập khẩu trong quan hệ thương mại với Việt Nam nhập khẩu tại chỗ
        từ khu phi thuế quan vào thị trường trong nước và đáp ứng các điều kiện
        khác để hưởng thuế suất thuế nhập khẩu ưu đãi đặc biệt; hàng hóa sản
        xuất, gia công, tái chế, lắp ráp tại khu phi thuế quan đáp ứng các điều
        kiện để hưởng thuế suất thuế nhập khẩu ưu đãi đặc biệt nhập khẩu tại chỗ
        từ khu phi thuế quan vào thị trường trong nước, áp dụng mức thuế suất
        thuế nhập khẩu ưu đãi đặc biệt quy định tại các Nghị định của Chính phủ
        về Biểu thuế nhập khẩu ưu đãi đặc biệt để thực hiện điều ước quốc tế mà
        Cộng hòa xã hội chủ nghĩa Việt Nam là thành viên.Hàng hóa nhập khẩu
        không đáp ứng điều kiện xuất xứ từ nước, nhóm nước hoặc vùng lãnh thổ
        thực hiện đối xử tối huệ quốc và không đáp ứng các điều kiện để được
        hưởng mức thuế suất thuế nhập khẩu ưu đãi đặc biệt nhập khẩu tại chỗ từ
        khu phi thuế quan vào thị trường trong nước
      - >-
        . Hạn mức vay nước ngoài trung, dài hạn theo phương thức tự vay tự trả
        là mức vay thương mại nước ngoài trung, dài hạn của doanh nghiệp, tổ
        chức tài chính, tín dụng, chi nhánh ngân hàng nước ngoài, hợp tác xã,
        liên minh hợp tác xã được xác định bằng số tiền vay thực nhận trừ đi số
        trả nợ gốc trong kỳ tính hạn mức.
  - source_sentence: Việc kiểm định chất lượng đầu vào công chức tổ chức hằng năm như thế nào?
    sentences:
      - >-
        . Việc kiểm định chất lượng đầu vào công chức được tổ chức định kỳ lần
        vào tháng và tháng hàng năm.
      - >-
        . Cơ sở mua bán, xuất khẩu, nhập khẩu, chuyển nhượng trang thiết bị y
        tế, nguyên liệu sản xuất, chất ngoại kiểm có chứa chất ma túy và tiền
        chất có trách nhiệm báo cáo gửi Bộ Y tế và gửi Bộ Công an theo định kỳ
        hằng năm trước ngày tháng của năm tiếp theo.
      - >-
        . Sửa đổi điểm b như sau:“ b) Tổ chức thi vòng :Thí sinh được thông báo
        kết quả vòng ngay sau khi kết thúc thời gian làm bài thi. Không thực
        hiện việc phúc khảo đối với kết quả thi vòng .”.
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy
model-index:
  - name: SentenceTransformer based on keepitreal/vietnamese-sbert
    results:
      - task:
          type: triplet
          name: Triplet
        dataset:
          name: ai job validation
          type: ai-job-validation
        metrics:
          - type: cosine_accuracy
            value: 0.9546999931335449
            name: Cosine Accuracy

SentenceTransformer based on keepitreal/vietnamese-sbert

This is a sentence-transformers model finetuned from keepitreal/vietnamese-sbert. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: keepitreal/vietnamese-sbert
  • Maximum Sequence Length: 256 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'Việc kiểm định chất lượng đầu vào công chức tổ chức hằng năm như thế nào?',
    '. Việc kiểm định chất lượng đầu vào công chức được tổ chức định kỳ lần vào tháng và tháng hàng năm.',
    '. Cơ sở mua bán, xuất khẩu, nhập khẩu, chuyển nhượng trang thiết bị y tế, nguyên liệu sản xuất, chất ngoại kiểm có chứa chất ma túy và tiền chất có trách nhiệm báo cáo gửi Bộ Y tế và gửi Bộ Công an theo định kỳ hằng năm trước ngày tháng của năm tiếp theo.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Triplet

Metric Value
cosine_accuracy 0.9547

Training Details

Training Dataset

Unnamed Dataset

  • Size: 32,292 training samples
  • Columns: sentence_0, sentence_1, and sentence_2
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1 sentence_2
    type string string string
    details
    • min: 14 tokens
    • mean: 25.26 tokens
    • max: 55 tokens
    • min: 15 tokens
    • mean: 113.16 tokens
    • max: 256 tokens
    • min: 24 tokens
    • mean: 116.68 tokens
    • max: 256 tokens
  • Samples:
    sentence_0 sentence_1 sentence_2
    Nhiệm vụ, quyền hạn của cơ quan thanh tra ở cơ quan thuộc Chính phủ như thế nào? . Cơ quan thanh tra ở cơ quan thuộc Chính phủ thực hiện nhiệm vụ thanh tra trong phạm vi quản lý của cơ quan thuộc Chính phủ. . Sỹ quan máy trực ca có nhiệm vụ sau đây: a) Điều hành thợ máy, sỹ quan kỹ thuật điện, thợ kỹ thuật điện; thường xuyên theo dõi chế độ làm việc của các máy, thiết bị, lò, nồi hơi theo đúng quy trình kỹ thuật; b) Tổ chức thực hiện nhiệm vụ của ca trực ở buồng máy, buồng lò, bảo đảm trật tự và vệ sinh công nghiệp ở buồng máy; c) Bảo đảm các máy móc thuộc bộ phận máy hoạt động bình thường, an toàn và xử lý kịp thời các sự cố xảy ra; d) Theo dõi công việc sửa chữa của những người trên bờ xuống tàu làm việc thuộc bộ phận mình phụ trách, bảo đảm an toàn lao động, phòng chống cháy nổ, an toàn kỹ thuật cho tàu và phòng ngừa ô nhiễm môi trường; đ) Theo dõi tiêu hao nhiên liệu, sử dụng các vật tư kỹ thuật của tàu; e) Tiến hành đo dầu, nước ở các két; bơm nước la canh buồng máy, nước dằn, nhiên liệu để điều chỉnh tàu theo yêu cầu của sỹ quan boong trực ca; khi tiến hành bơm nước thải các loại phải thực hiện theo đúng quy định; g) Khi tàu hành trình, sỹ quan máy trực ca có nhiệm vụ thực hiện nghi...
    Trách nhiệm của thương nhân, tổ chức cung cấp dịch vụ sàn giao dịch thương mại điện tử được quy định như thế nào? . Nhà đầu tư có hoạt động đầu tư vào doanh nghiệp nhỏ và vừa khởi nghiệp sáng tạo theo quy định của pháp luật về hỗ trợ doanh nghiệp nhỏ và vừa không phải thực hiện quy định tại Điều này.”. Sửa đổi, bổ sung như sau:“. Tổ chức thực hiện. Bộ Công Thương có trách nhiệm: a) Thực hiện quản lý hoạt động thương mại điện tử, thúc đẩy chuyển đổi số trong lĩnh vực thương mại; b) Phối hợp với Bộ Thông tin và Truyền thông, Bộ Công an trong bảo vệ an toàn thông tin, an ninh mạng đối với hoạt động thương mại điện tử. Kiến nghị Bộ Công an xử lý theo pháp luật đối với các hành vi vi phạm về an ninh mạng trong thương mại điện tử; c) Tổ chức thông tin, phổ biến, truyền thông về pháp luật liên quan đến hoạt động thương mại điện tử; d) Thanh tra, kiểm tra, giải quyết khiếu nại và xử lý vi phạm về hoạt động thương mại điện tử; đ) Hướng dẫn, kiểm tra việc tổ chức thực hiện Nghị định này. . Trong Thông tư này, tỷ lệ tổn thương cơ thể (sau đây được gọi tắt là: TTCT) được dùng chung cho tỷ lệ suy giảm khả năng lao động, tỷ lệ thương tích, tỷ lệ thương tật, tỷ lệ bệnh tật, tỷ lệ tổn hại sức khỏe.
    2. Không đi nghĩa vụ quân sự theo lệnh gọi nhập ngũ bị xử phạt hành chính như thế nào? . Bổ sung vào sau “. Hình thức xử phạt. Đối với mỗi hành vi vi phạm hành chính trong lĩnh vực quốc phòng, cơ yếu, tổ chức, cá nhân phải chịu hình thức xử phạt chính là cảnh cáo hoặc phạt tiền. . Người nào không chấp hành đúng quy định của pháp luật về đăng ký nghĩa vụ quân sự, không chấp hành lệnh gọi nhập ngũ, lệnh gọi tập trung huấn luyện, đã bị xử phạt hành chính về hành vi này hoặc đã bị kết án về tội này, chưa được xoá án tích mà còn vi phạm, thì bị phạt cải tạo không giam giữ đến hai năm hoặc phạt tù từ ba tháng đến hai năm.
  • Loss: TripletLoss with these parameters:
    {
        "distance_metric": "TripletDistanceMetric.COSINE",
        "triplet_margin": 0.3
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 32
  • multi_dataset_batch_sampler: round_robin

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 32
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 3
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: round_robin

Training Logs

Epoch Step Training Loss ai-job-validation_cosine_accuracy
-1 -1 - 0.6577
0.1980 200 - 0.8359
0.3960 400 - 0.9021
0.4950 500 0.1213 -
0.5941 600 - 0.9176
0.7921 800 - 0.9388
0.9901 1000 0.0303 0.9411
1.0 1010 - 0.9463
1.1881 1200 - 0.9437
1.3861 1400 - 0.9530
1.4851 1500 0.0135 -
1.5842 1600 - 0.9494
1.7822 1800 - 0.9547

Framework Versions

  • Python: 3.11.13
  • Sentence Transformers: 4.1.0
  • Transformers: 4.52.4
  • PyTorch: 2.6.0+cu124
  • Accelerate: 1.8.1
  • Datasets: 3.6.0
  • Tokenizers: 0.21.2

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

TripletLoss

@misc{hermans2017defense,
    title={In Defense of the Triplet Loss for Person Re-Identification},
    author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
    year={2017},
    eprint={1703.07737},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}