namnguyenba2003's picture
Update README.md
0ecec00 verified
metadata
language:
  - vi
license: apache-2.0
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:23168
  - loss:MatryoshkaLoss
  - loss:MultipleNegativesRankingLoss
base_model:
  - keepitreal/vietnamese-sbert
widget:
  - source_sentence: >-
      c) Đối với đơn vị có Quân kỳ: Người trao gắn Huân chương (hoặc Huy chương,
      Huy hiệu kèm theo danh hiệu) lên góc cao Quân kỳ. Vị trí gắn Huân chương
      (hoặc Huy chương, Huy hiệu kèm theo danh hiệu) trên Quân kỳ được thực hiện
      theo thứ hạng từ cao xuống thấp; Đối với tập thể không có Quân kỳ: Người
      trao trao Bằng đã gắn sẵn Huân chương (hoặc Huy chương, Huy hiệu kèm theo
      danh hiệu) ở góc trên, bên trái của Bằng nhìn từ ngoài vào;

      d) Trao tặng cho  nhân: Người trao gắn Huân chương (hoặc Huy chương, Huy
      hiệu kèm theo danh hiệu) lên ngực áo bên trái người đón nhận, sau đó trao
      Bằng. Vị trí gắn Huân chương (hoặc Huy chương, Huy hiệu kèm theo danh
      hiệu) trên ngực áo được thực hiện theo thứ hạng từ cao xuống thấp;

      đ) Truy tặng: Người trao trao Bằng đã gắn sẵn Huân chương (hoặc Huy
      chương, Huy hiệu kèm theo danh hiệu) cho đại diện gia đình  nhân được
      truy tặng.

      3. Đón nhận hình thức khen thưởng, danh hiệu thi đua:
    sentences:
      - >-
        Theo quy định, Vụ Tổ chức cán bộ Bộ Tư pháp sẽ trình Bộ trưởng Bộ Tư
        pháp quyết định giao quyền cấp trưởng hoặc giao phụ trách Tổng cục Thi
        hành án dân sự dựa trên cơ sở nào?
      - >-
        Khi truy tặng Huân chương, Huy chương, Huy hiệu, người trao sẽ trao Bằng
        như thế nào cho đại diện gia đình cá nhân được truy tặng?
      - >-
        Nếu một đơn vị bị kiểm tra, thử nghiệm, khảo sát, điều tra phát hiện sơ
        hở, thiếu sót, họ phải làm gì trong vòng 10 ngày làm việc kể từ khi nhận
        được kết luận?
  - source_sentence: >-
      Khoản 2. Nội dung Báo cáo kết quả kiểm kê đất đai bao gồm:

      a) Tình hình tổ chức thực hiện; phương pháp điều tra, thu thập số liệu
      kiểm  đất đai, nguồn gốc số liệu thu thập tại cấp   đánh giá độ tin
      cậy của số liệu thu thập  số liệu tổng hợp; các thông tin khác  liên
      quan đến số liệu; nguồn tài liệu  phương pháp lập bản đồ hiện trạng sử
      dụng đất;

      b) Phân tích, đánh giá hiện trạng sử dụng đất theo các chỉ tiêu kiểm kê;
      đánh giá tình hình biến động  phân tích nguyên nhân biến động về sử dụng
      đất giữa năm kiểm  với số liệu của 02 kỳ kiểm  gần nhất; đánh giá tình
      hình thực hiện quy hoạch, kế hoạch chuyển mục đích sử dụng đất trong kỳ
      kiểm  đất đai; tình hình giao đất, cho thuê đất, cho phép chuyển mục
      đích sử dụng đất nhưng chưa thực hiện; tình hình  nguyên nhân chuyển mục
      đích sử dụng đất khác với hồ  địa chính; tình hình chuyển đổi  cấu đất
      trồng lúa; tình hình đất ngập nước; tình hình tranh chấp, giải quyết tranh
      chấp địa giới hành chính thực hiện trong kỳ kiểm  (nếu có);

      c) Đề xuất, kiến nghị biện pháp tăng cường quản lý, sử dụng đất đai.
    sentences:
      - >-
        Người muốn được cấp giấy phép kiểm soát an ninh cảng hàng không, sân bay
        có giá trị sử dụng ngắn hạn cần phải làm những thủ tục gì?
      - >-
        Pháp luật quy định các nội dung nào cần được phân tích, đánh giá trong
        báo cáo kết quả kiểm kê đất đai về tình hình biến động sử dụng đất và
        thực hiện quy hoạch, kế hoạch chuyển mục đích sử dụng đất?
      - >-
        Theo quy định của pháp luật, Ngân hàng Nhà nước Việt Nam phải quản lý và
        ghi chép như thế nào đối với số tiền cotton, polymer và kim loại đã được
        in, đúc nhưng chưa được phép lưu hành?
  - source_sentence: >-
      Điều 85. Khu vực cấm bay, khu vực hạn chế bay

      1. Khu vực cấm bay  khu vực trên không  kích thước xác định  tàu bay
      không được bay vào, trừ trường hợp tàu bay công vụ Việt Nam đang thực hiện
      công vụ. Khu vực hạn chế bay  khu vực trên không  kích thước xác định
       tàu bay chỉ được phép hoạt động tại khu vực đó khi đáp ứng các điều
      kiện cụ thể.

      2. Thủ tướng Chính phủ quyết định thiết lập khu vực cấm bay, khu vực hạn
      chế bay trong lãnh thổ Việt Nam nhằm mục đích bảo đảm quốc phòng, an ninh,
      an toàn  hội. Trong trường hợp đặc biệt   do quốc phòng, an ninh, Bộ
      Quốc phòng quyết định hạn chế bay tạm thời hoặc cấm bay tạm thời tại một
      hoặc một số khu vực trong lãnh thổ Việt Nam; quyết định này  hiệu lực
      ngay.

      3. Bộ Quốc phòng quy định việc quản  khu vực cấm bay  khu vực hạn chế
      bay.
    sentences:
      - >-
        Pháp luật quy định những khoản phụ cấp, trợ cấp nào được miễn thuế thu
        nhập cá nhân?
      - >-
        Trường hợp người học vắng mặt trong kỳ kiểm tra có lý do chính đáng, họ
        sẽ được cơ sở đào tạo sắp xếp kiểm tra lại như thế nào?
      - >-
        Luật hàng không dân dụng Việt Nam quy định những trường hợp nào tàu bay
        được phép bay vào khu vực cấm bay?
  - source_sentence: >-
      Điều 62. Các trường hợp không phải bồi thường thiệt hại

      1. Người sản xuất, người nhập khẩu không phải bồi thường trong các trường
      hợp sau đây:

      a) Người bán hàng bán hàng hóa đã hết hạn sử dụng; người tiêu dùng sử dụng
      hàng hóa đã hết hạn sử dụng;

      b) Đã hết thời hiệu khiếu nại, khởi kiện;

      c) Đã thông báo thu hồi hàng hóa  khuyết tật đến người bán hàng, người
      sử dụng trước thời điểm hàng hóa gây thiệt hại;

      d) Sản phẩm, hàng hóa  khuyết tật do tuân thủ quy định bắt buộc của 
      quan nhà nước  thẩm quyền;

      đ) Trình độ khoa học, công nghệ của thế giới chưa đủ để phát hiện khả năng
      gây mất an toàn của sản phẩm tính đến thời điểm hàng hóa gây thiệt hại;

      e) Thiệt hại phát sinh do lỗi của người bán hàng;

      g) Thiệt hại phát sinh do lỗi của người mua, người tiêu dùng.

      2. Người bán hàng không phải bồi thường cho người mua, người tiêu dùng
      trong các trường hợp sau đây:
    sentences:
      - >-
        Luật quy định những trường hợp nào thì người sản xuất, người nhập khẩu
        không phải bồi thường thiệt hại cho người tiêu dùng?
      - >-
        Người đã hiến bộ phận cơ thể sẽ được nhận những phần thưởng, ưu đãi gì
        từ Bộ Y tế?
      - >-
        Theo quy định, KBNN có quyền từ chối thanh toán, chi trả các khoản chi
        bằng tiền mặt trong những trường hợp nào và KBNN chịu trách nhiệm gì
        trong các trường hợp từ chối thanh toán?
  - source_sentence: >-
      k) Thành viên phải duy trì số dư tài khoản thanh toán bảo đảm thực hiện
      các Lệnh thanh toán và quyết toán bù trừ qua Hệ thống TTLNH;

      l) Trường hợp thành viên, đơn vị thành viên chấm dứt  cách thành viên,
      đơn vị thành viên, phải thực hiện thủ tục đề nghị thu hồi chứng thư số
      (nếu có) sử dụng trong TTLNH theo quy định tại Thông  về việc quản lý,
      sử dụng chữ  số, chứng thư số  dịch vụ chứng thực chữ  số của Ngân
      hàng Nhà nước;

      m) Đảm bảo, duy trì hạ tầng kỹ thuật  nguồn lực quy định tại Điểm c, d
      Khoản 1  Điểm a, b Khoản 3 Điều 40 Thông  này;

      n) Đăng  danh sách địa chỉ hộp thư điện tử để trao đổi các thông tin
      liên quan đến Hệ thống TTLNH được quy định trao đổi qua thư điện tử tại
      Thông  này;

      o) Chấp hành đúng các quy định về thời điểm áp dụng trong Hệ thống TTLNH
      để bảo đảm thanh toán được thực hiện thuận lợi, chính xác, kịp thời  an
      toàn tài sản;

      p) Thành viên phải thường xuyên giám sát hạn mức nợ ròng hiện thời của
      mình để duy trì  mức thích hợp;
    sentences:
      - >-
        Các thành viên, đơn vị thành viên của Hệ thống Thanh toán điện tử liên
        ngân hàng Quốc gia phải đảm bảo và duy trì những hạ tầng kỹ thuật và
        nguồn lực gì?
      - >-
        Bộ Quốc phòng quy định như thế nào về việc điều chỉnh tỷ lệ khấu hao tài
        sản cố định để đảm bảo phù hợp với lộ trình tính giá dịch vụ sự nghiệp
        công?
      - >-
        Nếu sự cố bức xạ, hạt nhân xảy ra vượt quá khả năng ứng phó của địa
        phương, Bộ Quốc phòng sẽ hỗ trợ như thế nào?
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy@1
  - cosine_accuracy@3
  - cosine_accuracy@5
  - cosine_accuracy@10
  - cosine_precision@1
  - cosine_precision@3
  - cosine_precision@5
  - cosine_precision@10
  - cosine_recall@1
  - cosine_recall@3
  - cosine_recall@5
  - cosine_recall@10
  - cosine_ndcg@10
  - cosine_mrr@10
  - cosine_map@100
model-index:
  - name: VietnamLegalText-SBERT-finetuned
    results:
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 768
          type: dim_768
        metrics:
          - type: cosine_accuracy@1
            value: 0.5425242718446602
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.5844660194174758
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.6900970873786407
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.785242718446602
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.5425242718446602
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.5118446601941747
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.3738252427184466
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.22287378640776698
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.20184835876098012
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.543875173370319
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.6517078132223763
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.7707680690399137
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.6604654137474918
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.5960436122669122
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.6377378134182617
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 512
          type: dim_512
        metrics:
          - type: cosine_accuracy@1
            value: 0.5316504854368932
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.5755339805825243
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.686990291262136
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.7836893203883495
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.5316504854368932
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.5021359223300971
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.3706407766990291
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.22190291262135922
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.19825612575127138
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.5336421636615812
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.645921405455386
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.7684012944983818
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.6541937764554878
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.5873643088303279
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.6299342948833029
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 256
          type: dim_256
        metrics:
          - type: cosine_accuracy@1
            value: 0.5161165048543689
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.5693203883495146
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.6811650485436893
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.7794174757281553
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.5161165048543689
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.49022653721682846
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.3660582524271845
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.2215145631067961
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.193375866851595
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.52260009246417
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.6386981044845123
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.7651132686084142
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.6463553546004565
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.5755563260903059
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.6201771053919043
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 128
          type: dim_128
        metrics:
          - type: cosine_accuracy@1
            value: 0.4955339805825243
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.541747572815534
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.6446601941747573
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.7596116504854369
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.4955339805825243
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.46873786407766993
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.34679611650485437
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.21421359223300973
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.18586777623670828
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.4998557558945908
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.6054748035136385
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.7409255663430421
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.6217574657696157
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.5523821852365535
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.5975578085238775
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 64
          type: dim_64
        metrics:
          - type: cosine_accuracy@1
            value: 0.4520388349514563
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.5013592233009708
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.6027184466019417
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.7157281553398058
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.4520388349514563
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.4311974110032362
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.322873786407767
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.20015533980582523
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.16861488673139158
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.4591844660194174
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.5654341192787794
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.6956985668053629
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.5771461257381547
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.5088779472954221
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.5556917574193598
            name: Cosine Map@100

VietnamLegalText-SBERT-finetuned

This is a sentence-transformers model finetuned from hmthanh/VietnamLegalText-SBERT on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: hmthanh/VietnamLegalText-SBERT
  • Maximum Sequence Length: 256 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity
  • Training Dataset:
    • json
  • Language: vi
  • License: apache-2.0

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("namnguyenba2003/VietnamLegalText-SBERT-finetuned")
# Run inference
sentences = [
    'k) Thành viên phải duy trì số dư tài khoản thanh toán bảo đảm thực hiện các Lệnh thanh toán và quyết toán bù trừ qua Hệ thống TTLNH;\nl) Trường hợp thành viên, đơn vị thành viên chấm dứt tư cách thành viên, đơn vị thành viên, phải thực hiện thủ tục đề nghị thu hồi chứng thư số (nếu có) sử dụng trong TTLNH theo quy định tại Thông tư về việc quản lý, sử dụng chữ ký số, chứng thư số và dịch vụ chứng thực chữ ký số của Ngân hàng Nhà nước;\nm) Đảm bảo, duy trì hạ tầng kỹ thuật và nguồn lực quy định tại Điểm c, d Khoản 1 và Điểm a, b Khoản 3 Điều 40 Thông tư này;\nn) Đăng ký danh sách địa chỉ hộp thư điện tử để trao đổi các thông tin liên quan đến Hệ thống TTLNH được quy định trao đổi qua thư điện tử tại Thông tư này;\no) Chấp hành đúng các quy định về thời điểm áp dụng trong Hệ thống TTLNH để bảo đảm thanh toán được thực hiện thuận lợi, chính xác, kịp thời và an toàn tài sản;\np) Thành viên phải thường xuyên giám sát hạn mức nợ ròng hiện thời của mình để duy trì ở mức thích hợp;',
    'Các thành viên, đơn vị thành viên của Hệ thống Thanh toán điện tử liên ngân hàng Quốc gia phải đảm bảo và duy trì những hạ tầng kỹ thuật và nguồn lực gì?',
    'Bộ Quốc phòng quy định như thế nào về việc điều chỉnh tỷ lệ khấu hao tài sản cố định để đảm bảo phù hợp với lộ trình tính giá dịch vụ sự nghiệp công?',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Information Retrieval

Metric dim_768 dim_512 dim_256 dim_128 dim_64
cosine_accuracy@1 0.5425 0.5317 0.5161 0.4955 0.452
cosine_accuracy@3 0.5845 0.5755 0.5693 0.5417 0.5014
cosine_accuracy@5 0.6901 0.687 0.6812 0.6447 0.6027
cosine_accuracy@10 0.7852 0.7837 0.7794 0.7596 0.7157
cosine_precision@1 0.5425 0.5317 0.5161 0.4955 0.452
cosine_precision@3 0.5118 0.5021 0.4902 0.4687 0.4312
cosine_precision@5 0.3738 0.3706 0.3661 0.3468 0.3229
cosine_precision@10 0.2229 0.2219 0.2215 0.2142 0.2002
cosine_recall@1 0.2018 0.1983 0.1934 0.1859 0.1686
cosine_recall@3 0.5439 0.5336 0.5226 0.4999 0.4592
cosine_recall@5 0.6517 0.6459 0.6387 0.6055 0.5654
cosine_recall@10 0.7708 0.7684 0.7651 0.7409 0.6957
cosine_ndcg@10 0.6605 0.6542 0.6464 0.6218 0.5771
cosine_mrr@10 0.596 0.5874 0.5756 0.5524 0.5089
cosine_map@100 0.6377 0.6299 0.6202 0.5976 0.5557

Training Details

Training Dataset

json

  • Dataset: json
  • Size: 23,168 training samples
  • Columns: positive and anchor
  • Approximate statistics based on the first 1000 samples:
    positive anchor
    type string string
    details
    • min: 107 tokens
    • mean: 212.31 tokens
    • max: 256 tokens
    • min: 19 tokens
    • mean: 38.3 tokens
    • max: 140 tokens
  • Samples:
    positive anchor
    Khoản 1. Trường hợp đề xuất dự án thuộc quy mô nhóm C
    a) Nhà đầu tư gửi đề xuất dự án tới đơn vị đầu mối quản lý hoạt động PPP.
    b) Trong vòng 05 ngày làm việc kể từ ngày nhận được hồ sơ, đơn vị đầu mối quản lý hoạt động PPP kiểm tra hồ sơ và yêu cầu nhà đầu tư bổ sung nếu hồ sơ chưa đầy đủ, hợp lệ.
    c) Trong vòng 20 ngày làm việc kể từ ngày nhận được hồ sơ đầy đủ và hợp lệ, đơn vị đầu mối quản lý hoạt động PPP tổ chức thẩm định đề xuất dự án.
    d) Trong vòng 05 ngày làm việc kể từ ngày có kết luận thẩm định, đơn vị đầu mối quản lý hoạt động PPP trình Bộ trưởng Bộ Công Thương phê duyệt. Trường hợp kết luận thẩm định không thông qua đề xuất dự án, đơn vị đầu mối quản lý hoạt động PPP thông báo bằng văn bản tới nhà đầu tư đề xuất dự án và nêu rõ lý do.
    Đơn vị đầu mối quản lý hoạt động PPP có những trách nhiệm gì trong quá trình thẩm định và phê duyệt đề xuất dự án của nhà đầu tư?
    Điều 11. Báo cáo kết quả thẩm định giá, Báo cáo kết quả xác định giá trị tài sản
    1. Doanh nghiệp thẩm định giá có trách nhiệm cung cấp Chứng thư thẩm định giá và Báo cáo kết quả thẩm định giá theo quy định của Hệ thống tiêu chuẩn thẩm định giá Việt Nam.
    2. Tổ chức có chức năng tư vấn về giá có trách nhiệm lập Báo cáo kết quả xác định giá trị tài sản theo Mẫu tại Phụ lục kèm theo Thông tư này.
    3. Báo cáo kết quả thẩm định giá và Báo cáo kết quả xác định giá trị tài sản phải phản ánh trung thực, khách quan quá trình và kết quả xác định giá tài sản và là một căn cứ quan trọng để cơ quan quản lý nhiệm vụ khoa học và công nghệ trình cơ quan có thẩm quyền xem xét, phê duyệt giá trị của tài sản là kết quả của nhiệm vụ khoa học và công nghệ.
    Doanh nghiệp thẩm định giá có những trách nhiệm gì khi thực hiện thẩm định giá tài sản là kết quả của nhiệm vụ khoa học và công nghệ?
    e) Họ tên, năm sinh, nơi cư trú của phạm nhân;
    g) Lý do được tạm đình chỉ chấp hành án phạt tù;
    h) Tên cơ quan thi hành án hình sự, Ủy ban nhân dân cấp xã, đơn vị quân đội được giao quản lý người được tạm đình chỉ. Trường hợp người được tạm đình chỉ bị bệnh nặng đang phải điều trị tại bệnh viện mà phải giao cho thân nhân chăm sóc thì ghi thêm họ tên, nơi cư trú của thân nhân và mối quan hệ giữa họ;
    i) Thời hạn tạm đình chỉ chấp hành án phạt tù và hiệu lực thi hành.
    Thời hạn tạm đình chỉ chấp hành án phạt tù và thời điểm quyết định có hiệu lực thi hành được quy định như thế nào?
  • Loss: MatryoshkaLoss with these parameters:
    {
        "loss": "MultipleNegativesRankingLoss",
        "matryoshka_dims": [
            768,
            512,
            256,
            128,
            64
        ],
        "matryoshka_weights": [
            1,
            1,
            1,
            1,
            1
        ],
        "n_dims_per_step": -1
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: epoch
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • gradient_accumulation_steps: 16
  • learning_rate: 2e-05
  • num_train_epochs: 4
  • lr_scheduler_type: cosine
  • warmup_ratio: 0.1
  • fp16: True
  • dataloader_num_workers: 4
  • load_best_model_at_end: True
  • optim: adamw_torch_fused
  • ddp_find_unused_parameters: False
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: epoch
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 16
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 4
  • max_steps: -1
  • lr_scheduler_type: cosine
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 4
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • tp_size: 0
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: False
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss dim_768_cosine_ndcg@10 dim_512_cosine_ndcg@10 dim_256_cosine_ndcg@10 dim_128_cosine_ndcg@10 dim_64_cosine_ndcg@10
0.2210 10 202.143 - - - - -
0.4420 20 59.6662 - - - - -
0.6630 30 28.2853 - - - - -
0.8840 40 17.9881 - - - - -
1.0 46 - 0.6067 0.6029 0.5918 0.5690 0.5172
1.0884 50 12.2072 - - - - -
1.3094 60 9.2488 - - - - -
1.5304 70 8.6885 - - - - -
1.7514 80 8.8927 - - - - -
1.9724 90 7.7438 - - - - -
2.0 92 - 0.6467 0.6451 0.6323 0.6056 0.5596
2.1768 100 6.1924 - - - - -
2.3978 110 6.3728 - - - - -
2.6188 120 5.7702 - - - - -
2.8398 130 5.0061 - - - - -
3.0 138 - 0.6560 0.6502 0.6445 0.6196 0.5736
3.0442 140 5.6389 - - - - -
3.2652 150 5.1059 - - - - -
3.4862 160 5.1945 - - - - -
3.7072 170 5.0158 - - - - -
3.9282 180 5.092 0.6605 0.6542 0.6464 0.6218 0.5771
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.11.11
  • Sentence Transformers: 3.4.1
  • Transformers: 4.51.3
  • PyTorch: 2.6.0+cu124
  • Accelerate: 1.5.2
  • Datasets: 3.6.0
  • Tokenizers: 0.21.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MatryoshkaLoss

@misc{kusupati2024matryoshka,
    title={Matryoshka Representation Learning},
    author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
    year={2024},
    eprint={2205.13147},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}