nomic-v2-tuned-1.4 / README.md
DGSMsRzJ6xC2JthtHG9W's picture
Add new SentenceTransformer model
2200c1f verified
metadata
language:
  - en
license: apache-2.0
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:42140
  - loss:MatryoshkaLoss
  - loss:MultipleNegativesRankingLoss
base_model: nomic-ai/nomic-embed-text-v2-moe
widget:
  - source_sentence: >-
      Какие федеральные законы вносили изменения в пункты 4 и 5 данного
      документа, и когда это произошло?
    sentences:
      - >-
        7. В случае, если в течение тридцати дней с даты получения оферты
        обществом при условии, что более продолжительный срок не предусмотрен
        уставом общества, участники общества или общество не воспользуются
        преимущественным правом покупки доли или части доли в уставном капитале
        общества, предлагаемых для продажи, в том числе образующихся в
        результате использования преимущественного права покупки не всей доли
        или не всей части доли либо отказа отдельных участников общества и
        общества от преимущественного права покупки доли или части доли в
        уставном капитале общества, оставшиеся доля или часть доли могут быть
        проданы третьему лицу по цене, которая не ниже установленной в оферте
        для общества и его участников цены, и на условиях, которые были сообщены
        обществу и его участникам, или по цене, которая не ниже заранее
        определенной уставом цены. В случае, если заранее определенная цена
        покупки доли или части доли обществом отличается от заранее определенной
        цены покупки доли или части доли участниками общества, доля или часть
        доли в уставном капитале общества может быть продана третьему лицу по
        цене, которая не ниже заранее определенной цены покупки доли или части
        доли обществом.
      - >-
        4. Избрание органов управления общества, ревизионной комиссии общества,
        если уставом общества не предусмотрено ее отсутствие, утверждение
        регистратора общества, а также в случае, предусмотренном настоящим
        пунктом, назначение аудиторской организации или индивидуального
        аудитора, привлекаемых для проведения аудита годовой бухгалтерской
        (финансовой) отчетности общества (далее - аудиторская организация
        (индивидуальный аудитор) общества), осуществляется учредителями общества
        большинством в три четверти голосов, которые представляют подлежащие
        размещению среди учредителей общества акции. (В редакции федеральных
        законов от 29.06.2015 № 210-ФЗ , от 19.07.2018 № 209-ФЗ , от 16.04.2022
        № 114-ФЗ ) При учреждении общества учредители могут назначить
        аудиторскую организацию (индивидуального аудитора) общества. В этом
        случае решение об учреждении общества должно содержать результаты
        голосования учредителей общества и принятое учредителями решение о
        назначении аудиторской организации (индивидуального аудитора) общества.
        (В редакции Федерального закона от 16.04.2022 № 114-ФЗ ) (Пункт в
        редакции Федерального закона от 27.07.2006 № 146-ФЗ ) 5. Учредители
        общества заключают между собой письменный договор о его создании,
        определяющий порядок осуществления ими совместной деятельности по
        учреждению общества, размер уставного капитала общества, категории и
        типы акций, подлежащих размещению среди учредителей, размер и порядок их
        оплаты, права и обязанности учредителей по созданию общества. Договор о
        создании общества не является учредительным документом общества и
        действует до окончания определенного договором срока оплаты акций,
        подлежащих размещению среди учредителей. (В редакции Федерального закона
        от 29.12.2012 № 282-ФЗ )
      - >-
        1. Несовершеннолетний, достигший шестнадцати лет, может быть объявлен
        полностью дееспособным, если он работает по трудовому договору, в том
        числе по контракту, или с согласия родителей, усыновителей или
        попечителя занимается предпринимательской деятельностью. Объявление
        несовершеннолетнего полностью дееспособным (эмансипация) производится по
        решению органа опеки и попечительства - с согласия обоих родителей,
        усыновителей или попечителя либо при отсутствии такого согласия - по
        решению суда. 2. Родители, усыновители и попечитель не несут
        ответственности по обязательствам эмансипированного несовершеннолетнего,
        в частности по обязательствам, возникшим вследствие причинения им вреда.
  - source_sentence: >-
      Гражданин Иванов умер, оставив после себя значительное наследство.
      Нотариус Петров ведет наследственное дело.  Иванов назначил в своем
      завещании единственным наследником благотворительный фонд "Помощь детям".
      Какое заявление должен направить нотариус Петров в уполномоченный
      государственный орган после смерти Иванова, учитывая, что наследником
      является благотворительный фонд?
    sentences:
      - >-
        4. Организация по управлению правами на коллективной основе производит
        распределение вознаграждения за использование объектов авторских и
        смежных прав между правообладателями, а также осуществляет выплату им
        указанного вознаграждения. Организация по управлению правами на
        коллективной основе вправе удерживать из вознаграждения суммы на
        покрытие необходимых расходов по сбору, распределению и выплате такого
        вознаграждения, а также суммы, которые направляются в специальные фонды,
        создаваемые этой организацией с согласия и в интересах представляемых ею
        правообладателей, в размерах и в порядке, которые предусмотрены уставом
        организации. Предельный (максимальный) размер сумм, удерживаемых
        аккредитованной организацией (статья 1244) на покрытие необходимых
        расходов по сбору, распределению и выплате вознаграждения, а также сумм,
        которые направляются в специальные фонды, устанавливается Правительством
        Российской Федерации. (В редакции Федерального закона от 14.11.2017 №
        319-ФЗ ) Распределение вознаграждения и выплата вознаграждения должны
        производиться регулярно в сроки, предусмотренные уставом организации по
        управлению правами на коллективной основе, и пропорционально
        фактическому использованию соответствующих объектов авторских и смежных
        прав, определяемому на основе сведений и документов, получаемых от
        пользователей, а также других данных об использовании объектов авторских
        и смежных прав, в том числе сведений статистического характера.
        Одновременно с выплатой вознаграждения организация по управлению правами
        на коллективной основе обязана представить правообладателю отчет,
        содержащий сведения об использовании его прав, в том числе о размере
        собранного вознаграждения и об удержанных из него суммах.
      - >-
        1. Если иное не установлено законом или договором купли-продажи,
        покупатель вправе предъявить требования, связанные с недостатками
        товара, при условии, что они обнаружены в сроки, установленные настоящей
        статьей. 2. Если на товар не установлен гарантийный срок или срок
        годности, требования, связанные с недостатками товара, могут быть
        предъявлены покупателем при условии, что недостатки проданного товара
        были обнаружены в разумный срок, но в пределах двух лет со дня передачи
        товара покупателю либо в пределах более длительного срока, когда такой
        срок установлен законом или договором купли-продажи. Срок для выявления
        недостатков товара, подлежащего перевозке или отправке по почте,
        исчисляется со дня доставки товара в место его назначения. 3. Если на
        товар установлен гарантийный срок, покупатель вправе предъявить
        требования, связанные с недостатками товара, при обнаружении недостатков
        в течение гарантийного срока. В случае, когда на комплектующее изделие в
        договоре купли-продажи установлен гарантийный срок меньшей
        продолжительности, чем на основное изделие, покупатель вправе предъявить
        требования, связанные с недостатками комплектующего изделия, при их
        обнаружении в течение гарантийного срока на основное изделие. Если на
        комплектующее изделие в договоре установлен гарантийный срок большей
        продолжительности, чем гарантийный срок на основное изделие, покупатель
        вправе предъявить требования, связанные с недостатками товара, если
        недостатки комплектующего изделия обнаружены в течение гарантийного
        срока на него, независимо от истечения гарантийного срока на основное
        изделие. 4. В отношении товара, на который установлен срок годности,
        покупатель вправе предъявить требования, связанные с недостатками
        товара, если они обнаружены в течение срока годности товара.
      - >-
        После смерти гражданина нотариус, ведущий наследственное дело,
        направляет в уполномоченный государственный орган заявление о
        государственной регистрации наследственного фонда с указанием имени или
        наименования лица (лиц), осуществляющего полномочия единоличного
        исполнительного органа фонда. (Дополнение пунктом - Федеральный закон от
        29.07.2017 № 259-ФЗ ) (Дополнение статьей - Федеральный закон от
        05.05.2014 № 99-ФЗ )
  - source_sentence: >-
      Какие юридические последствия влечет за собой смерть нотариуса,
      являющегося владельцем публичного депозитного счета?
    sentences:
      - >-
        1. Независимая гарантия не может быть отозвана или изменена гарантом,
        если в ней не предусмотрено иное. 2. В случаях, когда по условиям
        независимой гарантии допускается ее отзыв или изменение гарантом, такой
        отзыв или такое изменение производится в форме, в которой выдана
        гарантия, если иная форма не предусмотрена гарантией. 3. Если по
        условиям независимой гарантии допускается возможность ее отзыва или
        изменения гарантом с согласия бенефициара, то обязательство гаранта
        считается измененным или прекращенным с момента получения гарантом
        согласия бенефициара. 4. Изменение обязательства гаранта после выдачи
        независимой гарантии принципалу не затрагивает прав и обязанностей
        принципала, если он впоследствии не дал согласие на соответствующее
        изменение. (Статья в редакции Федерального закона от 08.03.2015 № 42-ФЗ
        )
      - >-
        1. Исключительное право на произведение действует в течение всей жизни
        автора и семидесяти лет, считая с 1 января года, следующего за годом
        смерти автора. Исключительное право на произведение, созданное в
        соавторстве, действует в течение всей жизни автора, пережившего других
        соавторов, и семидесяти лет, считая с 1 января года, следующего за годом
        его смерти. 2. На произведение, обнародованное анонимно или под
        псевдонимом, срок действия исключительного права истекает через
        семьдесят лет, считая с 1 января года, следующего за годом его
        правомерного обнародования. Если в течение указанного срока автор
        произведения, обнародованного анонимно или под псевдонимом, раскроет
        свою личность или его личность не будет далее оставлять сомнений,
        исключительное право будет действовать в течение срока, установленного
        пунктом 1 настоящей статьи. Правила настоящего пункта распространяются
        на произведения литературы, изобразительного искусства,
        декоративно-прикладного искусства, фотографические произведения,
        произведения, полученные способами, аналогичными фотографии, музыкальные
        произведения (с текстом или без текста), авторы которых предполагаются
        неизвестными (статья 1244.2). (Дополнение абзацем - Федеральный закон от
        22.07.2024 № 190-ФЗ ) 3. Исключительное право на произведение,
        обнародованное после смерти автора, действует в течение семидесяти лет
        после обнародования произведения, считая с 1 января года, следующего за
        годом его обнародования, при условии, что произведение было обнародовано
        в течение семидесяти лет после смерти автора. 4. Если автор произведения
        был репрессирован и посмертно реабилитирован, срок действия
        исключительного права считается продленным и семьдесят лет исчисляются с
        1 января года, следующего за годом реабилитации автора произведения.
      - >-
        1. В случае смерти нотариуса (иного уполномоченного на открытие
        публичного депозитного счета лица) или сложения им (прекращения) своих
        полномочий владелец публичного депозитного счета заменяется на другого
        нотариуса (иное лицо), которому в соответствии с законом, иными
        правовыми актами передаются дела нотариуса (иного лица), являвшегося
        владельцем счета. 2. В случае упразднения или преобразования органа,
        который уполномочен на открытие публичного депозитного счета, владелец
        такого счета заменяется на другой орган, к компетенции которого в
        соответствии с законом, иными правовыми актами относится открытие
        публичного депозитного счета для депонирования денежных средств
        соответствующих депонентов. 3. Договор публичного депозитного счета не
        может быть прекращен по основаниям, указанным в пунктах 2 и 4 статьи 859
        настоящего Кодекса.
  - source_sentence: >-
      Может ли договор простого товарищества прекратиться в связи со смертью
      одного из участников?  Если да, то при каких условиях?
    sentences:
      - >-
        1. В Российской Федерации признаются частная, государственная,
        муниципальная и иные формы собственности. 2. Имущество может находиться
        в собственности граждан и юридических лиц, а также Российской Федерации,
        субъектов Российской Федерации, муниципальных образований. 3.
        Особенности приобретения и прекращения права собственности на имущество,
        владения, пользования и распоряжения им в зависимости от того, находится
        имущество в собственности гражданина или юридического лица, в
        собственности Российской Федерации, субъекта Российской Федерации или
        муниципального образования, могут устанавливаться лишь законом. Законом
        определяются виды имущества, которые могут находиться только в
        государственной или муниципальной собственности. 4. Права всех
        собственников защищаются равным образом.
      - >-
        1. Увеличение уставного капитала общества допускается только после его
        полной оплаты. 2. Увеличение уставного капитала общества может
        осуществляться за счет имущества общества, и (или) за счет
        дополнительных вкладов участников общества, и (или), если это не
        запрещено уставом общества, за счет вкладов третьих лиц, принимаемых в
        общество. 3. Факт принятия решения общего собрания участников общества
        об увеличении уставного капитала и состав участников общества,
        присутствовавших при принятии указанного решения, факт принятия решения
        единственным участником общества об увеличении уставного капитала должны
        быть подтверждены путем нотариального удостоверения. (Дополнение пунктом
        - Федеральный закон от 30.03.2015 № 67-ФЗ ) (В редакции Федерального
        закона от 01.07.2021 № 267-ФЗ )
      - >-
        1. Договор простого товарищества прекращается вследствие: объявления
        кого-либо из товарищей недееспособным, ограниченно дееспособным или
        безвестно отсутствующим, если договором простого товарищества или
        последующим соглашением не предусмотрено сохранение договора в
        отношениях между остальными товарищами; объявления кого-либо из
        товарищей несостоятельным (банкротом), за изъятием, указанным в абзаце
        втором настоящего пункта; смерти товарища или ликвидации либо
        реорганизации участвующего в договоре простого товарищества юридического
        лица, если договором или последующим соглашением не предусмотрено
        сохранение договора в отношениях между остальными товарищами либо
        замещение умершего товарища (ликвидированного или реорганизованного
        юридического лица) его наследниками (правопреемниками); отказа кого-либо
        из товарищей от дальнейшего участия в бессрочном договоре простого
        товарищества, за изъятием, указанным в абзаце втором настоящего пункта;
        расторжения договора простого товарищества, заключенного с указанием
        срока, по требованию одного из товарищей в отношениях между ним и
        остальными товарищами, за изъятием, указанным в абзаце втором настоящего
        пункта; истечения срока договора простого товарищества; выдела доли
        товарища по требованию его кредитора, за изъятием, указанным в абзаце
        втором настоящего пункта. 2. При прекращении договора простого
        товарищества вещи, переданные в общее владение и (или) пользование
        товарищей, возвращаются предоставившим их товарищам без вознаграждения,
        если иное не предусмотрено соглашением сторон. С момента прекращения
        договора простого товарищества его участники несут солидарную
        ответственность по неисполненным общим обязательствам в отношении
        третьих лиц. Раздел имущества, находившегося в общей собственности
        товарищей, и возникших у них общих прав требования осуществляется в
        порядке, установленном статьей 252 настоящего Кодекса.
  - source_sentence: >-
      Компания «Электромонтаж» выполнила электромонтажные работы в офисе. 
      Гарантийный срок на работы – 6 месяцев. Через 7 месяцев обнаружен дефект
      проводки. Какой срок исковой давности применяется в данном случае?
    sentences:
      - >-
        1. Срок исковой давности для требований, предъявляемых в связи с
        ненадлежащим качеством работы, выполненной по договору подряда,
        составляет один год, а в отношении зданий и сооружений определяется по
        правилам статьи 196 настоящего Кодекса. 2. Если в соответствии с
        договором подряда результат работы принят заказчиком по частям, течение
        срока исковой давности начинается со дня приемки результата работы в
        целом. 3. Если законом, иными правовыми актами или договором подряда
        установлен гарантийный срок и заявление по поводу недостатков результата
        работы сделано в пределах гарантийного срока, течение срока исковой
        давности, указанного в пункте 1 настоящей статьи, начинается со дня
        заявления о недостатках.
      - >-
        Изменение и исключение положений устава общества, устанавливающих
        порядок определения размеров вкладов в имущество общества
        непропорционально размерам долей участников общества, а также
        ограничения, связанные с внесением вкладов в имущество общества,
        установленные для всех участников общества, осуществляются по решению
        общего собрания участников общества, принятому всеми участниками
        общества единогласно. Изменение и исключение положений устава общества,
        устанавливающих указанные ограничения для определенного участника
        общества, осуществляются по решению общего собрания участников общества,
        принятому большинством не менее двух третей голосов от общего числа
        голосов участников общества, при условии, если участник общества, для
        которого установлены такие ограничения, голосовал за принятие такого
        решения или дал письменное согласие. 3. Вклады в имущество общества
        вносятся деньгами, если иное не предусмотрено уставом общества или
        решением общего собрания участников общества. 4. Вклады в имущество
        общества не изменяют размеры и номинальную стоимость долей участников
        общества в уставном капитале общества.
      - >-
        Средства транспорта и другое имущество, предоставленные государством или
        муниципальным образованием на льготных условиях наследодателю в связи с
        его инвалидностью или другими подобными обстоятельствами, входят в
        состав наследства и наследуются на общих основаниях, установленных
        настоящим Кодексом.
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy@1
  - cosine_accuracy@3
  - cosine_accuracy@5
  - cosine_accuracy@10
  - cosine_precision@1
  - cosine_precision@3
  - cosine_precision@5
  - cosine_precision@10
  - cosine_recall@1
  - cosine_recall@3
  - cosine_recall@5
  - cosine_recall@10
  - cosine_ndcg@10
  - cosine_mrr@10
  - cosine_map@100
model-index:
  - name: nomic v2 tuned
    results:
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 768
          type: dim_768
        metrics:
          - type: cosine_accuracy@1
            value: 0.007473841554559043
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.02391629297458894
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.04505658765748452
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.1627162075592569
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.007473841554559043
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.007972097658196313
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.009011317531496905
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.01627162075592569
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.007473841554559043
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.02391629297458894
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.04505658765748452
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.1627162075592569
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.062297857301005934
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.03354670218859832
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.07460257096902427
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 512
          type: dim_512
        metrics:
          - type: cosine_accuracy@1
            value: 0.007687379884689302
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.0241298313047192
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.04740550928891736
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.16335682254964767
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.007687379884689302
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.008043277101573066
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.009481101857783473
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.016335682254964765
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.007687379884689302
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.0241298313047192
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.04740550928891736
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.16335682254964767
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.06272107849599674
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.033902345193184316
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.07482255723763048
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 256
          type: dim_256
        metrics:
          - type: cosine_accuracy@1
            value: 0.007046764894298526
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.02114029468289558
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.04228058936579116
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.15972667093743326
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.007046764894298526
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.007046764894298526
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.008456117873158232
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.01597266709374333
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.007046764894298526
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.02114029468289558
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.04228058936579116
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.15972667093743326
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.060640590982987505
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.032313603069528726
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.07275849298151062
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 128
          type: dim_128
        metrics:
          - type: cosine_accuracy@1
            value: 0.007046764894298526
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.02114029468289558
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.04356181934657271
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.15054452274183217
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.007046764894298526
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.007046764894298526
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.008712363869314543
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.015054452274183215
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.007046764894298526
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.02114029468289558
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.04356181934657271
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.15054452274183217
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.05786903277162588
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.031293788068291584
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.07086725621297205
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 64
          type: dim_64
        metrics:
          - type: cosine_accuracy@1
            value: 0.0064061499039077515
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.018791373051462737
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.03544736280162289
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.14072175955584026
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.0064061499039077515
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.0062637910171542445
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.007089472560324579
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.014072175955584028
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.0064061499039077515
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.018791373051462737
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.03544736280162289
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.14072175955584026
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.05328704452737674
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.02835102650925841
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.0644339747332149
            name: Cosine Map@100

nomic v2 tuned

This is a sentence-transformers model finetuned from nomic-ai/nomic-embed-text-v2-moe on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: nomic-ai/nomic-embed-text-v2-moe
  • Maximum Sequence Length: 512 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity
  • Training Dataset:
    • json
  • Language: en
  • License: apache-2.0

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: NomicBertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("DGSMsRzJ6xC2JthtHG9W/nomic-v2-tuned-1.4")
# Run inference
sentences = [
    'Компания «Электромонтаж» выполнила электромонтажные работы в офисе.  Гарантийный срок на работы – 6 месяцев. Через 7 месяцев обнаружен дефект проводки. Какой срок исковой давности применяется в данном случае?',
    '1. Срок исковой давности для требований, предъявляемых в связи с ненадлежащим качеством работы, выполненной по договору подряда, составляет один год, а в отношении зданий и сооружений определяется по правилам статьи 196 настоящего Кодекса. 2. Если в соответствии с договором подряда результат работы принят заказчиком по частям, течение срока исковой давности начинается со дня приемки результата работы в целом. 3. Если законом, иными правовыми актами или договором подряда установлен гарантийный срок и заявление по поводу недостатков результата работы сделано в пределах гарантийного срока, течение срока исковой давности, указанного в пункте 1 настоящей статьи, начинается со дня заявления о недостатках.',
    'Изменение и исключение положений устава общества, устанавливающих порядок определения размеров вкладов в имущество общества непропорционально размерам долей участников общества, а также ограничения, связанные с внесением вкладов в имущество общества, установленные для всех участников общества, осуществляются по решению общего собрания участников общества, принятому всеми участниками общества единогласно. Изменение и исключение положений устава общества, устанавливающих указанные ограничения для определенного участника общества, осуществляются по решению общего собрания участников общества, принятому большинством не менее двух третей голосов от общего числа голосов участников общества, при условии, если участник общества, для которого установлены такие ограничения, голосовал за принятие такого решения или дал письменное согласие. 3. Вклады в имущество общества вносятся деньгами, если иное не предусмотрено уставом общества или решением общего собрания участников общества. 4. Вклады в имущество общества не изменяют размеры и номинальную стоимость долей участников общества в уставном капитале общества.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Information Retrieval

Metric dim_768 dim_512 dim_256 dim_128 dim_64
cosine_accuracy@1 0.0075 0.0077 0.007 0.007 0.0064
cosine_accuracy@3 0.0239 0.0241 0.0211 0.0211 0.0188
cosine_accuracy@5 0.0451 0.0474 0.0423 0.0436 0.0354
cosine_accuracy@10 0.1627 0.1634 0.1597 0.1505 0.1407
cosine_precision@1 0.0075 0.0077 0.007 0.007 0.0064
cosine_precision@3 0.008 0.008 0.007 0.007 0.0063
cosine_precision@5 0.009 0.0095 0.0085 0.0087 0.0071
cosine_precision@10 0.0163 0.0163 0.016 0.0151 0.0141
cosine_recall@1 0.0075 0.0077 0.007 0.007 0.0064
cosine_recall@3 0.0239 0.0241 0.0211 0.0211 0.0188
cosine_recall@5 0.0451 0.0474 0.0423 0.0436 0.0354
cosine_recall@10 0.1627 0.1634 0.1597 0.1505 0.1407
cosine_ndcg@10 0.0623 0.0627 0.0606 0.0579 0.0533
cosine_mrr@10 0.0335 0.0339 0.0323 0.0313 0.0284
cosine_map@100 0.0746 0.0748 0.0728 0.0709 0.0644

Training Details

Training Dataset

json

  • Dataset: json
  • Size: 42,140 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 10 tokens
    • mean: 40.81 tokens
    • max: 141 tokens
    • min: 34 tokens
    • mean: 226.88 tokens
    • max: 464 tokens
  • Samples:
    anchor positive
    Решение совета директоров было обжаловано в суде, но суд оставил решение в силе. Изменяет ли обжалование решения в суде его юридическую силу, если суд его подтвердил? 8. Решения совета директоров (наблюдательного совета) общества, принятые с нарушением компетенции совета директоров (наблюдательного совета) общества, при отсутствии кворума для проведения заседания совета директоров (наблюдательного совета) общества, если наличие кворума в соответствии с настоящим Федеральным законом является обязательным условием проведения такого заседания, или без необходимого для принятия решения большинства голосов членов совета директоров (наблюдательного совета) общества, не имеют силы независимо от обжалования их в судебном порядке. (Дополнение пунктом - Федеральный закон от 19.07.2009 № 205-ФЗ )
    В результате незаконных действий сотрудников прокуратуры, дело о банкротстве компании «Бета» было затянуто на год, что привело к значительным финансовым потерям. Может ли компания «Бета» требовать возмещения убытков, и если да, то на основании какой части статьи и в каком порядке? 1. Вред, причиненный гражданину в результате незаконного осуждения, незаконного привлечения к уголовной ответственности, незаконного применения в качестве меры пресечения заключения под стражу или подписки о невыезде, незаконного привлечения к административной ответственности в виде административного ареста, а также вред, причиненный юридическому лицу в результате незаконного привлечения к административной ответственности в виде административного приостановления деятельности, возмещается за счет казны Российской Федерации, а в случаях, предусмотренных законом, за счет казны субъекта Российской Федерации или казны муниципального образования в полном объеме независимо от вины должностных лиц органов дознания, предварительного следствия, прокуратуры и суда в порядке, установленном законом. (В редакции Федерального закона от 09.05.2005 № 45-ФЗ ) 2. Вред, причиненный гражданину или юридическому лицу в результате незаконной деятельности органов дознания, предварительного следствия, прокурату...
    Какие статьи Федерального закона № 73-ФЗ касаются стоимости восстановительных работ или мероприятий по сохранению объектов культурного наследия? В случаях, когда собственник культурных ценностей, отнесенных в соответствии с законом к особо ценным и охраняемым государством, бесхозяйственно содержит эти ценности, что грозит утратой ими своего значения, такие ценности по решению суда могут быть изъяты у собственника путем выкупа государством или продажи с публичных торгов. При выкупе культурных ценностей собственнику возмещается их стоимость в размере, установленном соглашением сторон, а в случае спора - судом. При продаже с публичных торгов собственнику передается вырученная от продажи сумма за вычетом расходов на проведение торгов, а также стоимости восстановительных работ в отношении объекта культурного наследия, или стоимости мероприятий, необходимых для сохранения объекта археологического наследия, указанных в статье 40 Федерального закона от 25 июня 2002 года № 73-ФЗ "Об объектах культурного наследия (памятниках истории и культуры) народов Российской Федерации". (В редакции Федерального закона от 22.10.2014 № 315-ФЗ )
  • Loss: MatryoshkaLoss with these parameters:
    {
        "loss": "MultipleNegativesRankingLoss",
        "matryoshka_dims": [
            768,
            512,
            256,
            128,
            64
        ],
        "matryoshka_weights": [
            1,
            1,
            1,
            1,
            1
        ],
        "n_dims_per_step": -1
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: epoch
  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 16
  • gradient_accumulation_steps: 16
  • learning_rate: 2e-05
  • num_train_epochs: 4
  • lr_scheduler_type: cosine
  • warmup_ratio: 0.1
  • bf16: True
  • tf32: True
  • load_best_model_at_end: True
  • optim: adamw_torch_fused
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: epoch
  • prediction_loss_only: True
  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 16
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 4
  • max_steps: -1
  • lr_scheduler_type: cosine
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: True
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • eval_use_gather_object: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss dim_768_cosine_ndcg@10 dim_512_cosine_ndcg@10 dim_256_cosine_ndcg@10 dim_128_cosine_ndcg@10 dim_64_cosine_ndcg@10
0.1215 10 2.1586 - - - - -
0.2430 20 1.5192 - - - - -
0.3645 30 1.2178 - - - - -
0.4860 40 1.0226 - - - - -
0.6074 50 0.8285 - - - - -
0.7289 60 0.8067 - - - - -
0.8504 70 0.8069 - - - - -
0.9719 80 0.6563 - - - - -
0.9962 82 - 0.0605 0.0586 0.0555 0.0519 0.0497
1.0926 90 0.5938 - - - - -
1.2141 100 0.5605 - - - - -
1.3356 110 0.4838 - - - - -
1.4571 120 0.5023 - - - - -
1.5786 130 0.4771 - - - - -
1.7001 140 0.5294 - - - - -
1.8216 150 0.4608 - - - - -
1.9431 160 0.4833 - - - - -
1.9916 164 - 0.0626 0.0646 0.0612 0.0578 0.0541
2.0638 170 0.4273 - - - - -
2.1853 180 0.3557 - - - - -
2.3068 190 0.3496 - - - - -
2.4282 200 0.3509 - - - - -
2.5497 210 0.3588 - - - - -
2.6712 220 0.3145 - - - - -
2.7927 230 0.3764 - - - - -
2.9142 240 0.3226 - - - - -
2.9992 247 - 0.0616 0.0621 0.0563 0.0554 0.0512
3.0357 250 0.3038 - - - - -
3.1572 260 0.2591 - - - - -
3.2787 270 0.2943 - - - - -
3.4002 280 0.2728 - - - - -
3.5216 290 0.2821 - - - - -
3.6431 300 0.2756 - - - - -
3.7646 310 0.2801 - - - - -
3.8861 320 0.2999 - - - - -
3.9833 328 - 0.0623 0.0627 0.0606 0.0579 0.0533
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.11.11
  • Sentence Transformers: 3.4.1
  • Transformers: 4.43.0
  • PyTorch: 2.6.0+cu124
  • Accelerate: 1.3.0
  • Datasets: 3.4.0
  • Tokenizers: 0.19.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MatryoshkaLoss

@misc{kusupati2024matryoshka,
    title={Matryoshka Representation Learning},
    author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
    year={2024},
    eprint={2205.13147},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}