BASF-AI
/

nomic-embed-text-v1

@@ -7,14 +7,18 @@ tags:
 - mteb
 - transformers
 - transformers.js
 model-index:
 - name: epoch_0_model
   results:
   - task:
       type: Classification
     dataset:
-      type: mteb/amazon_counterfactual
       name: MTEB AmazonCounterfactualClassification (en)
       config: en
       split: test
       revision: e8379541af4e31359cca9fbcf4b00f2671dba205
@@ -28,8 +32,8 @@ model-index:
   - task:
       type: Classification
     dataset:
-      type: mteb/amazon_polarity
       name: MTEB AmazonPolarityClassification
       config: default
       split: test
       revision: e2d317d38cd51312af73b3d32a06d1a08b442046
@@ -43,8 +47,8 @@ model-index:
   - task:
       type: Classification
     dataset:
-      type: mteb/amazon_reviews_multi
       name: MTEB AmazonReviewsClassification (en)
       config: en
       split: test
       revision: 1399c76144fd37290681b995c656ef9b2e06e26d
@@ -56,8 +60,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: arguana
       name: MTEB ArguAna
       config: default
       split: test
       revision: None
@@ -125,8 +129,8 @@ model-index:
   - task:
       type: Clustering
     dataset:
-      type: mteb/arxiv-clustering-p2p
       name: MTEB ArxivClusteringP2P
       config: default
       split: test
       revision: a122ad7f3f0291bf49cc6f4d32aa80929df69d5d
@@ -136,8 +140,8 @@ model-index:
   - task:
       type: Clustering
     dataset:
-      type: mteb/arxiv-clustering-s2s
       name: MTEB ArxivClusteringS2S
       config: default
       split: test
       revision: f910caf1a6075f7329cdf8c1a6135696f37dbd53
@@ -147,8 +151,8 @@ model-index:
   - task:
       type: Reranking
     dataset:
-      type: mteb/askubuntudupquestions-reranking
       name: MTEB AskUbuntuDupQuestions
       config: default
       split: test
       revision: 2000358ca161889fa9c082cb41daa8dcfb161a54
@@ -160,8 +164,8 @@ model-index:
   - task:
       type: STS
     dataset:
-      type: mteb/biosses-sts
       name: MTEB BIOSSES
       config: default
       split: test
       revision: d3fb88f8f02e40887cd149695127462bbcf29b4a
@@ -181,8 +185,8 @@ model-index:
   - task:
       type: Classification
     dataset:
-      type: mteb/banking77
       name: MTEB Banking77Classification
       config: default
       split: test
       revision: 0fd18e25b25c072e09e0d92ab615fda904d66300
@@ -194,8 +198,8 @@ model-index:
   - task:
       type: Clustering
     dataset:
-      type: mteb/biorxiv-clustering-p2p
       name: MTEB BiorxivClusteringP2P
       config: default
       split: test
       revision: 65b79d1d13f80053f67aca9498d9402c2d9f1f40
@@ -205,8 +209,8 @@ model-index:
   - task:
       type: Clustering
     dataset:
-      type: mteb/biorxiv-clustering-s2s
       name: MTEB BiorxivClusteringS2S
       config: default
       split: test
       revision: 258694dd0231531bc1fd9de6ceb52a0853c6d908
@@ -216,8 +220,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: BeIR/cqadupstack
       name: MTEB CQADupstackAndroidRetrieval
       config: default
       split: test
       revision: None
@@ -282,15 +286,6 @@ model-index:
       value: 41.754999999999995
     - type: recall_at_5
       value: 48.296
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackEnglishRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 30.262
     - type: map_at_10
@@ -351,15 +346,6 @@ model-index:
       value: 43.129
     - type: recall_at_5
       value: 48.336
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackGamingRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 39.951
     - type: map_at_10
@@ -420,15 +406,6 @@ model-index:
       value: 56.032000000000004
     - type: recall_at_5
       value: 61.629999999999995
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackGisRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 25.566
     - type: map_at_10
@@ -489,15 +466,6 @@ model-index:
       value: 37.43
     - type: recall_at_5
       value: 41.894999999999996
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackMathematicaRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 16.663
     - type: map_at_10
@@ -558,15 +526,6 @@ model-index:
       value: 25.907999999999998
     - type: recall_at_5
       value: 31.214
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackPhysicsRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 27.695999999999998
     - type: map_at_10
@@ -627,15 +586,6 @@ model-index:
       value: 41.13
     - type: recall_at_5
       value: 46.872
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackProgrammersRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 24.108
     - type: map_at_10
@@ -696,15 +646,6 @@ model-index:
       value: 37.662
     - type: recall_at_5
       value: 42.565
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 25.00791666666667
     - type: map_at_10
@@ -765,15 +706,6 @@ model-index:
       value: 36.660916666666665
     - type: recall_at_5
       value: 41.94149999999999
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackStatsRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 23.521
     - type: map_at_10
@@ -834,15 +766,6 @@ model-index:
       value: 32.614
     - type: recall_at_5
       value: 37.15
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackTexRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 16.236
     - type: map_at_10
@@ -903,15 +826,6 @@ model-index:
       value: 26.179999999999996
     - type: recall_at_5
       value: 30.712
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackUnixRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 24.11
     - type: map_at_10
@@ -972,15 +886,6 @@ model-index:
       value: 34.724
     - type: recall_at_5
       value: 39.925
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackWebmastersRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 22.091
     - type: map_at_10
@@ -1041,15 +946,6 @@ model-index:
       value: 33.158
     - type: recall_at_5
       value: 39.086999999999996
-  - task:
-      type: Retrieval
-    dataset:
-      type: BeIR/cqadupstack
-      name: MTEB CQADupstackWordpressRetrieval
-      config: default
-      split: test
-      revision: None
-    metrics:
     - type: map_at_1
       value: 19.883
     - type: map_at_10
@@ -1113,8 +1009,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: climate-fever
       name: MTEB ClimateFEVER
       config: default
       split: test
       revision: None
@@ -1182,8 +1078,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: dbpedia-entity
       name: MTEB DBPedia
       config: default
       split: test
       revision: None
@@ -1251,8 +1147,8 @@ model-index:
   - task:
       type: Classification
     dataset:
-      type: mteb/emotion
       name: MTEB EmotionClassification
       config: default
       split: test
       revision: 4f58c6b202a23cf9a4da393831edf4f9183cad37
@@ -1264,8 +1160,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: fever
       name: MTEB FEVER
       config: default
       split: test
       revision: None
@@ -1333,8 +1229,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: fiqa
       name: MTEB FiQA2018
       config: default
       split: test
       revision: None
@@ -1402,8 +1298,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: hotpotqa
       name: MTEB HotpotQA
       config: default
       split: test
       revision: None
@@ -1471,8 +1367,8 @@ model-index:
   - task:
       type: Classification
     dataset:
-      type: mteb/imdb
       name: MTEB ImdbClassification
       config: default
       split: test
       revision: 3d86128a09e091d6018b6d26cad27f2739fc2db7
@@ -1486,8 +1382,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: msmarco
       name: MTEB MSMARCO
       config: default
       split: dev
       revision: None
@@ -1555,8 +1451,8 @@ model-index:
   - task:
       type: Classification
     dataset:
-      type: mteb/mtop_domain
       name: MTEB MTOPDomainClassification (en)
       config: en
       split: test
       revision: d80d48c1eb48d3562165c59d59d0034df9fff0bf
@@ -1568,8 +1464,8 @@ model-index:
   - task:
       type: Classification
     dataset:
-      type: mteb/mtop_intent
       name: MTEB MTOPIntentClassification (en)
       config: en
       split: test
       revision: ae001d0e6b1228650b7bd1c2c65fb50ad11a8aba
@@ -1581,8 +1477,8 @@ model-index:
   - task:
       type: Classification
     dataset:
-      type: mteb/amazon_massive_intent
       name: MTEB MassiveIntentClassification (en)
       config: en
       split: test
       revision: 31efe3c427b0bae9c22cbb560b8f15491cc6bed7
@@ -1594,8 +1490,8 @@ model-index:
   - task:
       type: Classification
     dataset:
-      type: mteb/amazon_massive_scenario
       name: MTEB MassiveScenarioClassification (en)
       config: en
       split: test
       revision: 7d571f92784cd94a019292a1f45445077d0ef634
@@ -1607,8 +1503,8 @@ model-index:
   - task:
       type: Clustering
     dataset:
-      type: mteb/medrxiv-clustering-p2p
       name: MTEB MedrxivClusteringP2P
       config: default
       split: test
       revision: e7a26af6f3ae46b30dde8737f02c07b1505bcc73
@@ -1618,8 +1514,8 @@ model-index:
   - task:
       type: Clustering
     dataset:
-      type: mteb/medrxiv-clustering-s2s
       name: MTEB MedrxivClusteringS2S
       config: default
       split: test
       revision: 35191c8c0dca72d8ff3efcd72aa802307d469663
@@ -1629,8 +1525,8 @@ model-index:
   - task:
       type: Reranking
     dataset:
-      type: mteb/mind_small
       name: MTEB MindSmallReranking
       config: default
       split: test
       revision: 3bdac13927fdc888b903db93b2ffdbd90b295a69
@@ -1642,8 +1538,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: nfcorpus
       name: MTEB NFCorpus
       config: default
       split: test
       revision: None
@@ -1711,8 +1607,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: nq
       name: MTEB NQ
       config: default
       split: test
       revision: None
@@ -1780,8 +1676,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: quora
       name: MTEB QuoraRetrieval
       config: default
       split: test
       revision: None
@@ -1849,8 +1745,8 @@ model-index:
   - task:
       type: Clustering
     dataset:
-      type: mteb/reddit-clustering
       name: MTEB RedditClustering
       config: default
       split: test
       revision: 24640382cdbf8abc73003fb0fa6d111a705499eb
@@ -1860,8 +1756,8 @@ model-index:
   - task:
       type: Clustering
     dataset:
-      type: mteb/reddit-clustering-p2p
       name: MTEB RedditClusteringP2P
       config: default
       split: test
       revision: 282350215ef01743dc01b456c7f5241fa8937f16
@@ -1871,8 +1767,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: scidocs
       name: MTEB SCIDOCS
       config: default
       split: test
       revision: None
@@ -1940,8 +1836,8 @@ model-index:
   - task:
       type: STS
     dataset:
-      type: mteb/sickr-sts
       name: MTEB SICK-R
       config: default
       split: test
       revision: a6ea5a8cab320b040a23452cc28066d9beae2cee
@@ -1961,8 +1857,8 @@ model-index:
   - task:
       type: STS
     dataset:
-      type: mteb/sts12-sts
       name: MTEB STS12
       config: default
       split: test
       revision: a0d554a64d88156834ff5ae9920b964011b16384
@@ -1982,8 +1878,8 @@ model-index:
   - task:
       type: STS
     dataset:
-      type: mteb/sts13-sts
       name: MTEB STS13
       config: default
       split: test
       revision: 7e90230a92c190f1bf69ae9002b8cea547a64cca
@@ -2003,8 +1899,8 @@ model-index:
   - task:
       type: STS
     dataset:
-      type: mteb/sts14-sts
       name: MTEB STS14
       config: default
       split: test
       revision: 6031580fec1f6af667f0bd2da0a551cf4f0b2375
@@ -2024,8 +1920,8 @@ model-index:
   - task:
       type: STS
     dataset:
-      type: mteb/sts15-sts
       name: MTEB STS15
       config: default
       split: test
       revision: ae752c7c21bf194d8b67fd573edf7ae58183cbe3
@@ -2045,8 +1941,8 @@ model-index:
   - task:
       type: STS
     dataset:
-      type: mteb/sts16-sts
       name: MTEB STS16
       config: default
       split: test
       revision: 4d8694f8f0e0100860b497b999b3dbed754a0513
@@ -2066,8 +1962,8 @@ model-index:
   - task:
       type: STS
     dataset:
-      type: mteb/sts17-crosslingual-sts
       name: MTEB STS17 (en-en)
       config: en-en
       split: test
       revision: af5e6fb845001ecf41f4c1e033ce921939a2a68d
@@ -2087,8 +1983,8 @@ model-index:
   - task:
       type: STS
     dataset:
-      type: mteb/sts22-crosslingual-sts
       name: MTEB STS22 (en)
       config: en
       split: test
       revision: 6d1ba47164174a496b7fa5d3569dae26a6813b80
@@ -2108,8 +2004,8 @@ model-index:
   - task:
       type: STS
     dataset:
-      type: mteb/stsbenchmark-sts
       name: MTEB STSBenchmark
       config: default
       split: test
       revision: b0fddb56ed78048fa8b90373c8a3cfc37b684831
@@ -2129,8 +2025,8 @@ model-index:
   - task:
       type: Reranking
     dataset:
-      type: mteb/scidocs-reranking
       name: MTEB SciDocsRR
       config: default
       split: test
       revision: d3c5e1fc0b855ab6097bf1cda04dd73947d7caab
@@ -2142,8 +2038,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: scifact
       name: MTEB SciFact
       config: default
       split: test
       revision: None
@@ -2211,8 +2107,8 @@ model-index:
   - task:
       type: PairClassification
     dataset:
-      type: mteb/sprintduplicatequestions-pairclassification
       name: MTEB SprintDuplicateQuestions
       config: default
       split: test
       revision: d66bd1f72af766a5cc4b0ca5e00c162f89e8cc46
@@ -2266,8 +2162,8 @@ model-index:
   - task:
       type: Clustering
     dataset:
-      type: mteb/stackexchange-clustering
       name: MTEB StackExchangeClustering
       config: default
       split: test
       revision: 6cbc1f7b2bc0622f2e39d2c77fa502909748c259
@@ -2277,8 +2173,8 @@ model-index:
   - task:
       type: Clustering
     dataset:
-      type: mteb/stackexchange-clustering-p2p
       name: MTEB StackExchangeClusteringP2P
       config: default
       split: test
       revision: 815ca46b2622cec33ccafc3735d572c266efdb44
@@ -2288,8 +2184,8 @@ model-index:
   - task:
       type: Reranking
     dataset:
-      type: mteb/stackoverflowdupquestions-reranking
       name: MTEB StackOverflowDupQuestions
       config: default
       split: test
       revision: e185fbe320c72810689fc5848eb6114e1ef5ec69
@@ -2301,8 +2197,8 @@ model-index:
   - task:
       type: Summarization
     dataset:
-      type: mteb/summeval
       name: MTEB SummEval
       config: default
       split: test
       revision: cda12ad7615edc362dbf25a00fdd61d3b1eaf93c
@@ -2318,8 +2214,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: trec-covid
       name: MTEB TRECCOVID
       config: default
       split: test
       revision: None
@@ -2387,8 +2283,8 @@ model-index:
   - task:
       type: Retrieval
     dataset:
-      type: webis-touche2020
       name: MTEB Touche2020
       config: default
       split: test
       revision: None
@@ -2456,8 +2352,8 @@ model-index:
   - task:
       type: Classification
     dataset:
-      type: mteb/toxic_conversations_50k
       name: MTEB ToxicConversationsClassification
       config: default
       split: test
       revision: d7c0de2777da35d6aae2200a62c6e0e5af397c4c
@@ -2471,8 +2367,8 @@ model-index:
   - task:
       type: Classification
     dataset:
-      type: mteb/tweet_sentiment_extraction
       name: MTEB TweetSentimentExtractionClassification
       config: default
       split: test
       revision: d604517c81ca91fe16a244d1248fc021f9ecee7a
@@ -2484,8 +2380,8 @@ model-index:
   - task:
       type: Clustering
     dataset:
-      type: mteb/twentynewsgroups-clustering
       name: MTEB TwentyNewsgroupsClustering
       config: default
       split: test
       revision: 6125ec4e24fa026cec8a478383ee943acfbd5449
@@ -2495,8 +2391,8 @@ model-index:
   - task:
       type: PairClassification
     dataset:
-      type: mteb/twittersemeval2015-pairclassification
       name: MTEB TwitterSemEval2015
       config: default
       split: test
       revision: 70970daeab8776df92f5ea462b6173c0b46fd2d1
@@ -2550,8 +2446,8 @@ model-index:
   - task:
       type: PairClassification
     dataset:
-      type: mteb/twitterurlcorpus-pairclassification
       name: MTEB TwitterURLCorpus
       config: default
       split: test
       revision: 8b6510b0b1fa4e4c4f879467980e9be563ec1cdf
@@ -2602,10 +2498,6 @@ model-index:
       value: 86.71257651501476
     - type: max_f1
       value: 79.13867741453949
-license: apache-2.0
-language:
-- en
-new_version: nomic-ai/nomic-embed-text-v1.5
 ---

 - mteb
 - transformers
 - transformers.js
+license: apache-2.0
+language:
+- en
+new_version: nomic-ai/nomic-embed-text-v1.5
 model-index:
 - name: epoch_0_model
   results:
   - task:
       type: Classification
     dataset:
       name: MTEB AmazonCounterfactualClassification (en)
+      type: mteb/amazon_counterfactual
       config: en
       split: test
       revision: e8379541af4e31359cca9fbcf4b00f2671dba205
   - task:
       type: Classification
     dataset:
       name: MTEB AmazonPolarityClassification
+      type: mteb/amazon_polarity
       config: default
       split: test
       revision: e2d317d38cd51312af73b3d32a06d1a08b442046
   - task:
       type: Classification
     dataset:
       name: MTEB AmazonReviewsClassification (en)
+      type: mteb/amazon_reviews_multi
       config: en
       split: test
       revision: 1399c76144fd37290681b995c656ef9b2e06e26d
   - task:
       type: Retrieval
     dataset:
       name: MTEB ArguAna
+      type: arguana
       config: default
       split: test
       revision: None
   - task:
       type: Clustering
     dataset:
       name: MTEB ArxivClusteringP2P
+      type: mteb/arxiv-clustering-p2p
       config: default
       split: test
       revision: a122ad7f3f0291bf49cc6f4d32aa80929df69d5d
   - task:
       type: Clustering
     dataset:
       name: MTEB ArxivClusteringS2S
+      type: mteb/arxiv-clustering-s2s
       config: default
       split: test
       revision: f910caf1a6075f7329cdf8c1a6135696f37dbd53
   - task:
       type: Reranking
     dataset:
       name: MTEB AskUbuntuDupQuestions
+      type: mteb/askubuntudupquestions-reranking
       config: default
       split: test
       revision: 2000358ca161889fa9c082cb41daa8dcfb161a54
   - task:
       type: STS
     dataset:
       name: MTEB BIOSSES
+      type: mteb/biosses-sts
       config: default
       split: test
       revision: d3fb88f8f02e40887cd149695127462bbcf29b4a
   - task:
       type: Classification
     dataset:
       name: MTEB Banking77Classification
+      type: mteb/banking77
       config: default
       split: test
       revision: 0fd18e25b25c072e09e0d92ab615fda904d66300
   - task:
       type: Clustering
     dataset:
       name: MTEB BiorxivClusteringP2P
+      type: mteb/biorxiv-clustering-p2p
       config: default
       split: test
       revision: 65b79d1d13f80053f67aca9498d9402c2d9f1f40
   - task:
       type: Clustering
     dataset:
       name: MTEB BiorxivClusteringS2S
+      type: mteb/biorxiv-clustering-s2s
       config: default
       split: test
       revision: 258694dd0231531bc1fd9de6ceb52a0853c6d908
   - task:
       type: Retrieval
     dataset:
       name: MTEB CQADupstackAndroidRetrieval
+      type: BeIR/cqadupstack
       config: default
       split: test
       revision: None
       value: 41.754999999999995
     - type: recall_at_5
       value: 48.296
     - type: map_at_1
       value: 30.262
     - type: map_at_10
       value: 43.129
     - type: recall_at_5
       value: 48.336
     - type: map_at_1
       value: 39.951
     - type: map_at_10
       value: 56.032000000000004
     - type: recall_at_5
       value: 61.629999999999995
     - type: map_at_1
       value: 25.566
     - type: map_at_10
       value: 37.43
     - type: recall_at_5
       value: 41.894999999999996
     - type: map_at_1
       value: 16.663
     - type: map_at_10
       value: 25.907999999999998
     - type: recall_at_5
       value: 31.214
     - type: map_at_1
       value: 27.695999999999998
     - type: map_at_10
       value: 41.13
     - type: recall_at_5
       value: 46.872
     - type: map_at_1
       value: 24.108
     - type: map_at_10
       value: 37.662
     - type: recall_at_5
       value: 42.565
     - type: map_at_1
       value: 25.00791666666667
     - type: map_at_10
       value: 36.660916666666665
     - type: recall_at_5
       value: 41.94149999999999
     - type: map_at_1
       value: 23.521
     - type: map_at_10
       value: 32.614
     - type: recall_at_5
       value: 37.15
     - type: map_at_1
       value: 16.236
     - type: map_at_10
       value: 26.179999999999996
     - type: recall_at_5
       value: 30.712
     - type: map_at_1
       value: 24.11
     - type: map_at_10
       value: 34.724
     - type: recall_at_5
       value: 39.925
     - type: map_at_1
       value: 22.091
     - type: map_at_10
       value: 33.158
     - type: recall_at_5
       value: 39.086999999999996
     - type: map_at_1
       value: 19.883
     - type: map_at_10
   - task:
       type: Retrieval
     dataset:
       name: MTEB ClimateFEVER
+      type: climate-fever
       config: default
       split: test
       revision: None
   - task:
       type: Retrieval
     dataset:
       name: MTEB DBPedia
+      type: dbpedia-entity
       config: default
       split: test
       revision: None
   - task:
       type: Classification
     dataset:
       name: MTEB EmotionClassification
+      type: mteb/emotion
       config: default
       split: test
       revision: 4f58c6b202a23cf9a4da393831edf4f9183cad37
   - task:
       type: Retrieval
     dataset:
       name: MTEB FEVER
+      type: fever
       config: default
       split: test
       revision: None
   - task:
       type: Retrieval
     dataset:
       name: MTEB FiQA2018
+      type: fiqa
       config: default
       split: test
       revision: None
   - task:
       type: Retrieval
     dataset:
       name: MTEB HotpotQA
+      type: hotpotqa
       config: default
       split: test
       revision: None
   - task:
       type: Classification
     dataset:
       name: MTEB ImdbClassification
+      type: mteb/imdb
       config: default
       split: test
       revision: 3d86128a09e091d6018b6d26cad27f2739fc2db7
   - task:
       type: Retrieval
     dataset:
       name: MTEB MSMARCO
+      type: msmarco
       config: default
       split: dev
       revision: None
   - task:
       type: Classification
     dataset:
       name: MTEB MTOPDomainClassification (en)
+      type: mteb/mtop_domain
       config: en
       split: test
       revision: d80d48c1eb48d3562165c59d59d0034df9fff0bf
   - task:
       type: Classification
     dataset:
       name: MTEB MTOPIntentClassification (en)
+      type: mteb/mtop_intent
       config: en
       split: test
       revision: ae001d0e6b1228650b7bd1c2c65fb50ad11a8aba
   - task:
       type: Classification
     dataset:
       name: MTEB MassiveIntentClassification (en)
+      type: mteb/amazon_massive_intent
       config: en
       split: test
       revision: 31efe3c427b0bae9c22cbb560b8f15491cc6bed7
   - task:
       type: Classification
     dataset:
       name: MTEB MassiveScenarioClassification (en)
+      type: mteb/amazon_massive_scenario
       config: en
       split: test
       revision: 7d571f92784cd94a019292a1f45445077d0ef634
   - task:
       type: Clustering
     dataset:
       name: MTEB MedrxivClusteringP2P
+      type: mteb/medrxiv-clustering-p2p
       config: default
       split: test
       revision: e7a26af6f3ae46b30dde8737f02c07b1505bcc73
   - task:
       type: Clustering
     dataset:
       name: MTEB MedrxivClusteringS2S
+      type: mteb/medrxiv-clustering-s2s
       config: default
       split: test
       revision: 35191c8c0dca72d8ff3efcd72aa802307d469663
   - task:
       type: Reranking
     dataset:
       name: MTEB MindSmallReranking
+      type: mteb/mind_small
       config: default
       split: test
       revision: 3bdac13927fdc888b903db93b2ffdbd90b295a69
   - task:
       type: Retrieval
     dataset:
       name: MTEB NFCorpus
+      type: nfcorpus
       config: default
       split: test
       revision: None
   - task:
       type: Retrieval
     dataset:
       name: MTEB NQ
+      type: nq
       config: default
       split: test
       revision: None
   - task:
       type: Retrieval
     dataset:
       name: MTEB QuoraRetrieval
+      type: quora
       config: default
       split: test
       revision: None
   - task:
       type: Clustering
     dataset:
       name: MTEB RedditClustering
+      type: mteb/reddit-clustering
       config: default
       split: test
       revision: 24640382cdbf8abc73003fb0fa6d111a705499eb
   - task:
       type: Clustering
     dataset:
       name: MTEB RedditClusteringP2P
+      type: mteb/reddit-clustering-p2p
       config: default
       split: test
       revision: 282350215ef01743dc01b456c7f5241fa8937f16
   - task:
       type: Retrieval
     dataset:
       name: MTEB SCIDOCS
+      type: scidocs
       config: default
       split: test
       revision: None
   - task:
       type: STS
     dataset:
       name: MTEB SICK-R
+      type: mteb/sickr-sts
       config: default
       split: test
       revision: a6ea5a8cab320b040a23452cc28066d9beae2cee
   - task:
       type: STS
     dataset:
       name: MTEB STS12
+      type: mteb/sts12-sts
       config: default
       split: test
       revision: a0d554a64d88156834ff5ae9920b964011b16384
   - task:
       type: STS
     dataset:
       name: MTEB STS13
+      type: mteb/sts13-sts
       config: default
       split: test
       revision: 7e90230a92c190f1bf69ae9002b8cea547a64cca
   - task:
       type: STS
     dataset:
       name: MTEB STS14
+      type: mteb/sts14-sts
       config: default
       split: test
       revision: 6031580fec1f6af667f0bd2da0a551cf4f0b2375
   - task:
       type: STS
     dataset:
       name: MTEB STS15
+      type: mteb/sts15-sts
       config: default
       split: test
       revision: ae752c7c21bf194d8b67fd573edf7ae58183cbe3
   - task:
       type: STS
     dataset:
       name: MTEB STS16
+      type: mteb/sts16-sts
       config: default
       split: test
       revision: 4d8694f8f0e0100860b497b999b3dbed754a0513
   - task:
       type: STS
     dataset:
       name: MTEB STS17 (en-en)
+      type: mteb/sts17-crosslingual-sts
       config: en-en
       split: test
       revision: af5e6fb845001ecf41f4c1e033ce921939a2a68d
   - task:
       type: STS
     dataset:
       name: MTEB STS22 (en)
+      type: mteb/sts22-crosslingual-sts
       config: en
       split: test
       revision: 6d1ba47164174a496b7fa5d3569dae26a6813b80
   - task:
       type: STS
     dataset:
       name: MTEB STSBenchmark
+      type: mteb/stsbenchmark-sts
       config: default
       split: test
       revision: b0fddb56ed78048fa8b90373c8a3cfc37b684831
   - task:
       type: Reranking
     dataset:
       name: MTEB SciDocsRR
+      type: mteb/scidocs-reranking
       config: default
       split: test
       revision: d3c5e1fc0b855ab6097bf1cda04dd73947d7caab
   - task:
       type: Retrieval
     dataset:
       name: MTEB SciFact
+      type: scifact
       config: default
       split: test
       revision: None
   - task:
       type: PairClassification
     dataset:
       name: MTEB SprintDuplicateQuestions
+      type: mteb/sprintduplicatequestions-pairclassification
       config: default
       split: test
       revision: d66bd1f72af766a5cc4b0ca5e00c162f89e8cc46
   - task:
       type: Clustering
     dataset:
       name: MTEB StackExchangeClustering
+      type: mteb/stackexchange-clustering
       config: default
       split: test
       revision: 6cbc1f7b2bc0622f2e39d2c77fa502909748c259
   - task:
       type: Clustering
     dataset:
       name: MTEB StackExchangeClusteringP2P
+      type: mteb/stackexchange-clustering-p2p
       config: default
       split: test
       revision: 815ca46b2622cec33ccafc3735d572c266efdb44
   - task:
       type: Reranking
     dataset:
       name: MTEB StackOverflowDupQuestions
+      type: mteb/stackoverflowdupquestions-reranking
       config: default
       split: test
       revision: e185fbe320c72810689fc5848eb6114e1ef5ec69
   - task:
       type: Summarization
     dataset:
       name: MTEB SummEval
+      type: mteb/summeval
       config: default
       split: test
       revision: cda12ad7615edc362dbf25a00fdd61d3b1eaf93c
   - task:
       type: Retrieval
     dataset:
       name: MTEB TRECCOVID
+      type: trec-covid
       config: default
       split: test
       revision: None
   - task:
       type: Retrieval
     dataset:
       name: MTEB Touche2020
+      type: webis-touche2020
       config: default
       split: test
       revision: None
   - task:
       type: Classification
     dataset:
       name: MTEB ToxicConversationsClassification
+      type: mteb/toxic_conversations_50k
       config: default
       split: test
       revision: d7c0de2777da35d6aae2200a62c6e0e5af397c4c
   - task:
       type: Classification
     dataset:
       name: MTEB TweetSentimentExtractionClassification
+      type: mteb/tweet_sentiment_extraction
       config: default
       split: test
       revision: d604517c81ca91fe16a244d1248fc021f9ecee7a
   - task:
       type: Clustering
     dataset:
       name: MTEB TwentyNewsgroupsClustering
+      type: mteb/twentynewsgroups-clustering
       config: default
       split: test
       revision: 6125ec4e24fa026cec8a478383ee943acfbd5449
   - task:
       type: PairClassification
     dataset:
       name: MTEB TwitterSemEval2015
+      type: mteb/twittersemeval2015-pairclassification
       config: default
       split: test
       revision: 70970daeab8776df92f5ea462b6173c0b46fd2d1
   - task:
       type: PairClassification
     dataset:
       name: MTEB TwitterURLCorpus
+      type: mteb/twitterurlcorpus-pairclassification
       config: default
       split: test
       revision: 8b6510b0b1fa4e4c4f879467980e9be563ec1cdf
       value: 86.71257651501476
     - type: max_f1
       value: 79.13867741453949
 ---

config.json CHANGED Viewed

@@ -4,20 +4,21 @@
     "NomicBertModel"
   ],
   "attn_pdrop": 0.0,
-  "auto_map": {
-    "AutoConfig": "BASF-AI/nomic-bert-2048--configuration_hf_nomic_bert.NomicBertConfig",
-    "AutoModel": "BASF-AI/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertModel",
-    "AutoModelForMaskedLM": "BASF-AI/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForPreTraining"
   },
   "bos_token_id": null,
   "causal": false,
   "dense_seq_output": true,
-  "embd_pdrop": 0.0,
   "eos_token_id": null,
   "fused_bias_fc": true,
   "fused_dropout_add_ln": true,
   "initializer_range": 0.02,
   "layer_norm_epsilon": 1e-12,
   "mlp_fc1_bias": false,
   "mlp_fc2_bias": false,
   "model_type": "nomic_bert",
@@ -32,12 +33,12 @@
   "prenorm": false,
   "qkv_proj_bias": false,
   "reorder_and_upcast_attn": false,
-  "resid_pdrop": 0.0,
   "rotary_emb_base": 1000,
   "rotary_emb_fraction": 1.0,
   "rotary_emb_interleaved": false,
   "rotary_emb_scale_base": null,
-  "rotary_scaling_factor": 2,
   "scale_attn_by_inverse_layer_idx": false,
   "scale_attn_weights": true,
   "summary_activation": null,
@@ -46,7 +47,7 @@
   "summary_type": "cls_index",
   "summary_use_proj": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.34.0",
   "type_vocab_size": 2,
   "use_cache": true,
   "use_flash_attn": true,

     "NomicBertModel"
   ],
   "attn_pdrop": 0.0,
+  "auto_map": {
+    "AutoConfig": "configuration_hf_nomic_bert.NomicBertConfig",
+    "AutoModel": "modeling_hf_nomic_bert.NomicBertModel",
+    "AutoModelForMaskedLM": "modeling_hf_nomic_bert.NomicBertForPreTraining"
   },
   "bos_token_id": null,
   "causal": false,
   "dense_seq_output": true,
+  "embd_pdrop": 0.1,
   "eos_token_id": null,
   "fused_bias_fc": true,
   "fused_dropout_add_ln": true,
   "initializer_range": 0.02,
   "layer_norm_epsilon": 1e-12,
+  "max_trained_positions": 2048,
   "mlp_fc1_bias": false,
   "mlp_fc2_bias": false,
   "model_type": "nomic_bert",
   "prenorm": false,
   "qkv_proj_bias": false,
   "reorder_and_upcast_attn": false,
+  "resid_pdrop": 0.1,
   "rotary_emb_base": 1000,
   "rotary_emb_fraction": 1.0,
   "rotary_emb_interleaved": false,
   "rotary_emb_scale_base": null,
+  "rotary_scaling_factor": null,
   "scale_attn_by_inverse_layer_idx": false,
   "scale_attn_weights": true,
   "summary_activation": null,
   "summary_type": "cls_index",
   "summary_use_proj": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.50.3",
   "type_vocab_size": 2,
   "use_cache": true,
   "use_flash_attn": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:47e396424a085a613034450cd4bf9e8acfb568b19089ae1c5c4e7051ae286877
 size 546938168

 version https://git-lfs.github.com/spec/v1
+oid sha256:2cdcf04b88cd3bd1228e0f8932c4e4c76af3a8ccefc46c0112092181cf70d387
 size 546938168