adding model distilled on mlqa

Browse files

Files changed (7) hide show

config.json +33 -0
pytorch_model.bin +3 -0
special_tokens_map.json +9 -0
tokenizer.json +0 -0
tokenizer_config.json +23 -0
train_metrics.json +192 -0
validation_metrics.json +230 -0

config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "_name_or_path": "josecannete/albert-base-spanish-4",
+  "architectures": [
+    "AlbertForQuestionAnswering"
+  ],
+  "attention_probs_dropout_prob": 0,
+  "bos_token_id": 2,
+  "classifier_dropout_prob": 0.1,
+  "down_scale_factor": 1,
+  "embedding_size": 128,
+  "eos_token_id": 3,
+  "gap_size": 0,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "inner_group_num": 1,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "albert",
+  "net_structure_type": 0,
+  "num_attention_heads": 12,
+  "num_hidden_groups": 1,
+  "num_hidden_layers": 4,
+  "num_memory_blocks": 0,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.25.1",
+  "type_vocab_size": 2,
+  "vocab_size": 31000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0dbe5b68e2c45dc205b56ca4e70c99d04bd318b5b787c4f3171e156c080b8051
+size 44903231

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "bos_token": "[CLS]",
+  "cls_token": "[CLS]",
+  "eos_token": "[SEP]",
+  "mask_token": "[MASK]",
+  "pad_token": "<pad>",
+  "sep_token": "[SEP]",
+  "unk_token": "<unk>"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "bos_token": "[CLS]",
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "eos_token": "[SEP]",
+  "keep_accents": true,
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "[MASK]",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 512,
+  "name_or_path": "josecannete/albert-base-spanish-4",
+  "pad_token": "<pad>",
+  "remove_space": true,
+  "sep_token": "[SEP]",
+  "special_tokens_map_file": null,
+  "tokenizer_class": "AlbertTokenizer",
+  "unk_token": "<unk>"
+}

train_metrics.json ADDED Viewed

	@@ -0,0 +1,192 @@

+[
+    {
+        "kd_train_loss": 0.9267110703099266,
+        "ce_train_loss": 2.2553009721142003,
+        "epoch": 1
+    },
+    {
+        "kd_train_loss": 0.437324966422325,
+        "ce_train_loss": 1.75392818311556,
+        "epoch": 2
+    },
+    {
+        "kd_train_loss": 0.25564840695271246,
+        "ce_train_loss": 1.549681672491046,
+        "epoch": 3
+    },
+    {
+        "kd_train_loss": 0.19114146709720883,
+        "ce_train_loss": 1.467941019872809,
+        "epoch": 4
+    },
+    {
+        "kd_train_loss": 0.16233224118606057,
+        "ce_train_loss": 1.43373512829177,
+        "epoch": 5
+    },
+    {
+        "kd_train_loss": 0.1377103858840066,
+        "ce_train_loss": 1.4005313754917956,
+        "epoch": 6
+    },
+    {
+        "kd_train_loss": 0.12142761922582973,
+        "ce_train_loss": 1.3796487985090269,
+        "epoch": 7
+    },
+    {
+        "kd_train_loss": 0.10911479878325715,
+        "ce_train_loss": 1.364345971253916,
+        "epoch": 8
+    },
+    {
+        "kd_train_loss": 0.10162057526938077,
+        "ce_train_loss": 1.35470530912222,
+        "epoch": 9
+    },
+    {
+        "kd_train_loss": 0.09173406713692267,
+        "ce_train_loss": 1.34008420633322,
+        "epoch": 10
+    },
+    {
+        "kd_train_loss": 0.08481045791462632,
+        "ce_train_loss": 1.331363442719029,
+        "epoch": 11
+    },
+    {
+        "kd_train_loss": 0.07994053070887122,
+        "ce_train_loss": 1.3250762583195745,
+        "epoch": 12
+    },
+    {
+        "kd_train_loss": 0.07311130602374406,
+        "ce_train_loss": 1.3166886057736626,
+        "epoch": 13
+    },
+    {
+        "kd_train_loss": 0.06744800969400819,
+        "ce_train_loss": 1.3090809386685223,
+        "epoch": 14
+    },
+    {
+        "kd_train_loss": 0.0634845183372486,
+        "ce_train_loss": 1.3027143190358639,
+        "epoch": 15
+    },
+    {
+        "kd_train_loss": 0.059948685925253556,
+        "ce_train_loss": 1.2982534907311085,
+        "epoch": 16
+    },
+    {
+        "kd_train_loss": 0.05605776371058318,
+        "ce_train_loss": 1.294342599036818,
+        "epoch": 17
+    },
+    {
+        "kd_train_loss": 0.05173261831380247,
+        "ce_train_loss": 1.2884771879167178,
+        "epoch": 18
+    },
+    {
+        "kd_train_loss": 0.0496412553909414,
+        "ce_train_loss": 1.2861254281558194,
+        "epoch": 19
+    },
+    {
+        "kd_train_loss": 0.04744180476558645,
+        "ce_train_loss": 1.282894245670442,
+        "epoch": 20
+    },
+    {
+        "kd_train_loss": 0.04444942316904211,
+        "ce_train_loss": 1.28070035802138,
+        "epoch": 21
+    },
+    {
+        "kd_train_loss": 0.041973895603821365,
+        "ce_train_loss": 1.27674570335881,
+        "epoch": 22
+    },
+    {
+        "kd_train_loss": 0.040531559972875025,
+        "ce_train_loss": 1.275717901502934,
+        "epoch": 23
+    },
+    {
+        "kd_train_loss": 0.038666574527971904,
+        "ce_train_loss": 1.272625279166414,
+        "epoch": 24
+    },
+    {
+        "kd_train_loss": 0.036579677870675675,
+        "ce_train_loss": 1.2708269421908416,
+        "epoch": 25
+    },
+    {
+        "kd_train_loss": 0.03472885877018851,
+        "ce_train_loss": 1.267079499905126,
+        "epoch": 26
+    },
+    {
+        "kd_train_loss": 0.03300567091074616,
+        "ce_train_loss": 1.265107855630497,
+        "epoch": 27
+    },
+    {
+        "kd_train_loss": 0.031267707465856755,
+        "ce_train_loss": 1.263978869895961,
+        "epoch": 28
+    },
+    {
+        "kd_train_loss": 0.02948023329343028,
+        "ce_train_loss": 1.2610492245907534,
+        "epoch": 29
+    },
+    {
+        "kd_train_loss": 0.028111331475519707,
+        "ce_train_loss": 1.2602382712617852,
+        "epoch": 30
+    },
+    {
+        "kd_train_loss": 0.026608478986394655,
+        "ce_train_loss": 1.2580400243320227,
+        "epoch": 31
+    },
+    {
+        "kd_train_loss": 0.0248751914831327,
+        "ce_train_loss": 1.2560983723202257,
+        "epoch": 32
+    },
+    {
+        "kd_train_loss": 0.023646128705622146,
+        "ce_train_loss": 1.2534775997824903,
+        "epoch": 33
+    },
+    {
+        "kd_train_loss": 0.02271544611893031,
+        "ce_train_loss": 1.2530935516091686,
+        "epoch": 34
+    },
+    {
+        "kd_train_loss": 0.021936021171748313,
+        "ce_train_loss": 1.2515547741509376,
+        "epoch": 35
+    },
+    {
+        "kd_train_loss": 0.021128209527009924,
+        "ce_train_loss": 1.2513876314494912,
+        "epoch": 36
+    },
+    {
+        "kd_train_loss": 0.019934771938535472,
+        "ce_train_loss": 1.2498082426243802,
+        "epoch": 37
+    },
+    {
+        "kd_train_loss": 0.018994240464449558,
+        "ce_train_loss": 1.2493383634257669,
+        "epoch": 38
+    }
+]

validation_metrics.json ADDED Viewed

	@@ -0,0 +1,230 @@

+[
+    {
+        "exact_match": 37.2,
+        "f1": 59.57842060282067,
+        "validation_loss": 2.41743141412735,
+        "epoch": 1
+    },
+    {
+        "exact_match": 35.0,
+        "f1": 59.76357784672174,
+        "validation_loss": 2.4413123428821564,
+        "epoch": 2
+    },
+    {
+        "exact_match": 37.2,
+        "f1": 60.33021590001654,
+        "validation_loss": 2.419440597295761,
+        "epoch": 3
+    },
+    {
+        "exact_match": 37.0,
+        "f1": 60.876613790878174,
+        "validation_loss": 2.393815279006958,
+        "epoch": 4
+    },
+    {
+        "exact_match": 38.6,
+        "f1": 62.11650390602729,
+        "validation_loss": 2.279040962457657,
+        "epoch": 5
+    },
+    {
+        "exact_match": 36.2,
+        "f1": 60.24461119706418,
+        "validation_loss": 2.313094735145569,
+        "epoch": 6
+    },
+    {
+        "exact_match": 39.4,
+        "f1": 62.563444650375324,
+        "validation_loss": 2.3069529682397842,
+        "epoch": 7
+    },
+    {
+        "exact_match": 38.0,
+        "f1": 61.676504733167725,
+        "validation_loss": 2.2878972589969635,
+        "epoch": 8
+    },
+    {
+        "exact_match": 39.8,
+        "f1": 63.639278114254296,
+        "validation_loss": 2.2642438858747482,
+        "epoch": 9
+    },
+    {
+        "exact_match": 38.6,
+        "f1": 62.84171569640027,
+        "validation_loss": 2.236086845397949,
+        "epoch": 10
+    },
+    {
+        "exact_match": 39.2,
+        "f1": 61.88612229562657,
+        "validation_loss": 2.2972750663757324,
+        "epoch": 11
+    },
+    {
+        "exact_match": 40.0,
+        "f1": 63.41957204484483,
+        "validation_loss": 2.2380547374486923,
+        "epoch": 12
+    },
+    {
+        "exact_match": 38.8,
+        "f1": 63.0855328431726,
+        "validation_loss": 2.2377340495586395,
+        "epoch": 13
+    },
+    {
+        "exact_match": 38.6,
+        "f1": 63.128146216898976,
+        "validation_loss": 2.2086049765348434,
+        "epoch": 14
+    },
+    {
+        "exact_match": 40.0,
+        "f1": 64.54242193361432,
+        "validation_loss": 2.2143527567386627,
+        "epoch": 15
+    },
+    {
+        "exact_match": 40.0,
+        "f1": 63.278631848762295,
+        "validation_loss": 2.2167883813381195,
+        "epoch": 16
+    },
+    {
+        "exact_match": 40.2,
+        "f1": 64.27562472854457,
+        "validation_loss": 2.2080784142017365,
+        "epoch": 17
+    },
+    {
+        "exact_match": 40.0,
+        "f1": 64.15211177156412,
+        "validation_loss": 2.23178893327713,
+        "epoch": 18
+    },
+    {
+        "exact_match": 39.6,
+        "f1": 63.7482440053434,
+        "validation_loss": 2.216603860259056,
+        "epoch": 19
+    },
+    {
+        "exact_match": 39.0,
+        "f1": 62.873221029732164,
+        "validation_loss": 2.2428862750530243,
+        "epoch": 20
+    },
+    {
+        "exact_match": 38.6,
+        "f1": 63.0879279178262,
+        "validation_loss": 2.206653445959091,
+        "epoch": 21
+    },
+    {
+        "exact_match": 41.0,
+        "f1": 64.54332732301185,
+        "validation_loss": 2.2194953709840775,
+        "epoch": 22
+    },
+    {
+        "exact_match": 40.6,
+        "f1": 63.80289079581061,
+        "validation_loss": 2.203217476606369,
+        "epoch": 23
+    },
+    {
+        "exact_match": 40.0,
+        "f1": 63.404288028303924,
+        "validation_loss": 2.215685695409775,
+        "epoch": 24
+    },
+    {
+        "exact_match": 38.8,
+        "f1": 62.93220915086903,
+        "validation_loss": 2.2293421030044556,
+        "epoch": 25
+    },
+    {
+        "exact_match": 39.6,
+        "f1": 63.04610033996446,
+        "validation_loss": 2.1999125480651855,
+        "epoch": 26
+    },
+    {
+        "exact_match": 38.8,
+        "f1": 63.37994688557569,
+        "validation_loss": 2.19596266746521,
+        "epoch": 27
+    },
+    {
+        "exact_match": 39.8,
+        "f1": 63.36716124332587,
+        "validation_loss": 2.207815259695053,
+        "epoch": 28
+    },
+    {
+        "exact_match": 39.0,
+        "f1": 63.20235070703525,
+        "validation_loss": 2.2127343714237213,
+        "epoch": 29
+    },
+    {
+        "exact_match": 39.8,
+        "f1": 64.53722000128786,
+        "validation_loss": 2.2037834227085114,
+        "epoch": 30
+    },
+    {
+        "exact_match": 39.0,
+        "f1": 63.89482166971992,
+        "validation_loss": 2.202571988105774,
+        "epoch": 31
+    },
+    {
+        "exact_match": 39.6,
+        "f1": 63.50426623795006,
+        "validation_loss": 2.2169955670833588,
+        "epoch": 32
+    },
+    {
+        "exact_match": 39.2,
+        "f1": 63.413569332959725,
+        "validation_loss": 2.2177259027957916,
+        "epoch": 33
+    },
+    {
+        "exact_match": 40.2,
+        "f1": 64.15148141858079,
+        "validation_loss": 2.2170828878879547,
+        "epoch": 34
+    },
+    {
+        "exact_match": 39.2,
+        "f1": 63.379632141043025,
+        "validation_loss": 2.221564292907715,
+        "epoch": 35
+    },
+    {
+        "exact_match": 38.6,
+        "f1": 63.822407502125486,
+        "validation_loss": 2.2223614752292633,
+        "epoch": 36
+    },
+    {
+        "exact_match": 38.4,
+        "f1": 63.25330786310625,
+        "validation_loss": 2.2186082154512405,
+        "epoch": 37
+    },
+    {
+        "exact_match": 39.4,
+        "f1": 63.81577942649743,
+        "validation_loss": 2.2130299359560013,
+        "epoch": 38
+    }
+]