Delete checkpoints

Browse files

Files changed (5) hide show

checkpoints/checkpoint-408/adapter.safetensors +0 -3
checkpoints/checkpoint-408/optimizer.pt +0 -3
checkpoints/checkpoint-408/rng_state.pth +0 -3
checkpoints/checkpoint-408/scheduler.pt +0 -3
checkpoints/checkpoint-408/trainer_state.json +0 -360

checkpoints/checkpoint-408/adapter.safetensors DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:983952edf714374c6e674f56ed4de55c61049452f9c3d7048f5e92ceb4b77c7f
-size 6439640

checkpoints/checkpoint-408/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:4d142f611fe97236ef3df07856eadbc9b2d0593f8e4d9b592fce4c870449eba8
-size 3304962

checkpoints/checkpoint-408/rng_state.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:5ed0adb262ae5a32b0426ae5f447cd38d4498b7741803b88609e5036322fb8d3
-size 14244

checkpoints/checkpoint-408/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:308aef47a7e13f7067a6469ac9a30684921e5d2059f036308d7ee97689efbaeb
-size 1064

checkpoints/checkpoint-408/trainer_state.json DELETED Viewed

@@ -1,360 +0,0 @@
-{
-  "best_metric": null,
-  "best_model_checkpoint": null,
-  "epoch": 8.0,
-  "eval_steps": 500,
-  "global_step": 408,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.3137254901960784,
-      "grad_norm": 1.1791675090789795,
-      "learning_rate": 1.7073170731707317e-07,
-      "loss": 9.2388,
-      "step": 16
-    },
-    {
-      "epoch": 0.6274509803921569,
-      "grad_norm": 1.0611275434494019,
-      "learning_rate": 3.6585365853658536e-07,
-      "loss": 9.2418,
-      "step": 32
-    },
-    {
-      "epoch": 0.9411764705882353,
-      "grad_norm": 1.4214043617248535,
-      "learning_rate": 5.609756097560975e-07,
-      "loss": 9.2444,
-      "step": 48
-    },
-    {
-      "epoch": 1.0,
-      "eval_bleu": 0.2649535678833101,
-      "eval_cap_loss": 1.862084381720599,
-      "eval_con_loss": 2.059098891183442,
-      "eval_loss": 5.049239996601553,
-      "step": 51
-    },
-    {
-      "epoch": 1.0,
-      "eval_bleu": 0.2649535678833101,
-      "eval_cap_loss": 1.862084381720599,
-      "eval_con_loss": 2.059098891183442,
-      "eval_loss": 5.049239996601553,
-      "eval_runtime": 30.9562,
-      "eval_samples_per_second": 26.134,
-      "eval_steps_per_second": 3.295,
-      "step": 51
-    },
-    {
-      "epoch": 1.2549019607843137,
-      "grad_norm": 1.0868176221847534,
-      "learning_rate": 7.560975609756097e-07,
-      "loss": 9.1113,
-      "step": 64
-    },
-    {
-      "epoch": 1.5686274509803921,
-      "grad_norm": 1.048159122467041,
-      "learning_rate": 9.390243902439024e-07,
-      "loss": 9.2393,
-      "step": 80
-    },
-    {
-      "epoch": 1.8823529411764706,
-      "grad_norm": 1.2898032665252686,
-      "learning_rate": 9.97193382647516e-07,
-      "loss": 9.2355,
-      "step": 96
-    },
-    {
-      "epoch": 2.0,
-      "eval_bleu": 0.26492614431633255,
-      "eval_cap_loss": 1.8576759625883663,
-      "eval_con_loss": 2.059098112816904,
-      "eval_loss": 5.047034211018506,
-      "step": 102
-    },
-    {
-      "epoch": 2.0,
-      "eval_bleu": 0.26492614431633255,
-      "eval_cap_loss": 1.8576759625883663,
-      "eval_con_loss": 2.059098112816904,
-      "eval_loss": 5.047034211018506,
-      "eval_runtime": 30.947,
-      "eval_samples_per_second": 26.141,
-      "eval_steps_per_second": 3.296,
-      "step": 102
-    },
-    {
-      "epoch": 2.196078431372549,
-      "grad_norm": 1.2055140733718872,
-      "learning_rate": 9.831701387893532e-07,
-      "loss": 9.1146,
-      "step": 112
-    },
-    {
-      "epoch": 2.5098039215686274,
-      "grad_norm": 5.2426838874816895,
-      "learning_rate": 9.576826881282595e-07,
-      "loss": 9.2355,
-      "step": 128
-    },
-    {
-      "epoch": 2.8235294117647056,
-      "grad_norm": 1.1463598012924194,
-      "learning_rate": 9.213357729316076e-07,
-      "loss": 9.2393,
-      "step": 144
-    },
-    {
-      "epoch": 3.0,
-      "eval_bleu": 0.265008566328907,
-      "eval_cap_loss": 1.8531216908903683,
-      "eval_con_loss": 2.059098047368667,
-      "eval_loss": 5.044756932585847,
-      "step": 153
-    },
-    {
-      "epoch": 3.0,
-      "eval_bleu": 0.265008566328907,
-      "eval_cap_loss": 1.8531216908903683,
-      "eval_con_loss": 2.059098047368667,
-      "eval_loss": 5.044756932585847,
-      "eval_runtime": 31.3221,
-      "eval_samples_per_second": 25.828,
-      "eval_steps_per_second": 3.256,
-      "step": 153
-    },
-    {
-      "epoch": 3.1372549019607843,
-      "grad_norm": 1.1249020099639893,
-      "learning_rate": 8.749917986317928e-07,
-      "loss": 9.1006,
-      "step": 160
-    },
-    {
-      "epoch": 3.450980392156863,
-      "grad_norm": 1.0396620035171509,
-      "learning_rate": 8.19750371480919e-07,
-      "loss": 9.2389,
-      "step": 176
-    },
-    {
-      "epoch": 3.764705882352941,
-      "grad_norm": 1.092300534248352,
-      "learning_rate": 7.569222081274395e-07,
-      "loss": 9.2325,
-      "step": 192
-    },
-    {
-      "epoch": 4.0,
-      "eval_bleu": 0.26470999206118423,
-      "eval_cap_loss": 1.8498210708300273,
-      "eval_con_loss": 2.0590969020245122,
-      "eval_loss": 5.043104336542242,
-      "step": 204
-    },
-    {
-      "epoch": 4.0,
-      "eval_bleu": 0.26470999206118423,
-      "eval_cap_loss": 1.8498210708300273,
-      "eval_con_loss": 2.0590969020245122,
-      "eval_loss": 5.043104336542242,
-      "eval_runtime": 31.2759,
-      "eval_samples_per_second": 25.867,
-      "eval_steps_per_second": 3.261,
-      "step": 204
-    },
-    {
-      "epoch": 4.078431372549019,
-      "grad_norm": 1.492817759513855,
-      "learning_rate": 6.879980361637865e-07,
-      "loss": 9.1007,
-      "step": 208
-    },
-    {
-      "epoch": 4.392156862745098,
-      "grad_norm": 1.1078872680664062,
-      "learning_rate": 6.146132235435591e-07,
-      "loss": 9.236,
-      "step": 224
-    },
-    {
-      "epoch": 4.705882352941177,
-      "grad_norm": 1.093540906906128,
-      "learning_rate": 5.385089761082039e-07,
-      "loss": 9.2259,
-      "step": 240
-    },
-    {
-      "epoch": 5.0,
-      "eval_bleu": 0.26489835558929614,
-      "eval_cap_loss": 1.8473522861798604,
-      "eval_con_loss": 2.059096609844881,
-      "eval_loss": 5.04186936394841,
-      "step": 255
-    },
-    {
-      "epoch": 5.0,
-      "eval_bleu": 0.26489835558929614,
-      "eval_cap_loss": 1.8473522861798604,
-      "eval_con_loss": 2.059096609844881,
-      "eval_loss": 5.04186936394841,
-      "eval_runtime": 30.9926,
-      "eval_samples_per_second": 26.103,
-      "eval_steps_per_second": 3.291,
-      "step": 255
-    },
-    {
-      "epoch": 5.019607843137255,
-      "grad_norm": 1.0436476469039917,
-      "learning_rate": 4.614910238917963e-07,
-      "loss": 9.1106,
-      "step": 256
-    },
-    {
-      "epoch": 5.333333333333333,
-      "grad_norm": 1.0471470355987549,
-      "learning_rate": 3.853867764564409e-07,
-      "loss": 9.229,
-      "step": 272
-    },
-    {
-      "epoch": 5.647058823529412,
-      "grad_norm": 1.063376545906067,
-      "learning_rate": 3.120019638362136e-07,
-      "loss": 9.2323,
-      "step": 288
-    },
-    {
-      "epoch": 5.96078431372549,
-      "grad_norm": 0.9393066763877869,
-      "learning_rate": 2.430777918725606e-07,
-      "loss": 9.2343,
-      "step": 304
-    },
-    {
-      "epoch": 6.0,
-      "eval_bleu": 0.2647592416405099,
-      "eval_cap_loss": 1.845566402463352,
-      "eval_con_loss": 2.0590962709165086,
-      "eval_loss": 5.040975749492645,
-      "step": 306
-    },
-    {
-      "epoch": 6.0,
-      "eval_bleu": 0.2647592416405099,
-      "eval_cap_loss": 1.845566402463352,
-      "eval_con_loss": 2.0590962709165086,
-      "eval_loss": 5.040975749492645,
-      "eval_runtime": 31.1784,
-      "eval_samples_per_second": 25.947,
-      "eval_steps_per_second": 3.271,
-      "step": 306
-    },
-    {
-      "epoch": 6.2745098039215685,
-      "grad_norm": 1.2808588743209839,
-      "learning_rate": 1.8024962851908105e-07,
-      "loss": 9.0982,
-      "step": 320
-    },
-    {
-      "epoch": 6.588235294117647,
-      "grad_norm": 2.2777695655822754,
-      "learning_rate": 1.2500820136820733e-07,
-      "loss": 9.2284,
-      "step": 336
-    },
-    {
-      "epoch": 6.901960784313726,
-      "grad_norm": 1.1129379272460938,
-      "learning_rate": 8.127810884536402e-08,
-      "loss": 9.2365,
-      "step": 352
-    },
-    {
-      "epoch": 7.0,
-      "eval_bleu": 0.26468108670121876,
-      "eval_cap_loss": 1.8450663510490866,
-      "eval_con_loss": 2.0590960582097373,
-      "eval_loss": 5.040725319408903,
-      "step": 357
-    },
-    {
-      "epoch": 7.0,
-      "eval_bleu": 0.26468108670121876,
-      "eval_cap_loss": 1.8450663510490866,
-      "eval_con_loss": 2.0590960582097373,
-      "eval_loss": 5.040725319408903,
-      "eval_runtime": 30.8218,
-      "eval_samples_per_second": 26.248,
-      "eval_steps_per_second": 3.309,
-      "step": 357
-    },
-    {
-      "epoch": 7.215686274509804,
-      "grad_norm": 0.9861984252929688,
-      "learning_rate": 4.427853541662091e-08,
-      "loss": 9.097,
-      "step": 368
-    },
-    {
-      "epoch": 7.529411764705882,
-      "grad_norm": 1.0506465435028076,
-      "learning_rate": 1.8091892454998593e-08,
-      "loss": 9.232,
-      "step": 384
-    },
-    {
-      "epoch": 7.8431372549019605,
-      "grad_norm": 1.1292920112609863,
-      "learning_rate": 3.3395120054343086e-09,
-      "loss": 9.2326,
-      "step": 400
-    },
-    {
-      "epoch": 8.0,
-      "eval_bleu": 0.2648108207781699,
-      "eval_cap_loss": 1.8449630152945424,
-      "eval_con_loss": 2.059096009123559,
-      "eval_loss": 5.04067354926876,
-      "step": 408
-    },
-    {
-      "epoch": 8.0,
-      "eval_bleu": 0.2648108207781699,
-      "eval_cap_loss": 1.8449630152945424,
-      "eval_con_loss": 2.059096009123559,
-      "eval_loss": 5.04067354926876,
-      "eval_runtime": 31.3707,
-      "eval_samples_per_second": 25.788,
-      "eval_steps_per_second": 3.251,
-      "step": 408
-    }
-  ],
-  "logging_steps": 16,
-  "max_steps": 408,
-  "num_input_tokens_seen": 0,
-  "num_train_epochs": 8,
-  "save_steps": 500,
-  "stateful_callbacks": {
-    "TrainerControl": {
-      "args": {
-        "should_epoch_stop": false,
-        "should_evaluate": false,
-        "should_log": false,
-        "should_save": true,
-        "should_training_stop": true
-      },
-      "attributes": {}
-    }
-  },
-  "total_flos": 0.0,
-  "train_batch_size": 64,
-  "trial_name": null,
-  "trial_params": null
-}