Sonic_Character_tagger

Runtime error

App Files Files Community

Metal079 commited on Jan 26, 2023

Commit

1a021d3

1 Parent(s): 308d90e

Upload 4 files

Browse files

Files changed (4) hide show

sonic/config.json +20 -14
sonic/preprocessor_config.json +4 -9
sonic/pytorch_model.bin +2 -2
sonic/trainer_state.json +146 -42

sonic/config.json CHANGED Viewed

@@ -1,13 +1,22 @@
 {
-  "_name_or_path": "facebook/deit-base-distilled-patch16-384",
   "architectures": [
-    "DeiTForImageClassification"
   ],
-  "attention_probs_dropout_prob": 0.0,
-  "encoder_stride": 16,
   "hidden_act": "gelu",
-  "hidden_dropout_prob": 0.0,
-  "hidden_size": 768,
   "id2label": {
     "0": "Tails the fox",
     "1": "Amy rose",
@@ -27,7 +36,6 @@
   },
   "image_size": 384,
   "initializer_range": 0.02,
-  "intermediate_size": 3072,
   "label2id": {
     "Amy rose": "1",
     "Big the cat": "14",
@@ -46,14 +54,12 @@
     "mobian": "12"
   },
   "layer_norm_eps": 1e-12,
-  "model_type": "deit",
-  "num_attention_heads": 12,
   "num_channels": 3,
-  "num_hidden_layers": 12,
-  "patch_size": 16,
   "problem_type": "multi_label_classification",
-  "qkv_bias": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.25.1",
-  "labels":[0,0,0,0,0,0,0,0]
 }

 {
+  "_name_or_path": "facebook/convnext-base-384-22k-1k",
   "architectures": [
+    "ConvNextForImageClassification"
   ],
+  "depths": [
+    3,
+    3,
+    27,
+    3
+  ],
+  "drop_path_rate": 0.0,
   "hidden_act": "gelu",
+  "hidden_sizes": [
+    128,
+    256,
+    512,
+    1024
+  ],
   "id2label": {
     "0": "Tails the fox",
     "1": "Amy rose",
   },
   "image_size": 384,
   "initializer_range": 0.02,
   "label2id": {
     "Amy rose": "1",
     "Big the cat": "14",
     "mobian": "12"
   },
   "layer_norm_eps": 1e-12,
+  "layer_scale_init_value": 1e-06,
+  "model_type": "convnext",
   "num_channels": 3,
+  "num_stages": 4,
+  "patch_size": 4,
   "problem_type": "multi_label_classification",
   "torch_dtype": "float32",
+  "transformers_version": "4.25.1"
 }

sonic/preprocessor_config.json CHANGED Viewed

@@ -1,19 +1,15 @@
 {
-  "crop_size": {
-    "height": 384,
-    "width": 384
-  },
-  "do_center_crop": true,
   "do_normalize": true,
   "do_rescale": true,
   "do_resize": true,
-  "feature_extractor_type": "DeiTFeatureExtractor",
   "image_mean": [
     0.485,
     0.456,
     0.406
   ],
-  "image_processor_type": "DeiTImageProcessor",
   "image_std": [
     0.229,
     0.224,
@@ -22,7 +18,6 @@
   "resample": 3,
   "rescale_factor": 0.00392156862745098,
   "size": {
-    "height": 438,
-    "width": 438
   }
 }

 {
+  "crop_pct": 0.875,
   "do_normalize": true,
   "do_rescale": true,
   "do_resize": true,
+  "feature_extractor_type": "ConvNextFeatureExtractor",
   "image_mean": [
     0.485,
     0.456,
     0.406
   ],
+  "image_processor_type": "ConvNextImageProcessor",
   "image_std": [
     0.229,
     0.224,
   "resample": 3,
   "rescale_factor": 0.00392156862745098,
   "size": {
+    "shortest_edge": 384
   }
 }

sonic/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:19a5c9f847dc16aca5d968b920576a77877b5ee936ec862475ae594d5cc717cd
-size 344482737

 version https://git-lfs.github.com/spec/v1
+oid sha256:bd4d6897c65fc76cc210003c9552b14442dd4d5786bab4e5b323c52bafa2e877
+size 350446061

sonic/trainer_state.json CHANGED Viewed

@@ -1,73 +1,177 @@
 {
-  "best_metric": 0.09283134341239929,
-  "best_model_checkpoint": "./SonicCharacterClassifier\\checkpoint-573",
-  "epoch": 3.0,
-  "global_step": 573,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.52,
-      "learning_rate": 4.738219895287958e-05,
-      "loss": 0.2703,
       "step": 100
     },
     {
-      "epoch": 1.0,
-      "eval_accuracy": 0.7315789473684211,
-      "eval_loss": 0.12457749992609024,
-      "eval_runtime": 84.7067,
-      "eval_samples_per_second": 8.972,
-      "eval_steps_per_second": 1.122,
-      "step": 191
     },
     {
-      "epoch": 1.05,
-      "learning_rate": 4.4764397905759164e-05,
-      "loss": 0.1533,
       "step": 200
     },
     {
-      "epoch": 1.57,
-      "learning_rate": 4.2146596858638745e-05,
-      "loss": 0.0971,
       "step": 300
     },
     {
-      "epoch": 2.0,
-      "eval_accuracy": 0.7355263157894737,
-      "eval_loss": 0.10028258711099625,
-      "eval_runtime": 80.347,
-      "eval_samples_per_second": 9.459,
-      "eval_steps_per_second": 1.182,
-      "step": 382
     },
     {
-      "epoch": 2.09,
-      "learning_rate": 3.9528795811518326e-05,
-      "loss": 0.0773,
       "step": 400
     },
     {
-      "epoch": 2.62,
-      "learning_rate": 3.691099476439791e-05,
-      "loss": 0.04,
       "step": 500
     },
     {
-      "epoch": 3.0,
-      "eval_accuracy": 0.7447368421052631,
-      "eval_loss": 0.09283134341239929,
-      "eval_runtime": 80.5834,
-      "eval_samples_per_second": 9.431,
-      "eval_steps_per_second": 1.179,
-      "step": 573
     }
   ],
-  "max_steps": 1910,
   "num_train_epochs": 10,
-  "total_flos": 4.182223007386829e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.09438519924879074,
+  "best_model_checkpoint": "./SonicCharacterClassifier\\checkpoint-1400",
+  "epoch": 4.093567251461988,
+  "global_step": 1400,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.29,
+      "learning_rate": 4.853801169590643e-05,
+      "loss": 0.3188,
       "step": 100
     },
     {
+      "epoch": 0.58,
+      "learning_rate": 4.707602339181287e-05,
+      "loss": 0.2087,
+      "step": 200
     },
     {
+      "epoch": 0.58,
+      "eval_accuracy": 0.9407407407407361,
+      "eval_loss": 0.16877754032611847,
+      "eval_precision": 0.6539702845075653,
+      "eval_recall": 0.5742313120602596,
+      "eval_runtime": 161.9664,
+      "eval_samples_per_second": 8.446,
+      "eval_steps_per_second": 1.056,
       "step": 200
     },
     {
+      "epoch": 0.88,
+      "learning_rate": 4.56140350877193e-05,
+      "loss": 0.1663,
       "step": 300
     },
     {
+      "epoch": 1.17,
+      "learning_rate": 4.4152046783625734e-05,
+      "loss": 0.1155,
+      "step": 400
     },
     {
+      "epoch": 1.17,
+      "eval_accuracy": 0.9615009746588669,
+      "eval_loss": 0.12015020102262497,
+      "eval_precision": 0.8305708768976313,
+      "eval_recall": 0.7801112001221648,
+      "eval_runtime": 161.8616,
+      "eval_samples_per_second": 8.452,
+      "eval_steps_per_second": 1.056,
       "step": 400
     },
     {
+      "epoch": 1.46,
+      "learning_rate": 4.269005847953216e-05,
+      "loss": 0.095,
       "step": 500
     },
     {
+      "epoch": 1.75,
+      "learning_rate": 4.12280701754386e-05,
+      "loss": 0.0932,
+      "step": 600
+    },
+    {
+      "epoch": 1.75,
+      "eval_accuracy": 0.964278752436644,
+      "eval_loss": 0.1112869530916214,
+      "eval_precision": 0.8358102748453625,
+      "eval_recall": 0.7573138768314205,
+      "eval_runtime": 160.6953,
+      "eval_samples_per_second": 8.513,
+      "eval_steps_per_second": 1.064,
+      "step": 600
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 3.976608187134503e-05,
+      "loss": 0.087,
+      "step": 700
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 3.8304093567251465e-05,
+      "loss": 0.0489,
+      "step": 800
+    },
+    {
+      "epoch": 2.34,
+      "eval_accuracy": 0.9684697855750467,
+      "eval_loss": 0.09839322417974472,
+      "eval_precision": 0.877861029889539,
+      "eval_recall": 0.8274951210258222,
+      "eval_runtime": 160.5107,
+      "eval_samples_per_second": 8.523,
+      "eval_steps_per_second": 1.065,
+      "step": 800
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 3.6842105263157895e-05,
+      "loss": 0.0506,
+      "step": 900
+    },
+    {
+      "epoch": 2.92,
+      "learning_rate": 3.538011695906433e-05,
+      "loss": 0.0503,
+      "step": 1000
+    },
+    {
+      "epoch": 2.92,
+      "eval_accuracy": 0.9692495126705621,
+      "eval_loss": 0.09646110981702805,
+      "eval_precision": 0.8755529497305813,
+      "eval_recall": 0.8374415545468176,
+      "eval_runtime": 161.798,
+      "eval_samples_per_second": 8.455,
+      "eval_steps_per_second": 1.057,
+      "step": 1000
+    },
+    {
+      "epoch": 3.22,
+      "learning_rate": 3.391812865497076e-05,
+      "loss": 0.0297,
+      "step": 1100
+    },
+    {
+      "epoch": 3.51,
+      "learning_rate": 3.24561403508772e-05,
+      "loss": 0.0245,
+      "step": 1200
+    },
+    {
+      "epoch": 3.51,
+      "eval_accuracy": 0.9697855750487306,
+      "eval_loss": 0.09691683202981949,
+      "eval_precision": 0.8796307635671673,
+      "eval_recall": 0.8392919296428067,
+      "eval_runtime": 163.6772,
+      "eval_samples_per_second": 8.358,
+      "eval_steps_per_second": 1.045,
+      "step": 1200
+    },
+    {
+      "epoch": 3.8,
+      "learning_rate": 3.0994152046783626e-05,
+      "loss": 0.026,
+      "step": 1300
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.9532163742690062e-05,
+      "loss": 0.0231,
+      "step": 1400
+    },
+    {
+      "epoch": 4.09,
+      "eval_accuracy": 0.9713937621832336,
+      "eval_loss": 0.09438519924879074,
+      "eval_precision": 0.8850769600769599,
+      "eval_recall": 0.8511938435184049,
+      "eval_runtime": 161.9688,
+      "eval_samples_per_second": 8.446,
+      "eval_steps_per_second": 1.056,
+      "step": 1400
     }
   ],
+  "max_steps": 3420,
   "num_train_epochs": 10,
+  "total_flos": 5.207113357118669e+18,
   "trial_name": null,
   "trial_params": null
 }