Upload folder using huggingface_hub

Files changed (6) hide show

.ipynb_checkpoints/Granite3.2-2B-FP4-lora-FP16-Evaluation_Results-checkpoint.json ADDED Viewed

+{
+    "eval_loss:": 0.7104760890469721,
+    "perplexity:": 2.0349598501562385,
+    "performance_metrics:": {
+        "accuracy:": 0.9993324432576769,
+        "precision:": 1.0,
+        "recall:": 1.0,
+        "f1:": 1.0,
+        "bleu:": 0.9608071662029927,
+        "rouge:": {
+            "rouge1": 0.9785375186875944,
+            "rouge2": 0.9784191926971961,
+            "rougeL": 0.9785375186875944
+        },
+        "semantic_similarity_avg:": 0.9974932670593262
+    },
+    "mauve:": 0.8804768654231001,
+    "inference_performance:": {
+        "min_latency_ms": 106.68039321899414,
+        "max_latency_ms": 5421.270132064819,
+        "lower_quartile_ms": 109.932541847229,
+        "median_latency_ms": 114.32981491088867,
+        "upper_quartile_ms": 2489.4919991493225,
+        "avg_latency_ms": 1233.0216747100585,
+        "min_memory_gb": 0.13478469848632812,
+        "max_memory_gb": 0.13478469848632812,
+        "lower_quartile_gb": 0.13478469848632812,
+        "median_memory_gb": 0.13478469848632812,
+        "upper_quartile_gb": 0.13478469848632812,
+        "avg_memory_gb": 0.13478469848632812,
+        "model_load_memory_gb": 4.49504280090332,
+        "avg_inference_memory_gb": 0.13478469848632812
+    }
+}

Granite3.2-2B-FP4-lora-FP16-Evaluation_Results.json ADDED Viewed

+{
+    "eval_loss:": 0.7104760890469721,
+    "perplexity:": 2.0349598501562385,
+    "performance_metrics:": {
+        "accuracy:": 0.9993324432576769,
+        "precision:": 1.0,
+        "recall:": 1.0,
+        "f1:": 1.0,
+        "bleu:": 0.9608071662029927,
+        "rouge:": {
+            "rouge1": 0.9785375186875944,
+            "rouge2": 0.9784191926971961,
+            "rougeL": 0.9785375186875944
+        },
+        "semantic_similarity_avg:": 0.9974932670593262
+    },
+    "mauve:": 0.8804768654231001,
+    "inference_performance:": {
+        "min_latency_ms": 106.68039321899414,
+        "max_latency_ms": 5421.270132064819,
+        "lower_quartile_ms": 109.932541847229,
+        "median_latency_ms": 114.32981491088867,
+        "upper_quartile_ms": 2489.4919991493225,
+        "avg_latency_ms": 1233.0216747100585,
+        "min_memory_gb": 0.13478469848632812,
+        "max_memory_gb": 0.13478469848632812,
+        "lower_quartile_gb": 0.13478469848632812,
+        "median_memory_gb": 0.13478469848632812,
+        "upper_quartile_gb": 0.13478469848632812,
+        "avg_memory_gb": 0.13478469848632812,
+        "model_load_memory_gb": 4.49504280090332,
+        "avg_inference_memory_gb": 0.13478469848632812
+    }
+}

Granite3.2-2B-FP4-lora-FP16-Inference_Curve.png ADDED Viewed

Granite3.2-2B-FP4-lora-FP16-Latency_Histogram.png ADDED Viewed

Granite3.2-2B-FP4-lora-FP16-Memory_Histogram.png ADDED Viewed

Granite3.2-2B-FP4-lora-FP16-Memory_Usage_Curve.png ADDED Viewed