Upload folder using huggingface_hub

Files changed (6) hide show

.ipynb_checkpoints/Granite3.2-2B-NF4-lora-FP16-Evaluation_Results-checkpoint.json ADDED Viewed

+{
+    "eval_loss:": 0.6800438622995038,
+    "perplexity:": 1.9739643129455233,
+    "performance_metrics:": {
+        "accuracy:": 0.9993324432576769,
+        "precision:": 1.0,
+        "recall:": 1.0,
+        "f1:": 1.0,
+        "bleu:": 0.9608755860087081,
+        "rouge:": {
+            "rouge1": 0.9785245035961412,
+            "rouge2": 0.9783954249371395,
+            "rougeL": 0.9785245035961412
+        },
+        "semantic_similarity_avg:": 0.9975973963737488
+    },
+    "mauve:": 0.8818151996410524,
+    "inference_performance:": {
+        "min_latency_ms": 105.39054870605469,
+        "max_latency_ms": 4774.695873260498,
+        "lower_quartile_ms": 108.52676630020142,
+        "median_latency_ms": 112.74242401123047,
+        "upper_quartile_ms": 2542.6074862480164,
+        "avg_latency_ms": 1218.470693907846,
+        "min_memory_gb": 0.13478469848632812,
+        "max_memory_gb": 0.13478469848632812,
+        "lower_quartile_gb": 0.13478469848632812,
+        "median_memory_gb": 0.13478469848632812,
+        "upper_quartile_gb": 0.13478469848632812,
+        "avg_memory_gb": 0.13478469848632812,
+        "model_load_memory_gb": 1.5763826370239258,
+        "avg_inference_memory_gb": 0.13478469848632812
+    }
+}

Granite3.2-2B-NF4-lora-FP16-Evaluation_Results.json ADDED Viewed

+{
+    "eval_loss:": 0.6800438622995038,
+    "perplexity:": 1.9739643129455233,
+    "performance_metrics:": {
+        "accuracy:": 0.9993324432576769,
+        "precision:": 1.0,
+        "recall:": 1.0,
+        "f1:": 1.0,
+        "bleu:": 0.9608755860087081,
+        "rouge:": {
+            "rouge1": 0.9785245035961412,
+            "rouge2": 0.9783954249371395,
+            "rougeL": 0.9785245035961412
+        },
+        "semantic_similarity_avg:": 0.9975973963737488
+    },
+    "mauve:": 0.8818151996410524,
+    "inference_performance:": {
+        "min_latency_ms": 105.39054870605469,
+        "max_latency_ms": 4774.695873260498,
+        "lower_quartile_ms": 108.52676630020142,
+        "median_latency_ms": 112.74242401123047,
+        "upper_quartile_ms": 2542.6074862480164,
+        "avg_latency_ms": 1218.470693907846,
+        "min_memory_gb": 0.13478469848632812,
+        "max_memory_gb": 0.13478469848632812,
+        "lower_quartile_gb": 0.13478469848632812,
+        "median_memory_gb": 0.13478469848632812,
+        "upper_quartile_gb": 0.13478469848632812,
+        "avg_memory_gb": 0.13478469848632812,
+        "model_load_memory_gb": 1.5763826370239258,
+        "avg_inference_memory_gb": 0.13478469848632812
+    }
+}

Granite3.2-2B-NF4-lora-FP16-Inference_Curve.png ADDED Viewed

Granite3.2-2B-NF4-lora-FP16-Latency_Histogram.png ADDED Viewed

Granite3.2-2B-NF4-lora-FP16-Memory_Histogram.png ADDED Viewed

Granite3.2-2B-NF4-lora-FP16-Memory_Usage_Curve.png ADDED Viewed