Spaces:

Noha90
/

AML_16

Sleeping

App Files Files Community

Noha90 commited on May 7

Commit

2c8e31c

0 Parent(s):

Clean start: add all files with LFS tracking

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +41 -0
README.md +16 -0
app.py +16 -0
labels.json +42 -0
model.py +45 -0
predict.py +91 -0
requirements.txt +6 -0
sample_images/airport_terminal/airport-check-in.jpg +3 -0
sample_images/airport_terminal/checkin.jpg +3 -0
sample_images/amphitheatre/amphitheatre.png +3 -0
sample_images/amusement_park/A Swinger Ride.jpg +3 -0
sample_images/amusement_park/airport-check-in.jpg +3 -0
sample_images/art_gallery/art_gallery.jpg +3 -0
sample_images/bakery_shop/ShopInterior.jpg +3 -0
sample_images/bar/Ram02.jpg +3 -0
sample_images/bookstore/book_store.jpg +3 -0
sample_images/botanical_garden/botanical_garden.jpg +3 -0
sample_images/bridge/Medieval_Exe_Bridge_Exeter.jpg +3 -0
sample_images/bridge/ironbridge3.jpg +3 -0
sample_images/bridge/millers.jpg +3 -0
sample_images/bus_interior/29477487945_81aabab695_b.jpg +3 -0
sample_images/bus_interior/37139142640_3807d91aea_b.jpg +3 -0
sample_images/butchers_shop/butcher_shop.jpg +3 -0
sample_images/campsite/camp_site.png +3 -0
sample_images/classroom/classroom.png +3 -0
sample_images/coffee_shop/the-terrace4.jpg +3 -0
sample_images/construction_site/construction_site.jpeg +3 -0
sample_images/courtyard/courtyard.jpg +3 -0
sample_images/driveway/driveway.jpeg +3 -0
sample_images/fire_station/firestation.jpeg +3 -0
sample_images/fountain/fountain.jpg +3 -0
sample_images/gas_station/gas_station.png +3 -0
sample_images/harbour/Harbour.jpg +3 -0
sample_images/highway/highway.png +3 -0
sample_images/kindergarten_classroom/kindergarden_classroon.jpg +3 -0
sample_images/lobby/lobby.jpg +3 -0
sample_images/market_outdoor/img_7421.jpg +3 -0
sample_images/market_outdoor/www.visitexeter.com.jpeg +3 -0
sample_images/museum/7.jpg +3 -0
sample_images/museum/albert-queen-1-5.jpg +3 -0
sample_images/museum/img2295_1.jpg +3 -0
sample_images/office/images.jpeg +3 -0
sample_images/office/images2.jpeg +3 -0
sample_images/parking_lot/parking_lot.png +3 -0
sample_images/phone_booth/phone_booth.jpg +3 -0
sample_images/playground/3146371_077d0213.jpg +3 -0
sample_images/playground/exeter_hall2.jpg +3 -0
sample_images/playground/planet2.jpg +3 -0
sample_images/railroad_track/rail_road_track.jpg +3 -0
sample_images/restaurant/Boston-Tea-Party.jpg +3 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,41 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+*.jpg filter=lfs diff=lfs merge=lfs -text
+*.jpeg filter=lfs diff=lfs merge=lfs -text
+*.png filter=lfs diff=lfs merge=lfs -text
+*.gif filter=lfs diff=lfs merge=lfs -text
+*.bmp filter=lfs diff=lfs merge=lfs -text
+*.webp filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,16 @@

+---
+title: "AML 16"
+version: "1.0.0"
+emoji: "🤗"
+colorFrom: indigo
+colorTo: pink
+sdk: gradio
+sdk_version: "5.29.0"
+app_file: app.py
+pinned: false
+---
+# AML 16
+This is a Demo using Gradio app for AML 16.

app.py ADDED Viewed

	@@ -0,0 +1,16 @@

+import gradio as gr
+from predict import predict
+demo = gr.Interface(
+    fn=predict,
+    inputs=gr.Image(type="filepath", label="Upload Image"),
+    outputs=[
+        gr.Image(label="Uploaded Image"),
+        gr.Image(label="Top-1 Class Example"),
+        gr.Label(label="Top-5 Probabilities")
+    ],
+    title="Scene Classification with Reference Image",
+    description="Upload an image to get the predicted class with a sample image and top-5 prediction chart."
+)
+demo.launch()

labels.json ADDED Viewed

	@@ -0,0 +1,42 @@

+[
+    "airport_terminal",
+    "amphitheatre",
+    "amusement_park",
+    "art_gallery",
+    "bakery_shop",
+    "bar",
+    "bookstore",
+    "botanical_garden",
+    "bridge",
+    "bus_interior",
+    "butchers_shop",
+    "campsite",
+    "classroom",
+    "coffee_shop",
+    "construction_site",
+    "courtyard",
+    "driveway",
+    "fire_station",
+    "fountain",
+    "gas_station",
+    "harbour",
+    "highway",
+    "kindergarten_classroom",
+    "lobby",
+    "market_outdoor",
+    "museum",
+    "office",
+    "parking_lot",
+    "phone_booth",
+    "playground",
+    "railroad_track",
+    "restaurant",
+    "river",
+    "shed",
+    "staircase",
+    "supermarket",
+    "swimming_pool_outdoor",
+    "track",
+    "valley",
+    "yard"
+]

model.py ADDED Viewed

	@@ -0,0 +1,45 @@

+import torch
+import torch.nn as nn
+from transformers import SwinForImageClassification
+def quantize_model(model, mode="linear"):
+    model.eval().cpu()
+    if mode == "linear":
+        return torch.quantization.quantize_dynamic(model, {nn.Linear}, dtype=torch.qint8)
+    return model
+class SwinModel(nn.Module):
+    def __init__(self, model_name="microsoft/swin-base-patch4-window7-224", num_classes=40, from_pretrained=False):
+        super(SwinModel, self).__init__()
+        if from_pretrained:
+            self.model = SwinForImageClassification.from_pretrained(model_name)
+        else:
+            config = SwinForImageClassification.from_pretrained(model_name).config
+            config.num_labels = num_classes
+            self.model = SwinForImageClassification(config)
+        in_features = self.model.classifier.in_features
+        self.model.classifier = nn.Linear(in_features, num_classes)
+    def forward(self, images):
+        outputs = self.model(images)
+        return outputs.logits
+def load_model(weights_path="best_model.pth", num_classes=40):
+    model = SwinModel(num_classes=num_classes, from_pretrained=False)
+    checkpoint = torch.load(weights_path, map_location="cpu")
+    if "model_state_dict" in checkpoint:
+        state_dict = checkpoint["model_state_dict"]
+    else:
+        state_dict = checkpoint
+    filtered_state_dict = {k: v for k, v in state_dict.items() if "classifier" not in k}
+    model.load_state_dict(filtered_state_dict, strict=False)
+    model = quantize_model(model, mode="linear")
+    model.eval()
+    return model

predict.py ADDED Viewed

	@@ -0,0 +1,91 @@

+import torch
+from torchvision import transforms
+from PIL import Image
+import json
+import numpy as np
+# from model import load_model
+from transformers import AutoImageProcessor, SwinForImageClassification
+import torch.nn as nn
+import os
+import pandas as pd
+import random
+# Load labels
+with open("labels.json", "r") as f:
+    class_names = json.load(f)
+print("class_names:", class_names)
+# Load model
+model = SwinForImageClassification.from_pretrained("microsoft/swin-base-patch4-window7-224")
+model.classifier = torch.nn.Linear(model.classifier.in_features, len(class_names))
+state_dict = torch.load("best_model.pth", map_location="cpu")
+# Remove incompatible keys (classifier weights)
+filtered_state_dict = {k: v for k, v in state_dict.items() if "classifier" not in k}
+model.load_state_dict(filtered_state_dict, strict=False)
+model.eval()
+# Image transform
+# transform = transforms.Compose([
+#     transforms.Resize((224, 224)),
+#     transforms.ToTensor(),
+#     transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
+# ])
+#Swin
+transform = transforms.Compose([
+    transforms.Resize((224, 224)),
+    transforms.ToTensor(),
+    transforms.Normalize(mean=[0.485, 0.456, 0.406],
+                         std=[0.229, 0.224, 0.225])
+])
+def predict(image_path):
+    # Load and prepare image
+    image = Image.open(image_path).convert("RGB")
+    x = transform(image).unsqueeze(0)
+    with torch.no_grad():
+        outputs = model(x)
+        print("Logits:", outputs.logits)
+        probs = torch.nn.functional.softmax(outputs.logits, dim=1)[0]
+        print("Probs:", probs)
+        print("Sum of probs:", probs.sum())
+        top5 = torch.topk(probs, k=5)
+    top1_idx = int(top5.indices[0])
+    top1_label = class_names[top1_idx]
+    # Select a random image from the class subfolder
+    class_folder = f"sample_images/{str(top1_label).replace(' ', '_')}"
+    reference_image = None
+    if os.path.isdir(class_folder):
+        # List all image files in the folder
+        image_files = [f for f in os.listdir(class_folder) if f.lower().endswith((".jpg", ".jpeg", ".png", ".bmp", ".gif", ".webp"))]
+        if image_files:
+            chosen_file = random.choice(image_files)
+            ref_path = os.path.join(class_folder, chosen_file)
+            print(f"[DEBUG] Randomly selected reference image: {ref_path}")
+            reference_image = Image.open(ref_path).convert("RGB")
+        else:
+            print(f"[DEBUG] No images found in {class_folder}")
+    else:
+        print(f"[DEBUG] Class folder does not exist: {class_folder}")
+    # Format Top-5 for gr.Label with class names
+    top5_probs = {class_names[int(idx)]: float(score) for idx, score in zip(top5.indices, top5.values)}
+    print(f"image path: {image_path}")
+    print(f"top1_label: {top1_label}")
+    print(f"[DEBUG] Top-5 indices: {top5.indices}")
+    print(f"[DEBUG] Top-5 labels: {[class_names[int(idx)] for idx in top5.indices]}")
+    print(f"[DEBUG] Top-5 probs: {top5_probs}")
+    return image, reference_image, top5_probs

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+torch
+torchvision
+transformers
+Pillow
+gradio
+numpy

sample_images/airport_terminal/airport-check-in.jpg ADDED Viewed

Git LFS Details

SHA256: 183bf4dd47c45a3b475c9f24032c973af82834ab34649deb5c190a1429969569
Pointer size: 130 Bytes
Size of remote file: 13.9 kB

sample_images/airport_terminal/checkin.jpg ADDED Viewed

Git LFS Details

SHA256: c0f80e6bdd7ace112fd799fe1f516ac4abe4487a72a19fed0436f82afc2883a7
Pointer size: 131 Bytes
Size of remote file: 126 kB

sample_images/amphitheatre/amphitheatre.png ADDED Viewed

Git LFS Details

SHA256: 810f640dbcae341f2a00f5690408eb263941bc2ea1c34dab8e8e55105e7c548a
Pointer size: 132 Bytes
Size of remote file: 2.77 MB

sample_images/amusement_park/A Swinger Ride.jpg ADDED Viewed

Git LFS Details

SHA256: 1cad54c6fdb3c5e24c805da6b593ac10cad0543f54dc5a7749bcb37c9072439c
Pointer size: 132 Bytes
Size of remote file: 1.13 MB

sample_images/amusement_park/airport-check-in.jpg ADDED Viewed

Git LFS Details

SHA256: d7cd3f5dda8a9d57ce38522de00efba0ae1e817a12d87a20628d60d207200a6a
Pointer size: 130 Bytes
Size of remote file: 65.8 kB

sample_images/art_gallery/art_gallery.jpg ADDED Viewed

Git LFS Details

SHA256: ce079953b1811d13779d896ca0d09c425ee4a3e5c386bd2db7d415a806d14fd4
Pointer size: 132 Bytes
Size of remote file: 1.47 MB

sample_images/bakery_shop/ShopInterior.jpg ADDED Viewed

Git LFS Details

SHA256: 1b81ae0922fa7bcef4e494c5cba5209db8b887dda0658ed10fd433db257fc016
Pointer size: 131 Bytes
Size of remote file: 192 kB

sample_images/bar/Ram02.jpg ADDED Viewed

Git LFS Details

SHA256: 352f1422e9dd9f023ba47045014c7360bf8581fe54a4a60e3715ab5d421e8e61
Pointer size: 131 Bytes
Size of remote file: 131 kB

sample_images/bookstore/book_store.jpg ADDED Viewed

Git LFS Details

SHA256: afdb86d9fcf4162b1bdd6204240c5b287363e78158cb70e59546c15564ba8eed
Pointer size: 131 Bytes
Size of remote file: 458 kB

sample_images/botanical_garden/botanical_garden.jpg ADDED Viewed

Git LFS Details

SHA256: c3b01ec04f71c857eebe77e561a65711d57b8492ad167291de6bd81f4d3a4cea
Pointer size: 131 Bytes
Size of remote file: 170 kB

sample_images/bridge/Medieval_Exe_Bridge_Exeter.jpg ADDED Viewed

Git LFS Details

SHA256: 09107f4c9179937a399ca468453fdb59ee0be437ba70b06b0f362f6d6363a35a
Pointer size: 131 Bytes
Size of remote file: 650 kB

sample_images/bridge/ironbridge3.jpg ADDED Viewed

Git LFS Details

SHA256: 2b61f2d27e4983eed7e3798473efc54a4a0dc639a881ff594dcfb96c90526f30
Pointer size: 130 Bytes
Size of remote file: 19.6 kB

sample_images/bridge/millers.jpg ADDED Viewed

Git LFS Details

SHA256: 48f1c89295af4487b6d6c2620fd358781e74fff66e5318959b6ee760867542d6
Pointer size: 130 Bytes
Size of remote file: 15 kB

sample_images/bus_interior/29477487945_81aabab695_b.jpg ADDED Viewed

Git LFS Details

SHA256: 48121e9141f7b74fe4ebe493328cbdf69332d9ff006d4b8b0d4781d80c93ea99
Pointer size: 131 Bytes
Size of remote file: 197 kB

sample_images/bus_interior/37139142640_3807d91aea_b.jpg ADDED Viewed

Git LFS Details

SHA256: 396452d923cf49ab52f51abc14cbc5ea15fe8cb0aa31cbfa35ae6e7a7a83c3ea
Pointer size: 131 Bytes
Size of remote file: 166 kB

sample_images/butchers_shop/butcher_shop.jpg ADDED Viewed

Git LFS Details

SHA256: e4aae9ab38fb8cbb1ac6070c7008fd4d27781b6a0f603a3cd43492cb20dea76c
Pointer size: 131 Bytes
Size of remote file: 280 kB

sample_images/campsite/camp_site.png ADDED Viewed

Git LFS Details

SHA256: c0b4c4e0b1e4fabda4b37aca5f0c791d96db7e2a99b3e80ada0fa82af11a2f71
Pointer size: 132 Bytes
Size of remote file: 2.69 MB

sample_images/classroom/classroom.png ADDED Viewed

Git LFS Details

SHA256: 07709b15bf3f7cd7955cf13aa42fe1c2931fc6f419aa7553f0728c3554c99a4b
Pointer size: 132 Bytes
Size of remote file: 1.37 MB

sample_images/coffee_shop/the-terrace4.jpg ADDED Viewed

Git LFS Details

SHA256: 4981278ec05d025e49016da9506848501abe6ae5f6f626541d948d0a2edd4f8c
Pointer size: 131 Bytes
Size of remote file: 426 kB

sample_images/construction_site/construction_site.jpeg ADDED Viewed

Git LFS Details

SHA256: 5bf4d3b70a2735346abf150559c17ca38a594b7f8e237b449b6adcbf94e5803e
Pointer size: 132 Bytes
Size of remote file: 3.94 MB

sample_images/courtyard/courtyard.jpg ADDED Viewed

Git LFS Details

SHA256: bbdad227928da731d7551ef19b071ef1e79ed38267d726cd6694e4ccd92bab70
Pointer size: 131 Bytes
Size of remote file: 150 kB

sample_images/driveway/driveway.jpeg ADDED Viewed

Git LFS Details

SHA256: 3dcab8dca590b08d3cb0fbf101adf4f587c11ce907ca9a401c896c58ce533f0b
Pointer size: 131 Bytes
Size of remote file: 443 kB

sample_images/fire_station/firestation.jpeg ADDED Viewed

Git LFS Details

SHA256: 8f4407245124249a1782f4d199aab69085a70ec1474e604f1c071b737b83a02c
Pointer size: 130 Bytes
Size of remote file: 10.5 kB

sample_images/fountain/fountain.jpg ADDED Viewed

Git LFS Details

SHA256: 26e3c8141f9cab36621ef5d3b596c281b83b255880f2815625237358cdc3bda2
Pointer size: 131 Bytes
Size of remote file: 140 kB

sample_images/gas_station/gas_station.png ADDED Viewed

Git LFS Details

SHA256: 036a872401add9ff1e07594568647c5c3871186d6d8692486d48333b83053ed6
Pointer size: 132 Bytes
Size of remote file: 1.58 MB

sample_images/harbour/Harbour.jpg ADDED Viewed

Git LFS Details

SHA256: e6f99bcaf3698c6aa8b902a2ca2114c70287ab900274a5a612284b2b66f66eba
Pointer size: 131 Bytes
Size of remote file: 511 kB

sample_images/highway/highway.png ADDED Viewed

Git LFS Details

SHA256: 619c3e69243348e41f2d8a3f919b5918068ef778c89d7fe68b0e9518a2e35538
Pointer size: 132 Bytes
Size of remote file: 1.47 MB

sample_images/kindergarten_classroom/kindergarden_classroon.jpg ADDED Viewed

Git LFS Details

SHA256: d02230c54485ecefd0bd039271f11a4632aa25a3ae5a28163255c4433d513bf1
Pointer size: 130 Bytes
Size of remote file: 38 kB

sample_images/lobby/lobby.jpg ADDED Viewed

Git LFS Details

SHA256: 85f7fdea6b2929d77f06af9af9aee841f2f77c60160166535f8a8e72dfbeba6b
Pointer size: 131 Bytes
Size of remote file: 844 kB

sample_images/market_outdoor/img_7421.jpg ADDED Viewed

Git LFS Details

SHA256: 959c7fddbcbe2670b756e63d3713952dcb9690ccd3b11474aac04988716efc80
Pointer size: 131 Bytes
Size of remote file: 131 kB

sample_images/market_outdoor/www.visitexeter.com.jpeg ADDED Viewed

Git LFS Details

SHA256: 3afa600e9eb84af18e4223e8da4fd679933d1975fdb9a3598a428f8df1ca4290
Pointer size: 131 Bytes
Size of remote file: 155 kB

sample_images/museum/7.jpg ADDED Viewed

Git LFS Details

SHA256: 1a7e07e3ce4538070e62dd4221467cb8ac925612f658f80c09cf2c28c0f8b6fc
Pointer size: 131 Bytes
Size of remote file: 262 kB

sample_images/museum/albert-queen-1-5.jpg ADDED Viewed

Git LFS Details

SHA256: 5201cf18bacbca26d076879fd57f2c89fa0d6cbda71ab16d6dadc2638812f459
Pointer size: 130 Bytes
Size of remote file: 41.1 kB

sample_images/museum/img2295_1.jpg ADDED Viewed

Git LFS Details

SHA256: 002b9e1ae029f6a2c400b10d2d7bdd9fd5b7fc8c3dc773e167dbb452fd7bc6f4
Pointer size: 130 Bytes
Size of remote file: 49.9 kB

sample_images/office/images.jpeg ADDED Viewed

Git LFS Details

SHA256: 2c4dc44e6705ceca7c443e7abba364ada3f48290cf7c7e6f25e8ec5dcd98798f
Pointer size: 130 Bytes
Size of remote file: 10.2 kB

sample_images/office/images2.jpeg ADDED Viewed

Git LFS Details

SHA256: f3e67de0989943077bd4174f29116ac505f0db638423557e531ad34bae16bd15
Pointer size: 129 Bytes
Size of remote file: 9.23 kB

sample_images/parking_lot/parking_lot.png ADDED Viewed

Git LFS Details

SHA256: fb75fa0c8fe2370b0b7ee841bd5417588414d51ebf5eff111b5569ca252a3ef0
Pointer size: 131 Bytes
Size of remote file: 557 kB

sample_images/phone_booth/phone_booth.jpg ADDED Viewed

Git LFS Details

SHA256: d866086bbcd37a8763062ef3874f4313282b1ed19f6f4bb4d426d27e66402539
Pointer size: 131 Bytes
Size of remote file: 218 kB

sample_images/playground/3146371_077d0213.jpg ADDED Viewed

Git LFS Details

SHA256: 58e093f00bd1f72ec080e30c19f8bc003ec3734a0b76b985ed5e7f0daf8526c7
Pointer size: 130 Bytes
Size of remote file: 83.6 kB

sample_images/playground/exeter_hall2.jpg ADDED Viewed

Git LFS Details

SHA256: bf5d7180637a606fdf9791ab7c0165247a9d4cc610d48c72ddeaf564876c236b
Pointer size: 131 Bytes
Size of remote file: 214 kB

sample_images/playground/planet2.jpg ADDED Viewed

Git LFS Details

SHA256: 3c3276d4e7b6ee561b95b3d88c4cb99ac74a12350ab87d38369a53fd12623b9f
Pointer size: 131 Bytes
Size of remote file: 110 kB

sample_images/railroad_track/rail_road_track.jpg ADDED Viewed

Git LFS Details

SHA256: 128f52db2258b037e3d543a8a43cc32e4100aa2670c1a6b62880f499bb80660b
Pointer size: 131 Bytes
Size of remote file: 115 kB

sample_images/restaurant/Boston-Tea-Party.jpg ADDED Viewed

Git LFS Details

SHA256: fc93ed3c587d88598e2a9afa54d1ee395036693b23e31fe59c2323ee8e8c1e6b
Pointer size: 132 Bytes
Size of remote file: 2.59 MB