Spaces:

acceptee
/

DiT4SR

Running on Zero

Men1scus commited on Jul 1

Commit

66217ed

1 Parent(s): 4b18c4d

Update vision tower name to hf

Files changed (1) hide show

llava/model/multimodal_encoder/clip_encoder.py CHANGED Viewed

@@ -2,7 +2,7 @@ import torch
 import torch.nn as nn
 from transformers import CLIPVisionModel, CLIPImageProcessor, CLIPVisionConfig
-from CKPT_PTH import LLAVA_CLIP_PATH
 class CLIPVisionTower(nn.Module):
     def __init__(self, vision_tower, args, delay_load=False):
@@ -10,7 +10,7 @@ class CLIPVisionTower(nn.Module):
         self.is_loaded = False
-        self.vision_tower_name = LLAVA_CLIP_PATH
         self.select_layer = args.mm_vision_select_layer
         self.select_feature = getattr(args, 'mm_vision_select_feature', 'patch')

 import torch.nn as nn
 from transformers import CLIPVisionModel, CLIPImageProcessor, CLIPVisionConfig
+# from CKPT_PTH import LLAVA_CLIP_PATH
 class CLIPVisionTower(nn.Module):
     def __init__(self, vision_tower, args, delay_load=False):
         self.is_loaded = False
+        self.vision_tower_name = 'openai/clip-vit-large-patch14-336'
         self.select_layer = args.mm_vision_select_layer
         self.select_feature = getattr(args, 'mm_vision_select_feature', 'patch')