Spaces:

multimodalart
/

dreambooth-training

Running

App Files Files Community

multimodalart HF Staff commited on Nov 17, 2022

Commit

dbfd73e

1 Parent(s): 3777984

Updated version

Browse files

Files changed (2) hide show

app.py +10 -5
train_dreambooth.py +42 -12

app.py CHANGED Viewed

@@ -11,6 +11,7 @@ css = '''
     #component-4, #component-3, #component-10{min-height: 0}
 '''
 shutil.unpack_archive("mix.zip", "mix")
 maximum_concepts = 3
 def swap_values_files(*total_files):
     file_counter = 0
@@ -59,15 +60,15 @@ def train(*inputs):
     if(uses_custom):
         Training_Steps = int(inputs[-3])
         Train_text_encoder_for = int(inputs[-2])
-        stptxt = int((Training_Steps*Train_text_encoder_for)/100)
     else:
         Training_Steps = file_counter*200
         if(inputs[-4] == "person"):
             class_data_dir = "mix"
             args_txt_encoder = argparse.Namespace(
                 image_captions_filename = True,
                 train_text_encoder = True,
-                pretrained_model_name_or_path="./stable-diffusion-v1-5",
                 instance_data_dir="instance_images",
                 class_data_dir=class_data_dir,
                 output_dir="output_model",
@@ -93,7 +94,7 @@ def train(*inputs):
                 Session_dir="output_model",
                 save_starting_step=0,
                 save_n_steps=0,
-                pretrained_model_name_or_path="./stable-diffusion-v1-5",
                 instance_data_dir="instance_images",
                 output_dir="output_model",
                 instance_prompt="",
@@ -112,17 +113,20 @@ def train(*inputs):
             run_training(args_txt_encoder)
             run_training(args_unet)
         elif(inputs[-4] == "object"):
             class_data_dir = None
         elif(inputs[-4] == "style"):
             class_data_dir = None
     args_general = argparse.Namespace(
         image_captions_filename = True,
         train_text_encoder = True,
         stop_text_encoder_training = stptxt,
         save_n_steps = 0,
         dump_only_text_encoder = True,
-        pretrained_model_name_or_path = "./stable-diffusion-v1-5",
         instance_data_dir="instance_images",
         class_data_dir=class_data_dir,
         output_dir="output_model",
@@ -138,6 +142,7 @@ def train(*inputs):
         lr_warmup_steps = 0,
         max_train_steps=Training_Steps,
     )
     run_training(args_general)
     os.rmdir('instance_images')
 with gr.Blocks(css=css) as demo:

     #component-4, #component-3, #component-10{min-height: 0}
 '''
 shutil.unpack_archive("mix.zip", "mix")
+model_to_load = "stable-diffusion-v1-5"
 maximum_concepts = 3
 def swap_values_files(*total_files):
     file_counter = 0
     if(uses_custom):
         Training_Steps = int(inputs[-3])
         Train_text_encoder_for = int(inputs[-2])
     else:
         Training_Steps = file_counter*200
         if(inputs[-4] == "person"):
             class_data_dir = "mix"
+            Train_text_encoder_for=100
             args_txt_encoder = argparse.Namespace(
                 image_captions_filename = True,
                 train_text_encoder = True,
+                pretrained_model_name_or_path=model_to_load,
                 instance_data_dir="instance_images",
                 class_data_dir=class_data_dir,
                 output_dir="output_model",
                 Session_dir="output_model",
                 save_starting_step=0,
                 save_n_steps=0,
+                pretrained_model_name_or_path=model_to_load,
                 instance_data_dir="instance_images",
                 output_dir="output_model",
                 instance_prompt="",
             run_training(args_txt_encoder)
             run_training(args_unet)
         elif(inputs[-4] == "object"):
+            Train_text_encoder_for=30
             class_data_dir = None
         elif(inputs[-4] == "style"):
+            Train_text_encoder_for=15
             class_data_dir = None
+    stptxt = int((Training_Steps*Train_text_encoder_for)/100)
     args_general = argparse.Namespace(
         image_captions_filename = True,
         train_text_encoder = True,
         stop_text_encoder_training = stptxt,
         save_n_steps = 0,
         dump_only_text_encoder = True,
+        pretrained_model_name_or_path = model_to_load,
         instance_data_dir="instance_images",
         class_data_dir=class_data_dir,
         output_dir="output_model",
         lr_warmup_steps = 0,
         max_train_steps=Training_Steps,
     )
     run_training(args_general)
     os.rmdir('instance_images')
 with gr.Blocks(css=css) as demo:

train_dreambooth.py CHANGED Viewed

@@ -33,7 +33,7 @@ def parse_args():
         "--pretrained_model_name_or_path",
         type=str,
         default=None,
-        required=True,
         help="Path to pretrained model or model identifier from huggingface.co/models.",
     )
     parser.add_argument(
@@ -46,7 +46,7 @@ def parse_args():
         "--instance_data_dir",
         type=str,
         default=None,
-        required=True,
         help="A folder containing the training data of instance images.",
     )
     parser.add_argument(
@@ -250,14 +250,14 @@ def parse_args():
     if env_local_rank != -1 and env_local_rank != args.local_rank:
         args.local_rank = env_local_rank
-    if args.instance_data_dir is None:
-        raise ValueError("You must specify a train data directory.")
-    if args.with_prior_preservation:
-        if args.class_data_dir is None:
-            raise ValueError("You must specify a data directory for class images.")
-        if args.class_prompt is None:
-            raise ValueError("You must specify prompt for class images.")
     return args
@@ -388,9 +388,39 @@ def get_full_repo_name(model_id: str, organization: Optional[str] = None, token:
     else:
         return f"{organization}/{model_id}"
-def run_training(args):
-    #args = parse_args()
     logging_dir = Path(args.output_dir, args.logging_dir)
     i=args.save_starting_step
     accelerator = Accelerator(
@@ -468,7 +498,7 @@ def run_training(args):
     if args.tokenizer_name:
         tokenizer = CLIPTokenizer.from_pretrained(args.tokenizer_name)
     elif args.pretrained_model_name_or_path:
-        tokenizer = CLIPTokenizer.from_pretrained(args.pretrained_model_name_or_path, subfolder="tokenizer")
     # Load models and create wrapper for stable diffusion
     if args.train_only_unet:

         "--pretrained_model_name_or_path",
         type=str,
         default=None,
+        #required=True,
         help="Path to pretrained model or model identifier from huggingface.co/models.",
     )
     parser.add_argument(
         "--instance_data_dir",
         type=str,
         default=None,
+        #required=True,
         help="A folder containing the training data of instance images.",
     )
     parser.add_argument(
     if env_local_rank != -1 and env_local_rank != args.local_rank:
         args.local_rank = env_local_rank
+    #if args.instance_data_dir is None:
+    #    raise ValueError("You must specify a train data directory.")
+    #if args.with_prior_preservation:
+    #    if args.class_data_dir is None:
+    #        raise ValueError("You must specify a data directory for class images.")
+    #    if args.class_prompt is None:
+    #        raise ValueError("You must specify prompt for class images.")
     return args
     else:
         return f"{organization}/{model_id}"
+def merge_two_dicts(starting_dict: dict, updater_dict: dict) -> dict:
+    """
+    Starts from base starting dict and then adds the remaining key values from updater replacing the values from
+    the first starting/base dict with the second updater dict.
+    For later: how does d = {**d1, **d2} replace collision?
+    :param starting_dict:
+    :param updater_dict:
+    :return:
+    """
+    new_dict: dict = starting_dict.copy()   # start with keys and values of starting_dict
+    new_dict.update(updater_dict)    # modifies starting_dict with keys and values of updater_dict
+    return new_dict
+def merge_args(args1: argparse.Namespace, args2: argparse.Namespace) -> argparse.Namespace:
+    """
+    ref: https://stackoverflow.com/questions/56136549/how-can-i-merge-two-argparse-namespaces-in-python-2-x
+    :param args1:
+    :param args2:
+    :return:
+    """
+    # - the merged args
+    # The vars() function returns the __dict__ attribute to values of the given object e.g {field:value}.
+    merged_key_values_for_namespace: dict = merge_two_dicts(vars(args1), vars(args2))
+    args = argparse.Namespace(**merged_key_values_for_namespace)
+    return args
+def run_training(args_imported):
+    args_default = parse_args()
+    args = merge_args(args_default, args_imported)
+    print(args)
     logging_dir = Path(args.output_dir, args.logging_dir)
     i=args.save_starting_step
     accelerator = Accelerator(
     if args.tokenizer_name:
         tokenizer = CLIPTokenizer.from_pretrained(args.tokenizer_name)
     elif args.pretrained_model_name_or_path:
+        tokenizer = CLIPTokenizer.from_pretrained(args.pretrained_model_name_or_path, subfolder="tokenizer", use_auth_token=True)
     # Load models and create wrapper for stable diffusion
     if args.train_only_unet: