RealVis_v5.0_BF16_F

Running on Zero

App Files Files Community

1inkusFace commited on Jan 23

Commit

d358d91

verified ·

1 Parent(s): fd9365d

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -22

app.py CHANGED Viewed

@@ -237,28 +237,27 @@ def generate_30(
     # 2. Encode with the two text encoders
     prompt_embeds_a = pipe.text_encoder(text_input_ids1.to(torch.device('cuda')), output_hidden_states=True)
-    pooled_prompt_embeds_a = prompt_embeds_a[0]  # Pooled output from encoder 1
     print('pooled shape 1: ', pooled_prompt_embeds_a.shape)
     prompt_embeds_a = prompt_embeds_a.hidden_states[-2]  # Penultimate hidden state from encoder 1
     print('encoder shape: ', prompt_embeds_a.shape)
     prompt_embeds_b = pipe.text_encoder(text_input_ids2.to(torch.device('cuda')), output_hidden_states=True)
-    pooled_prompt_embeds_b = prompt_embeds_b[0]  # Pooled output from encoder 2
-    prompt_embeds_b = prompt_embeds_b.hidden_states[-2]  # Penultimate hidden state from encoder 2
     prompt_embeds_a2 = pipe.text_encoder_2(text_input_ids1b.to(torch.device('cuda')), output_hidden_states=True)
-    pooled_prompt_embeds_a2 = prompt_embeds_a2[0]  # Pooled output from encoder 1
     print('pooled shape 2: ', pooled_prompt_embeds_a2.shape)
-    prompt_embeds_a2 = prompt_embeds_a2.hidden_states[-2]  # Penultimate hidden state from encoder 1
     print('encoder shape2: ', prompt_embeds_a2.shape)
     prompt_embeds_b2 = pipe.text_encoder_2(text_input_ids2b.to(torch.device('cuda')), output_hidden_states=True)
     pooled_prompt_embeds_b2 = prompt_embeds_b2[0]  # Pooled output from encoder 2
     prompt_embeds_b2 = prompt_embeds_b2.hidden_states[-2]  # Penultimate hidden state from encoder 2
     # 3. Concatenate the embeddings
     prompt_embeds = torch.cat([prompt_embeds_a, prompt_embeds_b])
     print('catted shape: ', prompt_embeds.shape)
-    pooled_prompt_embeds = torch.cat([pooled_prompt_embeds_a, pooled_prompt_embeds_a])
     print('catted pooled shape: ', pooled_prompt_embeds.shape)
     pooled_prompt_embeds = torch.mean(pooled_prompt_embeds,dim=0,keepdim=True)
     print('meaned pooled shape: ', pooled_prompt_embeds.shape)
@@ -274,7 +273,7 @@ def generate_30(
     print('catted pooled shape 2: ', pooled_prompt_embeds2.shape)
     pooled_prompt_embeds2 = torch.mean(pooled_prompt_embeds2,dim=0,keepdim=True)
     print('pooled meaned shape 2: ', pooled_prompt_embeds2.shape)
-    pooled_prompt_embeds = torch.cat([pooled_prompt_embeds, pooled_prompt_embeds2],dim=0)
     print('catted combined meaned pooled shape: ', pooled_prompt_embeds.shape)
     options = {
@@ -367,24 +366,23 @@ def generate_60(
     # 2. Encode with the two text encoders
     prompt_embeds_a = pipe.text_encoder(text_input_ids1.to(torch.device('cuda')), output_hidden_states=True)
-    pooled_prompt_embeds_a = prompt_embeds_a[0]  # Pooled output from encoder 1
     print('pooled shape 1: ', pooled_prompt_embeds_a.shape)
     prompt_embeds_a = prompt_embeds_a.hidden_states[-2]  # Penultimate hidden state from encoder 1
     print('encoder shape: ', prompt_embeds_a.shape)
     prompt_embeds_b = pipe.text_encoder(text_input_ids2.to(torch.device('cuda')), output_hidden_states=True)
-    pooled_prompt_embeds_b = prompt_embeds_b[0]  # Pooled output from encoder 2
-    prompt_embeds_b = prompt_embeds_b.hidden_states[-2]  # Penultimate hidden state from encoder 2
     prompt_embeds_a2 = pipe.text_encoder_2(text_input_ids1b.to(torch.device('cuda')), output_hidden_states=True)
-    pooled_prompt_embeds_a2 = prompt_embeds_a2[0]  # Pooled output from encoder 1
     print('pooled shape 2: ', pooled_prompt_embeds_a2.shape)
-    prompt_embeds_a2 = prompt_embeds_a2.hidden_states[-2]  # Penultimate hidden state from encoder 1
     print('encoder shape2: ', prompt_embeds_a2.shape)
     prompt_embeds_b2 = pipe.text_encoder_2(text_input_ids2b.to(torch.device('cuda')), output_hidden_states=True)
     pooled_prompt_embeds_b2 = prompt_embeds_b2[0]  # Pooled output from encoder 2
     prompt_embeds_b2 = prompt_embeds_b2.hidden_states[-2]  # Penultimate hidden state from encoder 2
     # 3. Concatenate the embeddings
     prompt_embeds = torch.cat([prompt_embeds_a, prompt_embeds_b])
     print('catted shape: ', prompt_embeds.shape)
@@ -404,7 +402,7 @@ def generate_60(
     print('catted pooled shape 2: ', pooled_prompt_embeds2.shape)
     pooled_prompt_embeds2 = torch.mean(pooled_prompt_embeds2,dim=0,keepdim=True)
     print('pooled meaned shape 2: ', pooled_prompt_embeds2.shape)
-    pooled_prompt_embeds = torch.cat([pooled_prompt_embeds, pooled_prompt_embeds2],dim=0)
     print('catted combined meaned pooled shape: ', pooled_prompt_embeds.shape)
     options = {
@@ -497,24 +495,23 @@ def generate_90(
     # 2. Encode with the two text encoders
     prompt_embeds_a = pipe.text_encoder(text_input_ids1.to(torch.device('cuda')), output_hidden_states=True)
-    pooled_prompt_embeds_a = prompt_embeds_a[0]  # Pooled output from encoder 1
     print('pooled shape 1: ', pooled_prompt_embeds_a.shape)
     prompt_embeds_a = prompt_embeds_a.hidden_states[-2]  # Penultimate hidden state from encoder 1
     print('encoder shape: ', prompt_embeds_a.shape)
     prompt_embeds_b = pipe.text_encoder(text_input_ids2.to(torch.device('cuda')), output_hidden_states=True)
-    pooled_prompt_embeds_b = prompt_embeds_b[0]  # Pooled output from encoder 2
-    prompt_embeds_b = prompt_embeds_b.hidden_states[-2]  # Penultimate hidden state from encoder 2
     prompt_embeds_a2 = pipe.text_encoder_2(text_input_ids1b.to(torch.device('cuda')), output_hidden_states=True)
-    pooled_prompt_embeds_a2 = prompt_embeds_a2[0]  # Pooled output from encoder 1
     print('pooled shape 2: ', pooled_prompt_embeds_a2.shape)
-    prompt_embeds_a2 = prompt_embeds_a2.hidden_states[-2]  # Penultimate hidden state from encoder 1
     print('encoder shape2: ', prompt_embeds_a2.shape)
     prompt_embeds_b2 = pipe.text_encoder_2(text_input_ids2b.to(torch.device('cuda')), output_hidden_states=True)
     pooled_prompt_embeds_b2 = prompt_embeds_b2[0]  # Pooled output from encoder 2
     prompt_embeds_b2 = prompt_embeds_b2.hidden_states[-2]  # Penultimate hidden state from encoder 2
     # 3. Concatenate the embeddings
     prompt_embeds = torch.cat([prompt_embeds_a, prompt_embeds_b])
     print('catted shape: ', prompt_embeds.shape)
@@ -534,7 +531,7 @@ def generate_90(
     print('catted pooled shape 2: ', pooled_prompt_embeds2.shape)
     pooled_prompt_embeds2 = torch.mean(pooled_prompt_embeds2,dim=0,keepdim=True)
     print('pooled meaned shape 2: ', pooled_prompt_embeds2.shape)
-    pooled_prompt_embeds = torch.cat([pooled_prompt_embeds, pooled_prompt_embeds2],dim=0)
     print('catted combined meaned pooled shape: ', pooled_prompt_embeds.shape)
     options = {

     # 2. Encode with the two text encoders
     prompt_embeds_a = pipe.text_encoder(text_input_ids1.to(torch.device('cuda')), output_hidden_states=True)
+    pooled_prompt_embeds_a = prompt_embeds_a[0][:, -1, :]  # Pooled output from encoder 1
     print('pooled shape 1: ', pooled_prompt_embeds_a.shape)
     prompt_embeds_a = prompt_embeds_a.hidden_states[-2]  # Penultimate hidden state from encoder 1
     print('encoder shape: ', prompt_embeds_a.shape)
     prompt_embeds_b = pipe.text_encoder(text_input_ids2.to(torch.device('cuda')), output_hidden_states=True)
+    pooled_prompt_embeds_b = prompt_embeds_b[0][:, -1, :]  # Pooled output from encoder 1
+    prompt_embeds_b = prompt_embeds_b.hidden_states[-2]  # Penultimate hidden state from encoder 1
     prompt_embeds_a2 = pipe.text_encoder_2(text_input_ids1b.to(torch.device('cuda')), output_hidden_states=True)
+    pooled_prompt_embeds_a2 = prompt_embeds_a2[0]  # Pooled output from encoder 2
     print('pooled shape 2: ', pooled_prompt_embeds_a2.shape)
+    prompt_embeds_a2 = prompt_embeds_a2.hidden_states[-2]  # Penultimate hidden state from encoder 2
     print('encoder shape2: ', prompt_embeds_a2.shape)
     prompt_embeds_b2 = pipe.text_encoder_2(text_input_ids2b.to(torch.device('cuda')), output_hidden_states=True)
     pooled_prompt_embeds_b2 = prompt_embeds_b2[0]  # Pooled output from encoder 2
     prompt_embeds_b2 = prompt_embeds_b2.hidden_states[-2]  # Penultimate hidden state from encoder 2
     # 3. Concatenate the embeddings
     prompt_embeds = torch.cat([prompt_embeds_a, prompt_embeds_b])
     print('catted shape: ', prompt_embeds.shape)
+    pooled_prompt_embeds = torch.cat([pooled_prompt_embeds_a, pooled_prompt_embeds_b])
     print('catted pooled shape: ', pooled_prompt_embeds.shape)
     pooled_prompt_embeds = torch.mean(pooled_prompt_embeds,dim=0,keepdim=True)
     print('meaned pooled shape: ', pooled_prompt_embeds.shape)
     print('catted pooled shape 2: ', pooled_prompt_embeds2.shape)
     pooled_prompt_embeds2 = torch.mean(pooled_prompt_embeds2,dim=0,keepdim=True)
     print('pooled meaned shape 2: ', pooled_prompt_embeds2.shape)
+    pooled_prompt_embeds = torch.cat([pooled_prompt_embeds, pooled_prompt_embeds2],dim=1)
     print('catted combined meaned pooled shape: ', pooled_prompt_embeds.shape)
     options = {
     # 2. Encode with the two text encoders
     prompt_embeds_a = pipe.text_encoder(text_input_ids1.to(torch.device('cuda')), output_hidden_states=True)
+    pooled_prompt_embeds_a = prompt_embeds_a[0][:, -1, :]  # Pooled output from encoder 1
     print('pooled shape 1: ', pooled_prompt_embeds_a.shape)
     prompt_embeds_a = prompt_embeds_a.hidden_states[-2]  # Penultimate hidden state from encoder 1
     print('encoder shape: ', prompt_embeds_a.shape)
     prompt_embeds_b = pipe.text_encoder(text_input_ids2.to(torch.device('cuda')), output_hidden_states=True)
+    pooled_prompt_embeds_b = prompt_embeds_b[0][:, -1, :]  # Pooled output from encoder 1
+    prompt_embeds_b = prompt_embeds_b.hidden_states[-2]  # Penultimate hidden state from encoder 1
     prompt_embeds_a2 = pipe.text_encoder_2(text_input_ids1b.to(torch.device('cuda')), output_hidden_states=True)
+    pooled_prompt_embeds_a2 = prompt_embeds_a2[0]  # Pooled output from encoder 2
     print('pooled shape 2: ', pooled_prompt_embeds_a2.shape)
+    prompt_embeds_a2 = prompt_embeds_a2.hidden_states[-2]  # Penultimate hidden state from encoder 2
     print('encoder shape2: ', prompt_embeds_a2.shape)
     prompt_embeds_b2 = pipe.text_encoder_2(text_input_ids2b.to(torch.device('cuda')), output_hidden_states=True)
     pooled_prompt_embeds_b2 = prompt_embeds_b2[0]  # Pooled output from encoder 2
     prompt_embeds_b2 = prompt_embeds_b2.hidden_states[-2]  # Penultimate hidden state from encoder 2
     # 3. Concatenate the embeddings
     prompt_embeds = torch.cat([prompt_embeds_a, prompt_embeds_b])
     print('catted shape: ', prompt_embeds.shape)
     print('catted pooled shape 2: ', pooled_prompt_embeds2.shape)
     pooled_prompt_embeds2 = torch.mean(pooled_prompt_embeds2,dim=0,keepdim=True)
     print('pooled meaned shape 2: ', pooled_prompt_embeds2.shape)
+    pooled_prompt_embeds = torch.cat([pooled_prompt_embeds, pooled_prompt_embeds2],dim=1)
     print('catted combined meaned pooled shape: ', pooled_prompt_embeds.shape)
     options = {
     # 2. Encode with the two text encoders
     prompt_embeds_a = pipe.text_encoder(text_input_ids1.to(torch.device('cuda')), output_hidden_states=True)
+    pooled_prompt_embeds_a = prompt_embeds_a[0][:, -1, :]  # Pooled output from encoder 1
     print('pooled shape 1: ', pooled_prompt_embeds_a.shape)
     prompt_embeds_a = prompt_embeds_a.hidden_states[-2]  # Penultimate hidden state from encoder 1
     print('encoder shape: ', prompt_embeds_a.shape)
     prompt_embeds_b = pipe.text_encoder(text_input_ids2.to(torch.device('cuda')), output_hidden_states=True)
+    pooled_prompt_embeds_b = prompt_embeds_b[0][:, -1, :]  # Pooled output from encoder 1
+    prompt_embeds_b = prompt_embeds_b.hidden_states[-2]  # Penultimate hidden state from encoder 1
     prompt_embeds_a2 = pipe.text_encoder_2(text_input_ids1b.to(torch.device('cuda')), output_hidden_states=True)
+    pooled_prompt_embeds_a2 = prompt_embeds_a2[0]  # Pooled output from encoder 2
     print('pooled shape 2: ', pooled_prompt_embeds_a2.shape)
+    prompt_embeds_a2 = prompt_embeds_a2.hidden_states[-2]  # Penultimate hidden state from encoder 2
     print('encoder shape2: ', prompt_embeds_a2.shape)
     prompt_embeds_b2 = pipe.text_encoder_2(text_input_ids2b.to(torch.device('cuda')), output_hidden_states=True)
     pooled_prompt_embeds_b2 = prompt_embeds_b2[0]  # Pooled output from encoder 2
     prompt_embeds_b2 = prompt_embeds_b2.hidden_states[-2]  # Penultimate hidden state from encoder 2
     # 3. Concatenate the embeddings
     prompt_embeds = torch.cat([prompt_embeds_a, prompt_embeds_b])
     print('catted shape: ', prompt_embeds.shape)
     print('catted pooled shape 2: ', pooled_prompt_embeds2.shape)
     pooled_prompt_embeds2 = torch.mean(pooled_prompt_embeds2,dim=0,keepdim=True)
     print('pooled meaned shape 2: ', pooled_prompt_embeds2.shape)
+    pooled_prompt_embeds = torch.cat([pooled_prompt_embeds, pooled_prompt_embeds2],dim=1)
     print('catted combined meaned pooled shape: ', pooled_prompt_embeds.shape)
     options = {