NEW-Mycelium

Paused

Nuullll commited on Nov 3, 2023

Commit

0958e65

1 Parent(s): ca39fe5

[IPEX] Support xpu for Intel Arc GPU

Arc A770 16G can render at ~3fps (fp16).

Files changed (2) hide show

app-img2img.py CHANGED Viewed

@@ -12,6 +12,10 @@ from fastapi.staticfiles import StaticFiles
 from diffusers import DiffusionPipeline, AutoencoderTiny
 from compel import Compel
 import torch
 from PIL import Image
 import numpy as np
 import gradio as gr
@@ -31,7 +35,8 @@ USE_TINY_AUTOENCODER=True
 # check if MPS is available OSX only M1/M2/M3 chips
 mps_available = hasattr(torch.backends, "mps") and torch.backends.mps.is_available()
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 torch_device = device
 # change to torch.float16 to save GPU memory
@@ -72,7 +77,7 @@ pipe.unet.to(memory_format=torch.channels_last)
 if psutil.virtual_memory().total < 64 * 1024**3:
     pipe.enable_attention_slicing()
-if not mps_available:
     pipe.unet = torch.compile(pipe.unet, mode="reduce-overhead", fullgraph=True)
     pipe(prompt="warmup", image=[Image.new("RGB", (512, 512))])

 from diffusers import DiffusionPipeline, AutoencoderTiny
 from compel import Compel
 import torch
+try:
+    import intel_extension_for_pytorch as ipex
+except:
+    pass
 from PIL import Image
 import numpy as np
 import gradio as gr
 # check if MPS is available OSX only M1/M2/M3 chips
 mps_available = hasattr(torch.backends, "mps") and torch.backends.mps.is_available()
+xpu_available = hasattr(torch, 'xpu') and torch.xpu.is_available()
+device = torch.device("cuda" if torch.cuda.is_available() else "xpu" if xpu_available else "cpu")
 torch_device = device
 # change to torch.float16 to save GPU memory
 if psutil.virtual_memory().total < 64 * 1024**3:
     pipe.enable_attention_slicing()
+if not mps_available and not xpu_available:
     pipe.unet = torch.compile(pipe.unet, mode="reduce-overhead", fullgraph=True)
     pipe(prompt="warmup", image=[Image.new("RGB", (512, 512))])

app-txt2img.py CHANGED Viewed

@@ -12,6 +12,10 @@ from fastapi.staticfiles import StaticFiles
 from diffusers import DiffusionPipeline, AutoencoderTiny
 from compel import Compel
 import torch
 from PIL import Image
 import numpy as np
 import gradio as gr
@@ -32,7 +36,8 @@ USE_TINY_AUTOENCODER=True
 # check if MPS is available OSX only M1/M2/M3 chips
 mps_available = hasattr(torch.backends, "mps") and torch.backends.mps.is_available()
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 torch_device = device
 # change to torch.float16 to save GPU memory
 torch_dtype = torch.float32
@@ -72,7 +77,7 @@ pipe.unet.to(memory_format=torch.channels_last)
 if psutil.virtual_memory().total < 64 * 1024**3:
     pipe.enable_attention_slicing()
-if not mps_available:
     pipe.unet = torch.compile(pipe.unet, mode="reduce-overhead", fullgraph=True)
     pipe(prompt="warmup", num_inference_steps=1, guidance_scale=8.0)

 from diffusers import DiffusionPipeline, AutoencoderTiny
 from compel import Compel
 import torch
+try:
+    import intel_extension_for_pytorch as ipex
+except:
+    pass
 from PIL import Image
 import numpy as np
 import gradio as gr
 # check if MPS is available OSX only M1/M2/M3 chips
 mps_available = hasattr(torch.backends, "mps") and torch.backends.mps.is_available()
+xpu_available = hasattr(torch, 'xpu') and torch.xpu.is_available()
+device = torch.device("cuda" if torch.cuda.is_available() else "xpu" if xpu_available else "cpu")
 torch_device = device
 # change to torch.float16 to save GPU memory
 torch_dtype = torch.float32
 if psutil.virtual_memory().total < 64 * 1024**3:
     pipe.enable_attention_slicing()
+if not mps_available and not xpu_available:
     pipe.unet = torch.compile(pipe.unet, mode="reduce-overhead", fullgraph=True)
     pipe(prompt="warmup", num_inference_steps=1, guidance_scale=8.0)