asymm2ep

Browse files

Files changed (8) hide show

asymmetric_vae_new/diffusion_pytorch_model.safetensors +1 -1
eval_asym.py +159 -0
samples/sample_0_0.jpg +0 -3
samples/sample_0_1.jpg +0 -3
samples/sample_0_2.jpg +0 -3
samples/sample_673_0.jpg +0 -3
samples/sample_673_1.jpg +0 -3
samples/sample_673_2.jpg +0 -3

asymmetric_vae_new/diffusion_pytorch_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2b0689cd2f3a6f81c14a95e1f2a7c4cee6b97b51f34700c5983ee2f28df17ef6
 size 421473052

 version https://git-lfs.github.com/spec/v1
+oid sha256:69c5a55938fb7e33849a58865e243ee02b3ad9cf6ff5a6f6b97ad025e38d64e0
 size 421473052

eval_asym.py ADDED Viewed

	@@ -0,0 +1,159 @@

+import warnings
+import logging
+import torch
+import torch.nn.functional as F
+import torch.utils.data as data
+import lpips
+from tqdm import tqdm
+from torchvision.transforms import (
+    Compose,
+    Resize,
+    ToTensor,
+    CenterCrop,
+)
+from diffusers import AutoencoderKL,AsymmetricAutoencoderKL
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+warnings.filterwarnings(
+    "ignore",
+    ".*Found keys that are not in the model state dict but in the checkpoint.*",
+)
+DEVICE = "cuda"
+DTYPE = torch.float16
+SHORT_AXIS_SIZE = 256
+batch_size = 1
+NAMES = [
+#    "asymmetric_vae",
+#    "asymmetric_vae_new",
+#    "madebyollin/sdxl-vae-fp16-fix",
+#    "KBlueLeaf/EQ-SDXL-VAE        ",
+    "AiArtLab/simplevae           ",
+]
+BASE_MODELS = [
+#    "./asymmetric_vae",
+#    "./asymmetric_vae_new",
+#    "madebyollin/sdxl-vae-fp16-fix",
+#    "KBlueLeaf/EQ-SDXL-VAE",
+    "AiArtLab/simplevae",
+]
+SUB_FOLDERS = [
+    "sdxs_vae",
+#    None,
+#    None,
+#    "sdxl_vae"
+]
+def process(x):
+    return x * 2 - 1
+def deprocess(x):
+    return x * 0.5 + 0.5
+import torch.utils.data as data
+from datasets import load_dataset
+class ImageNetDataset(data.IterableDataset):
+    def __init__(self, split, transform=None, max_len=10, streaming=True):
+        self.split = split
+        self.transform = transform
+        self.dataset = load_dataset("evanarlian/imagenet_1k_resized_256", split=split, streaming=streaming)
+        self.max_len = max_len
+        self.iterator = iter(self.dataset)
+    def __iter__(self):
+        for i, entry in enumerate(self.iterator):
+            if self.max_len and i >= self.max_len:
+                break
+            img = entry["image"]
+            target = entry["label"]
+            if self.transform is not None:
+                img = self.transform(img)
+            yield img, target
+if __name__ == "__main__":
+    lpips_loss = torch.compile(
+        lpips.LPIPS(net="vgg").eval().to(DEVICE).requires_grad_(False)
+    )
+    @torch.compile
+    def metrics(inp, recon):
+        mse = F.mse_loss(inp, recon)
+        psnr = 10 * torch.log10(1 / mse)
+        return (
+            mse.cpu(),
+            psnr.cpu(),
+            lpips_loss(inp, recon, normalize=True).mean().cpu(),
+        )
+    transform = Compose(
+        [
+            Resize(SHORT_AXIS_SIZE),
+            CenterCrop(SHORT_AXIS_SIZE),
+            ToTensor(),
+        ]
+    )
+    valid_dataset = ImageNetDataset("val", transform=transform, max_len=50000, streaming=True)
+    valid_loader = data.DataLoader(
+        valid_dataset,
+        batch_size=batch_size,
+        shuffle=False,
+        num_workers=2,
+        pin_memory=True,
+        pin_memory_device=DEVICE,
+    )
+    # Проверяем, что данные грузятся
+    for batch in valid_loader:
+        print("Batch shape:", batch[0].shape)
+        break
+    logger.info("Loading models...")
+    vaes = []
+    for base_model, sub_folder in zip(
+        BASE_MODELS, SUB_FOLDERS
+    ):
+        vae = AsymmetricAutoencoderKL.from_pretrained(base_model, subfolder=sub_folder)
+        vae = vae.to(DTYPE).eval().requires_grad_(False).to(DEVICE)
+        vae.encoder = torch.compile(vae.encoder)
+        vae.decoder = torch.compile(vae.decoder)
+        vaes.append(torch.compile(vae))
+    logger.info("Running Validation")
+    total = 0
+    all_latents = [[] for _ in range(len(vaes))]
+    all_mse = [[] for _ in range(len(vaes))]
+    all_psnr = [[] for _ in range(len(vaes))]
+    all_lpips = [[] for _ in range(len(vaes))]
+    for idx, batch in enumerate(tqdm(valid_loader)):
+        image = batch[0].to(DEVICE)
+        test_inp = process(image).to(DTYPE)
+        batch_size = test_inp.size(0)
+        for i, vae in enumerate(vaes):
+            latent = vae.encode(test_inp).latent_dist.mode()
+            recon = deprocess(vae.decode(latent).sample.float())
+            all_latents[i].append(latent.cpu().float())
+            mse, psnr, lpips_ = metrics(image, recon)
+            all_mse[i].append(mse.cpu() * batch_size)
+            all_psnr[i].append(psnr.cpu() * batch_size)
+            all_lpips[i].append(lpips_.cpu() * batch_size)
+        total += batch_size
+    for i in range(len(vaes)):
+        all_latents[i] = torch.cat(all_latents[i], dim=0)
+        all_mse[i] = torch.stack(all_mse[i]).sum() / total
+        all_psnr[i] = torch.stack(all_psnr[i]).sum() / total
+        all_lpips[i] = torch.stack(all_lpips[i]).sum() / total
+        logger.info(
+            f"  - {NAMES[i]}: MSE: {all_mse[i]:.3e}, PSNR: {all_psnr[i]:.4f}, "
+            f"LPIPS: {all_lpips[i]:.4f}"
+        )
+    logger.info("End")

samples/sample_0_0.jpg DELETED Viewed

Git LFS Details

SHA256: fa157903dd5a4118d9c38e32c25c5a02a3eeaddb59d3a1c9d8fe7e9eb57e3f14
Pointer size: 130 Bytes
Size of remote file: 98 kB

samples/sample_0_1.jpg DELETED Viewed

Git LFS Details

SHA256: 7cba73cbeeb41f97f6247043e00a5346cf10f6bf67f4ffa4ac8a736c6841a2be
Pointer size: 131 Bytes
Size of remote file: 105 kB

samples/sample_0_2.jpg DELETED Viewed

Git LFS Details

SHA256: 2cdfd5107c48e41eb4d9475b9360f2c5a98b25509649e37df9eac75065ffbd96
Pointer size: 130 Bytes
Size of remote file: 93.4 kB

samples/sample_673_0.jpg DELETED Viewed

Git LFS Details

SHA256: ecb6610fe8119c402581c2181181aea871f7a6f3a211b48c1927cea878d9babb
Pointer size: 130 Bytes
Size of remote file: 95.5 kB

samples/sample_673_1.jpg DELETED Viewed

Git LFS Details

SHA256: e370fb4119a38245baad69f7e243506d69e40437878253e91d683ebba1f443af
Pointer size: 131 Bytes
Size of remote file: 103 kB

samples/sample_673_2.jpg DELETED Viewed

Git LFS Details

SHA256: ff7edcb0dbc7a36cd3a5a344e4a47b6e13ea1153455c115b738025beb2d45fbc
Pointer size: 130 Bytes
Size of remote file: 90.3 kB