ReubenSun commited on May 11

Commit

83e80f8

1 Parent(s): cafad5e

init

Browse files

Files changed (21) hide show

Step-1X-3D-Texture/step1x-3d-ig2v.safetensors +3 -0
Step1X-3D-Geometry-1300m/model_index.json +32 -0
Step1X-3D-Geometry-1300m/scheduler/scheduler_config.json +16 -0
Step1X-3D-Geometry-1300m/transformer/config.json +18 -0
Step1X-3D-Geometry-1300m/transformer/diffusion_pytorch_model.safetensors +3 -0
Step1X-3D-Geometry-1300m/vae/config.json +31 -0
Step1X-3D-Geometry-1300m/vae/diffusion_pytorch_model.safetensors +3 -0
Step1X-3D-Geometry-1300m/visual_eature_extractor/preprocessor_config.json +27 -0
Step1X-3D-Geometry-1300m/visual_encoder/config.json +15 -0
Step1X-3D-Geometry-1300m/visual_encoder/diffusion_pytorch_model.safetensors +3 -0
Step1X-3D-Geometry-Label-1300m/label_encoder/config.json +6 -0
Step1X-3D-Geometry-Label-1300m/label_encoder/diffusion_pytorch_model.safetensors +3 -0
Step1X-3D-Geometry-Label-1300m/model_index.json +32 -0
Step1X-3D-Geometry-Label-1300m/scheduler/scheduler_config.json +16 -0
Step1X-3D-Geometry-Label-1300m/transformer/config.json +17 -0
Step1X-3D-Geometry-Label-1300m/transformer/diffusion_pytorch_model.safetensors +3 -0
Step1X-3D-Geometry-Label-1300m/vae/config.json +30 -0
Step1X-3D-Geometry-Label-1300m/vae/diffusion_pytorch_model.safetensors +3 -0
Step1X-3D-Geometry-Label-1300m/visual_eature_extractor/preprocessor_config.json +27 -0
Step1X-3D-Geometry-Label-1300m/visual_encoder/config.json +17 -0
Step1X-3D-Geometry-Label-1300m/visual_encoder/diffusion_pytorch_model.safetensors +3 -0

Step-1X-3D-Texture/step1x-3d-ig2v.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:05cd28096e875712c1f2489bb325a9bc7324a41cd3f367d7a38c63f1bea77964
+size 3602537816

Step1X-3D-Geometry-1300m/model_index.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_class_name": "Step1X3DGeometryPipeline",
+  "_diffusers_version": "0.32.2",
+  "caption_encoder": [
+    null,
+    null
+  ],
+  "label_encoder": [
+    null,
+    null
+  ],
+  "scheduler": [
+    "diffusers",
+    "FlowMatchEulerDiscreteScheduler"
+  ],
+  "transformer": [
+    "step1x3d_geometry.models.transformers.flux_transformer_1d",
+    "FluxDenoiser"
+  ],
+  "vae": [
+    "step1x3d_geometry.models.autoencoders.michelangelo_autoencoder",
+    "MichelangeloAutoencoder"
+  ],
+  "visual_eature_extractor": [
+    "transformers",
+    "BitImageProcessor"
+  ],
+  "visual_encoder": [
+    "step1x3d_geometry.models.conditional_encoders.dinov2_encoder",
+    "Dinov2Encoder"
+  ]
+}

Step1X-3D-Geometry-1300m/scheduler/scheduler_config.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "_class_name": "FlowMatchEulerDiscreteScheduler",
+  "_diffusers_version": "0.32.2",
+  "base_image_seq_len": 256,
+  "base_shift": 0.5,
+  "invert_sigmas": false,
+  "max_image_seq_len": 4096,
+  "max_shift": 1.15,
+  "num_train_timesteps": 1000,
+  "shift": 1.0,
+  "shift_terminal": null,
+  "use_beta_sigmas": false,
+  "use_dynamic_shifting": false,
+  "use_exponential_sigmas": false,
+  "use_karras_sigmas": false
+}

Step1X-3D-Geometry-1300m/transformer/config.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "weights": null,
+    "input_channels": 64,
+    "width": 1280,
+    "layers": 12,
+    "num_single_layers": 24,
+    "num_heads": 20,
+    "condition_dim": 1024,
+    "multi_condition_type": "in_context",
+    "use_visual_condition": true,
+    "visual_condition_dim": 1024,
+    "n_views": 1,
+    "use_caption_condition": false,
+    "caption_condition_dim": 1024,
+    "use_label_condition": false,
+    "label_condition_dim": 1024,
+    "identity_init": false
+}

Step1X-3D-Geometry-1300m/transformer/diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a8cfc27716009acc60035f2489a9b61de81790625b70aa27a682efc99a5137a9
+size 5265243816

Step1X-3D-Geometry-1300m/vae/config.json ADDED Viewed

	@@ -0,0 +1,31 @@

+{
+    "weights": null,
+    "n_samples": 16384,
+    "use_downsample": true,
+    "downsample_ratio": 0.0625,
+    "num_latents": 2048,
+    "point_feats": 3,
+    "embed_point_feats": false,
+    "out_dim": 1,
+    "embed_dim": 64,
+    "embed_type": "fourier",
+    "num_freqs": 8,
+    "include_pi": false,
+    "width": 768,
+    "heads": 12,
+    "num_encoder_layers": 8,
+    "num_decoder_layers": 16,
+    "init_scale": 0.009021097956087902,
+    "qkv_bias": false,
+    "qk_norm": false,
+    "use_ln_post": true,
+    "use_flash": true,
+    "use_checkpoint": true,
+    "use_multi_reso": false,
+    "resolutions": null,
+    "sampling_prob": null,
+    "with_sharp_data": true,
+    "volume_decoder_type": "hierarchical",
+    "surface_extractor_type": "mc",
+    "z_scale_factor": 1.0
+}

Step1X-3D-Geometry-1300m/vae/diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa1b17360f6614a54ab3b971c966cfe64ff87a5445186b02c666e634b59c8302
+size 766401652

Step1X-3D-Geometry-1300m/visual_eature_extractor/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "crop_size": {
+    "height": 518,
+    "width": 518
+  },
+  "do_center_crop": true,
+  "do_convert_rgb": true,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.48145466,
+    0.4578275,
+    0.40821073
+  ],
+  "image_processor_type": "BitImageProcessor",
+  "image_std": [
+    0.26862954,
+    0.26130258,
+    0.27577711
+  ],
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "shortest_edge": 518
+  }
+}

Step1X-3D-Geometry-1300m/visual_encoder/config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+    "weights": null,
+    "encode_camera": false,
+    "camera_embeds_type": "sincos",
+    "camera_embeds_dim": null,
+    "n_views": 1,
+    "empty_embeds_ratio": 0.1,
+    "normalize_embeds": false,
+    "zero_uncond_embeds": true,
+    "freeze_modulation_dino": false,
+    "enable_gradient_checkpointing": false,
+    "image_size": 518,
+    "dino_type": "facebook/dinov2-with-registers-large",
+    "kwargs": null
+}

Step1X-3D-Geometry-1300m/visual_encoder/diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c07f8abe3af5db214e3341c9f23fb2351cb15591afdae0da8e835dfabc42e850
+size 1217544216

Step1X-3D-Geometry-Label-1300m/label_encoder/config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+    "hidden_size": 1024,
+    "empty_embeds_ratio": 0.1,
+    "normalize_embeds": false,
+    "zero_uncond_embeds": true
+}

Step1X-3D-Geometry-Label-1300m/label_encoder/diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d7d76cfe4bc95f264421fa34076826bada5a218e63febabe69461d8c2607e4b
+size 33104

Step1X-3D-Geometry-Label-1300m/model_index.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_class_name": "Step1X3DGeometryPipeline",
+  "_diffusers_version": "0.32.2",
+  "caption_encoder": [
+    null,
+    null
+  ],
+  "label_encoder": [
+    "step1x3d_geometry.models.conditional_encoders.label_encoder",
+    "LabelEncoder"
+  ],
+  "scheduler": [
+    "diffusers",
+    "FlowMatchEulerDiscreteScheduler"
+  ],
+  "transformer": [
+    "step1x3d_geometry.models.transformers.flux_transformer_1d",
+    "FluxDenoiser"
+  ],
+  "vae": [
+    "step1x3d_geometry.models.autoencoders.michelangelo_autoencoder",
+    "MichelangeloAutoencoder"
+  ],
+  "visual_eature_extractor": [
+    "transformers",
+    "BitImageProcessor"
+  ],
+  "visual_encoder": [
+    "step1x3d_geometry.models.conditional_encoders.dinov2_clip_encoder",
+    "Dinov2CLIPEncoder"
+  ]
+}

Step1X-3D-Geometry-Label-1300m/scheduler/scheduler_config.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "_class_name": "FlowMatchEulerDiscreteScheduler",
+  "_diffusers_version": "0.32.2",
+  "base_image_seq_len": 256,
+  "base_shift": 0.5,
+  "invert_sigmas": false,
+  "max_image_seq_len": 4096,
+  "max_shift": 1.15,
+  "num_train_timesteps": 1000,
+  "shift": 1.0,
+  "shift_terminal": null,
+  "use_beta_sigmas": false,
+  "use_dynamic_shifting": false,
+  "use_exponential_sigmas": false,
+  "use_karras_sigmas": false
+}

Step1X-3D-Geometry-Label-1300m/transformer/config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+    "input_channels": 64,
+    "width": 1536,
+    "layers": 8,
+    "num_single_layers": 16,
+    "num_heads": 16,
+    "condition_dim": 1024,
+    "multi_condition_type": "in_context",
+    "use_visual_condition": true,
+    "visual_condition_dim": 1024,
+    "n_views": 1,
+    "use_caption_condition": false,
+    "caption_condition_dim": 1024,
+    "use_label_condition": true,
+    "label_condition_dim": 1024,
+    "identity_init": false
+}

Step1X-3D-Geometry-Label-1300m/transformer/diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0df096288471320f3fd566e94db628c3a36a697ae6fa55e60152b236fd5918aa
+size 5086980952

Step1X-3D-Geometry-Label-1300m/vae/config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+    "n_samples": 16384,
+    "use_downsample": true,
+    "downsample_ratio": 0.0625,
+    "num_latents": 2048,
+    "point_feats": 3,
+    "embed_point_feats": false,
+    "out_dim": 1,
+    "embed_dim": 64,
+    "embed_type": "fourier",
+    "num_freqs": 8,
+    "include_pi": false,
+    "width": 768,
+    "heads": 12,
+    "num_encoder_layers": 8,
+    "num_decoder_layers": 16,
+    "init_scale": 0.009021097956087902,
+    "qkv_bias": false,
+    "qk_norm": false,
+    "use_ln_post": true,
+    "use_flash": true,
+    "use_checkpoint": true,
+    "use_multi_reso": false,
+    "resolutions": null,
+    "sampling_prob": null,
+    "with_sharp_data": true,
+    "volume_decoder_type": "hierarchical",
+    "surface_extractor_type": "mc",
+    "z_scale_factor": 1.0
+}

Step1X-3D-Geometry-Label-1300m/vae/diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a9d764b4e3fdf377f1ba960215f2e91800fa6bf86ec5243340b96e22a0a7f781
+size 766401652

Step1X-3D-Geometry-Label-1300m/visual_eature_extractor/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "crop_size": {
+    "height": 518,
+    "width": 518
+  },
+  "do_center_crop": true,
+  "do_convert_rgb": true,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.48145466,
+    0.4578275,
+    0.40821073
+  ],
+  "image_processor_type": "BitImageProcessor",
+  "image_std": [
+    0.26862954,
+    0.26130258,
+    0.27577711
+  ],
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "shortest_edge": 518
+  }
+}

Step1X-3D-Geometry-Label-1300m/visual_encoder/config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+    "encode_camera": false,
+    "camera_embeds_type": "sincos",
+    "camera_embeds_dim": null,
+    "n_views": 1,
+    "empty_embeds_ratio": 0.1,
+    "normalize_embeds": false,
+    "zero_uncond_embeds": true,
+    "freeze_modulation_clip": false,
+    "freeze_modulation_dino": false,
+    "enable_gradient_checkpointing": false,
+    "image_size": 518,
+    "fuse_type": "concat",
+    "dino_type": "facebook/dinov2-with-registers-large",
+    "clip_type": "openai/clip-vit-large-patch14",
+    "kwargs": null
+}

Step1X-3D-Geometry-Label-1300m/visual_encoder/diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f9b22f50296f1f63841c92a724c732bffee8051b59e830e9eac9a99af8d0e65e
+size 2928089212