VISIONx @ NYU

university

https://www.sainingxie.com/

AI & ML interests

None defined yet.

Recent Activity

ellisbrown authored a paper 1 day ago

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

AustinWang0330 authored a paper 1 day ago

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

bytetriper submitted a paper 2 days ago

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

View all activity

Papers

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

SIMS-V: Simulated Instruction-Tuning for Spatial Video Understanding

View all Papers

nyu-visionx 's models 36

nyu-visionx/webssl300m_decoder

Updated 2 days ago • 34

nyu-visionx/siglip2_decoder

Updated 16 days ago • 177

nyu-visionx/Scale-RAE-Qwen7B_DiT9.8B

Text Generation • 17B • Updated 16 days ago • 18

nyu-visionx/Scale-RAE-Qwen1.5B_DiT2.4B

Text Generation • 4B • Updated 16 days ago • 408

nyu-visionx/Scale-RAE-Qwen1.5B_DiT2.4B-WebSSL

4B • Updated 16 days ago • 61

nyu-visionx/Cambrian-S-3B-S3

3B • Updated 21 days ago • 251

nyu-visionx/Cambrian-S-3B-S2

3B • Updated 21 days ago • 280

nyu-visionx/Cambrian-S-3B-S1

3B • Updated 21 days ago • 9

nyu-visionx/Cambrian-S-1.5B-S3

2B • Updated 21 days ago • 185

nyu-visionx/Cambrian-S-1.5B-S2

2B • Updated 21 days ago • 287

nyu-visionx/Cambrian-S-1.5B-S1

2B • Updated 21 days ago • 9

nyu-visionx/Cambrian-S-0.5B-S3

0.9B • Updated 21 days ago • 435

nyu-visionx/Cambrian-S-0.5B-S2

0.9B • Updated 21 days ago • 203

nyu-visionx/Cambrian-S-0.5B-S1

0.9B • Updated 21 days ago • 5

nyu-visionx/Cambrian-S-7B-S1

8B • Updated Dec 24, 2025 • 3

nyu-visionx/Cambrian-S-7B-S2

8B • Updated Dec 24, 2025 • 970

nyu-visionx/Cambrian-S-7B-S3

8B • Updated Dec 24, 2025 • 2.03k

nyu-visionx/FreeFlow

Unconditional Image Generation • Updated Nov 29, 2025 • 1

nyu-visionx/RAE-collections

Unconditional Image Generation • Updated Nov 25, 2025 • 41

nyu-visionx/Cambrian-S-1.5B

Image-to-Text • 2B • Updated Nov 7, 2025 • 87 • 3

nyu-visionx/Cambrian-S-3B

Image-to-Text • 3B • Updated Nov 7, 2025 • 2.84k • 1

nyu-visionx/Cambrian-S-0.5B

Image-to-Text • 0.9B • Updated Nov 7, 2025 • 432 • 2

nyu-visionx/Cambrian-S-7B

Image-to-Text • 8B • Updated Nov 7, 2025 • 3.1k • 5

nyu-visionx/Cambrian-S-7B-LFP

8B • Updated Nov 6, 2025 • 1.26k • 3

nyu-visionx/SiT-collections

Updated Nov 5, 2025

nyu-visionx/DiffuseNNX-collections

Updated Nov 4, 2025

nyu-visionx/pyramid_flow_ft_ckpt

Updated Mar 30, 2025

nyu-visionx/cambrian-phi3-3b

Text Generation • 4B • Updated Jul 6, 2024 • 139 • 11

nyu-visionx/cambrian-34b

Text Generation • 35B • Updated Jun 28, 2024 • 4 • 27

nyu-visionx/cambrian-13b

Text Generation • 13B • Updated Jun 28, 2024 • 1 • 19