VLMs - a ag4304 Collection

ag4304 's Collections

Agents

MoEs

VLAs

VLMs

Diffusion models

VLMs

updated 7 days ago

Dream-VL & Dream-VLA: Open Vision-Language and Vision-Language-Action Models with Diffusion Language Model Backbone

Paper • 2512.22615 • Published 13 days ago • 43
Learning to Reason in 4D: Dynamic Spatial Understanding for Vision Language Models

Paper • 2512.20557 • Published 17 days ago • 49
TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

Paper • 2512.16093 • Published 22 days ago • 93