GitHub - lucidrains/villa-X: Implementation of ViLLA-X, Enhancing Latent Action Modeling in Vision-Language-Action Models

villa-X (wip)

Implementation of ViLLa-X, "Enhancing Latent Action Modeling in Vision-Language-Action Models", from Tsinghua

Citations

@inproceedings{Chen2025villaXEL,
    title   = {villa-X: Enhancing Latent Action Modeling in Vision-Language-Action Models},
    author  = {Xiaoyu Chen and Hangxing Wei and Pushi Zhang and Chuheng Zhang and Kaixin Wang and Yanjiang Guo and Rushuai Yang and Yucen Wang and Xinquan Xiao and Li Zhao and Jianyu Chen and Jiang Bian},
    year  = {2025},
    url   = {https://api.semanticscholar.org/CorpusID:280401068}
}

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.github/workflows		.github/workflows
tests		tests
villa_x		villa_x
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
fig1-lam.png		fig1-lam.png
pyproject.toml		pyproject.toml
villa-x.png		villa-x.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

villa-X (wip)

Citations

About

Uh oh!

Releases 4

Packages

Languages

License

lucidrains/villa-X

Folders and files

Latest commit

History

Repository files navigation

villa-X (wip)

Citations

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 4

Packages 0

Languages

Packages