May 17, 2026

MolmoAct2-LIBERO: An Open Vision-Language-Action Model for Robotics

38 minutes

Vision-Language-Action (VLA) model fine-tuned on the merged LIBERO robotics dataset (1,693 episodes, 273k+ frames) achieving 98.25% success rate on manipulation tasks. Released with both checkpoint and dataset for VLA finetuning.

...more

View all episodes

By Shaoqing Tan

May 17, 2026

MolmoAct2-LIBERO: An Open Vision-Language-Action Model for Robotics

38 minutes

...more

Share MolmoAct2-LIBERO: An Open Vision-Language-Action Model for Robotics

Sign up to save your podcasts

MolmoAct2-LIBERO: An Open Vision-Language-Action Model for Robotics

MolmoAct2-LIBERO: An Open Vision-Language-Action Model for Robotics