Publications

Karl Pertsch, Kyle Stachowicz, Brian Ichter, Danny Driess, Suraj Nair, Quan Vuong, Oier Mees, Chelsea Finn, Sergey Levine (2025). FAST: Efficient Action Tokenization for Vision-Language-Action Models. In RSS.

PDF Cite Code Project

Joshua Jones, Oier Mees, Carmelo Sferrazza, Kyle Stachowicz, Pieter Abbeel, Sergey Levine (2025). Beyond Sight: Finetuning Generalist Robot Policies with Heterogeneous Sensors via Language Grounding. In ICRA.

PDF Cite Code Dataset Project

Kyle B Hatch, Ashwin Balakrishna, Oier Mees, Suraj Nair, Seohong Park, Blake Wulfe, Masha Itkina, Benjamin Eysenbach, Sergey Levine, Thomas Kollar, Benjamin Burchfiel (2024). GHIL-Glue: Hierarchical Control with Filtered Subgoal Images. In ICRA.

PDF Cite Code Project

Hongkuan Zhou, Xiangtong Yao, Oier Mees, Yuan Meng, Ted Xiao, Yonatan Bisk, Jean Oh, Edward Johns, Mohit Shridhar, Dhruv Shah, Jesse Thomason, Kai Huang, Joyce Chai, Zhenshan Bing, Alois Knoll (2024). Bridging Language and Action: A Survey of Language-Conditioned Robot Manipulation. In arxiv:2312.10807.

PDF Cite

Nils Blank, Moritz Reuss, Marcel Rühle, Ömer Erdinç Yağmurlu, Fabian Wenzel, Oier Mees, Rudolf Lioutikov (2024). Scaling Robot Policy Learning via Zero-Shot Labeling with Foundation Models. In CoRL.

PDF Cite Project

Mitsuhiko Nakamoto, Oier Mees, Aviral Kumar, Sergey Levine (2024). Steering Your Generalists: Improving Robotic Foundation Models via Value Guidance. In CoRL.

PDF Cite Project

Sudeep Dasari, Oier Mees, Sebastian Zhao, Mohan Kumar Srirama, Sergey Levine (2024). The Ingredients for Robotic Diffusion Transformers. In ICRA.

PDF Cite Code Dataset Project

Noriaki Hirose, Catherine Glossop, Ajay Sridhar, Dhruv Shah, Oier Mees, Sergey Levine (2024). LeLaN: Learning A Language-conditioned Navigation Policy from In-the-Wild Videos. In CoRL.

PDF Cite Code Project

Ria Doshi, Homer Walke, Oier Mees, Sudeep Dasari, Sergey Levine (2024). Scaling Cross-Embodied Learning: One Policy for Manipulation, Navigation, Locomotion and Aviation. In CoRL.

PDF Cite Code Project

Vivek Myers, Bill Chunyuan Zheng, Oier Mees, Sergey Levine, Kuan Fang (2024). Policy Adaptation via Language Optimization: Decomposing Tasks for Few-Shot Imitation. In CoRL.

PDF Cite Code Project

Zhiyuan Zhou, Pranav Atreya, Abraham Lee, Homer Walke, Oier Mees, Sergey Levine (2024). Autonomous Improvement of Instruction Following Skills via Foundation Models. In CoRL.

PDF Cite Code Dataset Project

Michal Zawalski, William Chen, Karl Pertsch, Oier Mees, Chelsea Finn, Sergey Levine (2024). Robotic Control via Embodied Chain-of-Thought Reasoning. In CoRL.

PDF Cite Code Project

Xuanlin Li, Kyle Hsu, Jiayuan Gu, Karl Pertsch, Oier Mees, Homer Rich Walke, Chuyuan Fu, Ishikaa Lunawat, Isabel Sieh, Sean Kirmani, Sergey Levine, Jiajun Wu, Chelsea Finn, Hao Su, Quan Vuong, Ted Xiao (2024). Evaluating Real-World Robot Manipulation Policies in Simulation. In CoRL.

PDF Cite Code Project Video

William Chen, Oier Mees, Aviral Kumar, Sergey Levine (2024). Vision-Language Models Provide Promptable Representations for Reinforcement Learning. In TMLR.

PDF Cite Project

Octo Model Team, Dibya Ghosh, Homer Walke, Karl Pertsch, Kevin Black, Oier Mees, Sudeep Dasari, Joey Hejna, Charles Xu, Jianlan Luo, Tobias Kreiman, You Liang Tan, Pannag Sanketi, Quan Vuong, Ted Xiao, Dorsa Sadigh, Chelsea Finn, Sergey Levine (2023). Octo: An Open-Source Generalist Robot Policy. In RSS.

PDF Cite Code Project

Open X-Embodiment Collaboration (2023). Open X-Embodiment: Robotic Learning Datasets and RT-X Models. In ICRA.

PDF Cite Code Dataset Project Google DeepMind Blog

Chenguang Huang, Oier Mees, Andy Zeng, Wolfram Burgard (2023). Audio Visual Language Maps for Robot Navigation. In ISER.

PDF Cite Code Project Video

Chenguang Huang, Oier Mees, Andy Zeng, Wolfram Burgard (2022). Visual Language Maps for Robot Navigation. In ICRA.

PDF Cite Code Project Video Google AI Blog

Oier Mees, Jessica Borja-Diaz, Wolfram Burgard (2022). Grounding Language with Visual Affordances over Unstructured Data. In ICRA.

PDF Cite Code Dataset Project

Erick Rosete, Oier Mees, Gabriel Kalweit, Joschka Boedecker, Wolfram Burgard (2022). Latent Plans for Task Agnostic Offline Reinforcement Learning. In CoRL.

PDF Cite Code Dataset Project

Oier Mees, Lukas Hermann, Wolfram Burgard (2022). What Matters in Language Conditioned Imitation Learning over Unstructured Data. In RA-L.

PDF Cite Code Dataset Project

Jessica Borja, Oier Mees, Gabriel Kalweit, Lukas Hermann, Joschka Boedecker, Wolfram Burgard (2022). Affordance Learning from Play for Sample-Efficient Policy Learning. In ICRA.

PDF Cite Code Dataset Project Video

Oier Mees, Lukas Hermann, Erick Rosete-Beas, Wolfram Burgard (2021). CALVIN: A Benchmark for Language-Conditioned Policy Learning for Long-Horizon Robot Manipulation Tasks. In RA-L.

PDF Cite Code Dataset Project Video

Oier Mees, Wolfram Burgard (2020). Composing Pick-and-Place Tasks By Grounding Language. In ISER.

PDF Cite Project

Iman Nematollahi, Oier Mees, Lukas Hermann, Wolfram Burgard (2020). Hindsight for Foresight: Unsupervised Structured Dynamics Models from Physical Interaction. In IROS.

PDF Cite Dataset Project Video Talk

Oier Mees, Alp Emek, Johan Vertens, Wolfram Burgard (2019). Learning Object Placements For Relational Instructions by Hallucinating Scene Representations. In ICRA.

PDF Cite Dataset Project Video Talk

Oier Mees, Markus Merklinger, Gabriel Kalweit, Wolfram Burgard (2019). Adversarial Skill Networks: Unsupervised Robot Skill Learning from Video. In ICRA.

PDF Cite Code Dataset Project Video Talk

Oier Mees, Maxim Tatarchenko, Thomas Brox, Wolfram Burgard (2019). Self-supervised 3D Shape and Viewpoint Estimation from Single Images for Robotics. In IROS.

PDF Cite Code Video

Wolfram Burgard, Abhinav Valada, Noha Radwan, Tayyab Naseer, Jingwei Zhang, Johan Vertens, Oier Mees, Andreas Eitel, Gabriel Oliveira (2017). Perspectives on Deep Multimodel Robot Learning. In ISRR.

PDF Cite

Oier Mees, Nichola Abdo, Mladen Mazuran, Wolfram Burgard (2017). Metric Learning for Generalizing Spatial Relations to New Objects. In IROS.

PDF Cite Code Dataset Project Video

Oier Mees, Andreas Eitel, Wolfram Burgard (2016). Choosing Smartly: Adaptive Multimodal Fusion for Object Detection in Changing Environments. In IROS.

PDF Cite Code Dataset Project