Publications

Jinliang Zheng, Jianxiong Li, Zhihao Wang, Dongxiu Liu, Xirui Kang, Yuchun Feng, Yinan Zheng, Jiayin Zou, Yilun Chen, Jia Zeng, Ya-Qin Zhang, Jiangmiao Pang, Jingjing Liu, Tai Wang, Xianyuan Zhan (2026). X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment Vision-Language-Action Model. In the 14th International Conference on Learning Representations (ICLR 2026).

PDF Cite Code Project Project Website

Peng Cheng, Zhihao Wu, Jianxiong Li, Ziteng He, Haoran Xu, Wei Sun, Youfang Lin, Yunxin Liu, Xianyuan Zhan (2026). Sample Efficient Offline RL via T-Symmetry Enforced Latent State-Stitching. In the 14th International Conference on Learning Representations (ICLR 2026).

PDF Cite Project Project

Pengxiang Li, Yinan Zheng, Yue Wang, HuiminWang, Hang Zhao, Jingjing Liu, Xianyuan Zhan, Kun Zhan, XianPeng Lang (2026). Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving. In the 14th International Conference on Learning Representations (ICLR 2026).

PDF Cite Project Project

Ruiming Liang, Yinan Zheng, Kexin ZHENG, Tianyi Tan, Jianxiong Li, Liyuan Mao, Zhihao Wang, Guang Chen, Hangjun Ye, Jingjing Liu, Jinqiao Wang, Xianyuan Zhan (2026). Dichotomous Diffusion Policy Optimization. In the 14th International Conference on Learning Representations (ICLR 2026).

PDF Cite Project Project

Haoyi Niu, Qimao Chen, Tenglong Liu, Jianxiong Li, Guyue Zhou, Yi Zhang, Jianming HU, Xianyuan Zhan (2026). xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing. International Conference on Autonomous Agents and Multi-Agent Systems (AAMAS 2026).

PDF Cite Code Project Project Website

Haoran Xu, Liyuan Mao, Hui Jin, Weinan Zhang, Xianyuan Zhan, Amy Zhang (2025). Uni-RL: Unifying Online and Offline RL via Implicit Value Regularization. In the Thirty-Ninth Conference on Neural Information Processing Systems (NeurIPS 2025).

PDF Cite Code Project Website

Kexin ZHENG, Lauriane Teyssier, Yinan Zheng, Yu Luo, Xianyuan Zhan (2025). Towards Robust Zero-Shot Reinforcement Learning. In the Thirty-Ninth Conference on Neural Information Processing Systems (NeurIPS 2025).

PDF Cite Project Website

Tianyi Tan, Yinan Zheng, Ruiming Liang, Zexu Wang, Kexin ZHENG, Jinliang Zheng, Jianxiong Li, Xianyuan Zhan, Jingjing Liu (2025). Flow Matching-Based Autonomous Driving Planning with Advanced Interactive Behavior Modeling. In the Thirty-Ninth Conference on Neural Information Processing Systems (NeurIPS 2025).

PDF Cite Code Project Project Website

Dongxiu Liu, Haoyi Niu, Zhihao Wang, Jinliang Zheng, Yinan Zheng, Zhonghong Ou, Jianming HU, Jianxiong Li, Xianyuan Zhan (2025). Efficient Robotic Policy Learning via Latent Space Backward Planning. The 42nd International Conference on Machine Learning (ICML 2025).

PDF Cite Code Project Project Website

Jinliang Zheng, Jianxiong Li, Dongxiu Liu, Yinan Zheng, Zhihao Wang, Zhonghong Ou, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Xianyuan Zhan (2025). Universal Actions for Enhanced Embodied Foundation Models. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2025).

PDF Cite Code Project Project Website

Jianxiong Li, Zhihao Wang, Jinliang Zheng, Xiaoai Zhou, Guanming Wang, Guanglu Song, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Junzhi Yu, Xianyuan Zhan (2025). Robo-MUTUAL: Robotic Multimodal Task Specification via Unimodal Learning. 2025 IEEE International Conference on Robotics & Automation (ICRA 2025).

PDF Cite Code Project Project Website

Haoyi Niu, Tianying Ji, Bingqi Liu, Haocheng Zhao, Xiangyu Zhu, Jianying Zheng, Pengfei Huang, Guyue Zhou, Jianming HU, Xianyuan Zhan (2025). H2O+: An Improved Framework for Hybrid Offline-and-Online RL with Dynamics Gaps. 2025 IEEE International Conference on Robotics & Automation (ICRA 2025).

PDF Cite Code Project Project Website

Tenglong Liu, Jianxiong Li, Yinan Zheng, Haiyi Niu, Yixing Lan, Xin Xu, Xianyuan Zhan (2025). Skill Expansion and Composition in Parameter Space. The Thirteenth International Conference on Learning Representations (ICLR 2025).

PDF Cite Code Project Project Website

Yinan Zheng, Ruiming Liang, Kexin ZHENG, Jinliang Zheng, Liyuan Mao, Jianxiong Li, Weihao Gu, Rui Ai, Shengbo Eben Li, Xianyuan Zhan, Jingjing Liu (2025). Diffusion-Based Planning for Autonomous Driving with Flexible Guidance. The Thirteenth International Conference on Learning Representations (ICLR 2025) (oral).

PDF Cite Code Project Project Website

Xianyuan Zhan, Xiangyu Zhu, Peng Cheng, Xiao Hu, Ziteng He, Hanfei Geng, Jichao Leng, Huiwen Zheng, Chenhui Liu, Tianshun Hong, Yan Liang, Yunxin Liu, Feng Zhao (2025). Data Center Cooling System Optimization Using Offline Reinforcement Learning. The Thirteenth International Conference on Learning Representations (ICLR 2025).

PDF Cite Project Project Website

Guan Wang, Haoyi Niu, Jianxiong Li, Li Jiang, Jianming HU, Xianyuan Zhan (2024). Are Expressive Models Truly Necessary for Offline RL?. The 39th Annual AAAI Conference on Artificial Intelligence (AAAI) (oral) (This paper is also accepted in NeurIPS 2024 Workshop on Open-World Agents (OWA)).

PDF Cite Code Project Project

Jinliang Zheng, Jianxiong Li, Sijie Cheng, Yinan Zheng, Jiaming Li, Jihao Liu, Yu Liu, Jingjing Liu, Xianyuan Zhan (2024). Instruction-Guided Visual Masking. In the Thirty-Eighth Conference on Neural Information Processing Systems (NeurIPS 2024) (Outstanding paper award of ICML 2024 MFM-EAI Workshop).

PDF Cite Code Project Project Website

Liyuan Mao, Haoran Xu, Weinan Zhang, Xianyuan Zhan, Amy Zhang (2024). Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning. In the Thirty-Eighth Conference on Neural Information Processing Systems (NeurIPS 2024).

PDF Cite Code Project Website

Hanfei Geng, Yi Sun, Yuanzhe Li, Jichao Leng, Xiangyu Zhu, Xianyuan Zhan, Yuanchun Li, Feng Zhao, Yunxin Liu (2024). TESLA: Thermally Safe, Load-Aware, and Energy-Efficient Cooling Control System for Data Centers. 53rd International Conference on Parallel Processing (ICPP 2024).

Yu Luo, Fuchun Sun, Tianying Ji, Xianyuan Zhan (2024). Bidirectional-Reachable Hierarchical Reinforcement Learning with Mutually Responsive Policies. 1st Reinforcement Learning Conference (RLC 2024).

PDF Cite Code Project

Yu Luo, Tianying Ji, Fuchun Sun, Jianwei Zhang, Huazhe Xu, Xianyuan Zhan (2024). OMPO: A Unified Framework for RL under Policy and Dynamics Shifts. Forty-first International Conference on Machine Learning (ICML 2024) (oral).

PDF Cite Project

Yu Luo, Tianying Ji, Fuchun Sun, Jianwei Zhang, Huazhe Xu, Xianyuan Zhan (2024). Offline-Boosted Actor-Critic: Adaptively Blending Optimal Historical Behaviors in Deep Off-Policy RL. Forty-first International Conference on Machine Learning (ICML 2024).

PDF Cite Project

Jianxiong Li, Jinliang Zheng, Yinan Zheng, Liyuan Mao, Xiao Hu, Sijie Cheng, Haoyi Niu, Jihao Liu, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Xianyuan Zhan (2024). DecisionNCE: Embodied Multimodal Representations via Implicit Preference Learning. Forty-first International Conference on Machine Learning (ICML 2024) (Outstanding paper award of ICML 2024 MFM-EAI Workshop).

PDF Cite Code Project Project Website

Tianying Ji, Yu Luo, Fuchun Sun, Xianyuan Zhan, Jianwei Zhang, Huazhe Xu (2024). Seizing Serendipity: Exploiting the Value of Past Success in Off-Policy Actor-Critic. In the 41st International Conference on Machine Learning (ICML 2024).

PDF Cite Project Website

Haoyi Niu, Jianming HU, Guyue Zhou, Xianyuan Zhan (2024). A Comprehensive Survey of Cross-Domain Policy Transfer for Embodied Agents. 33st International Joint Conference on Artificial Intelligence (IJCAI 2024).

PDF Cite Code Project

Yinan Zheng, Jianxiong Li, Dongjie Yu, Yujie Yang, Shengbo Eben Li, Xianyuan Zhan, Jingjing Liu (2024). Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model. In 12th International Conference on Learning Representations (ICLR 2024).

PDF Cite Code Project Website

Liyuan Mao, Haoran Xu, Weinan Zhang, Xianyuan Zhan (2024). Revealing the Mystery of Distribution Correction Estimation via Orthogonal-gradient Update. In 12th International Conference on Learning Representations (ICLR 2024)(spotlight).

PDF Cite Project

Xiao Hu, Jianxiong Li, Xianyuan Zhan, Qing-Shan Jia, Ya-Qin Zhang (2024). Query-Policy Misalignment in Preference-Based Reinforcement Learning. In 12th International Conference on Learning Representations (ICLR 2024)(spotlight).

PDF Cite Project

Guan Wang, Sijie Cheng, Xianyuan Zhan, Xiangang Li, Sen Song, Yang Liu (2024). OpenChat: Advancing Open-source Language Models with Mixed-Quality Data. 12th International Conference on Learning Representations (ICLR 2024).

Huiling Qin, Xianyuan Zhan, Yuanxun Li, Yu Zheng (2023). FlexSSL : A Generic and Efficient Framework for Semi-Supervised Learning.

PDF Cite Project

Jianxiong Li, Shichao Lin, Tianyu Shi, Chujie Tian, Yu Mei, Jian Song, Xianyuan Zhan, Ruimin Li (2023). A Fully Data-Driven Approach for Realistic Traffic Signal Control Using Offline Reinforcement Learning.

PDF Cite Project Project

Xiangsen Wang, Haoran Xu, Yinan Zheng, Xianyuan Zhan (2023). Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization. Advances in Neural Information Processing Systems (NeurIPS 2023).

PDF Cite Project

Peng Cheng, Xianyuan Zhan, Zhihao Wu, Wenjia Zhang, Shoucheng Song, Han Wang, Youfang Lin, Li Jiang (2023). Look Beneath the Surface: Exploiting Fundamental Symmetry for Sample-Efficient Offline RL. Advances in Neural Information Processing Systems (NeurIPS 2023).

PDF Cite Project Project

Jianxiong Li, Xiao Hu, Haoran Xu, Jingjing Liu, Xianyuan Zhan, Ya-Qin Zhang (2023). PROTO: Iterative Policy Regularized Offline-to-Online Reinforcement Learning.

PDF Cite Project

Jianxiong Li, Xianyuan Zhan, Haoran Xu, Xiangyu Zhu, Jingjing Liu, Ya-Qin Zhang (2023). When Data Geometry Meets Deep Function: Generalizing Offline Reinforcement Learning. International Conference on Learning Representations.

PDF Cite Code Project

Haoran Xu, Li Jiang, Jianxiong Li, Zhuoran Yang, Zhaoran Wang, Victor Wai Kin Chan, Xianyuan Zhan (2023). Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization. The 11th International Conference on Learning Representations (ICLR 2023) (oral).

PDF Cite Code Project

Li Jiang, Xiangsen Wang, Aidong Yang, Xidong Wang, Xiaojia Jin, Wei Wang, Xiaozhou Ye, Ye Ouyang, Xianyuan Zhan (2023). An Efficient Multi-Agent Optimization Approach for Coordinated Massive MIMO Beamforming. IEEE International Conference on Communications (ICC).

PDF Cite Project Project

Jianxiong Li, Xiao Hu, Haoran Xu, Jingjing Liu, Xianyuan Zhan, Qing-Shan Jia, Ya-Qin Zhang (2023). Mind the Gap: Offline Policy Optimization for Imperfect Rewards. International Conference on Learning Representations.

PDF Cite Project

Xiangsen Wang, Xianyuan Zhan (2023). Offline Multi-Agent Reinforcement Learning with Coupled Value Factorization. International Conference on Autonomous Agents and Multiagent Systems 2023 (AAMAS 2023).

PDF Cite Project

Haoyi Niu, Shubham Sharma, Yiwen Qiu, Ming Li, Guyue Zhou, Jianming HU, Xianyuan Zhan (2022). When to Trust Your Simulator: Dynamics-Aware Hybrid Offline-and-Online Reinforcement Learning. Advances in Neural Information Processing Systems.

PDF Cite Code Project Project

Haoran Xu, Li Jiang, Jianxiong Li, Xianyuan Zhan (2022). A Policy-Guided Imitation Approach for Offline Reinforcement Learning. The Thirty-sixth Conference on Neural Information Processing Systems (NeurIPS 2022) (oral).

PDF Cite Code Project

Wenjia Zhang, Haoran Xu, Haoyi Niu, Peng Cheng, Ming Li, Heming Zhang, Guyue Zhou, Xianyuan Zhan (2022). Discriminator-Guided Model-Based Offline Imitation Learning. Conference on Robot Learning (CoRL 2022).

PDF Cite Project Project

Haoran Xu, Xianyuan Zhan, Honglei Yin, Huiling Qin (2022). Discriminator-Weighted Offline Imitation Learning from Suboptimal Demonstrations. International Conference on Machine Learning (ICML 2022).

PDF Cite Code Project

Xianyuan Zhan, Xiangyu Zhu, Haoran Xu (2022). Model-Based Offline Planning with Trajectory Pruning. International Joint Conference on Artificial Intelligence.

PDF Cite Code Project

Xianyuan Zhan, Haoran Xu, Yue Zhang, Xiangyu Zhu, Honglei Yin, Yu Zheng (2021). DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning. Proceedings of the AAAI Conference on Artificial Intelligence (AAAI2022).

PDF Cite Project Project

Haoran Xu, Xianyuan Zhan, Xiangyu Zhu (2021). Constraints Penalized Q-Learning for Safe Offline Reinforcement Learning. Proceedings of the AAAI Conference on Artificial Intelligence (AAAI2022).

PDF Cite Project