Paper-Conference

H2O+: An Improved Framework for Hybrid Offline-and-Online RL with Dynamics Gaps

Solving real-world complex tasks using reinforcement learning (RL) without high-fidelity simulation environments or large amounts of …

Haoyi Niu, Tianying Ji, Bingqi Liu, Haocheng Zhao, Xiangyu Zhu, Jianying Zheng, Pengfei Huang, Guyue Zhou, Jianming HU, Xianyuan Zhan

Robo-MUTUAL: Robotic Multimodal Task Specification via Unimodal Learning

Multimodal task specification is essential for enhanced robotic performance, where Cross-modality Alignment enables the robot to …

Jianxiong Li, Zhihao Wang, Jinliang Zheng, Xiaoai Zhou, Guanming Wang, Guanglu Song, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Junzhi Yu, Xianyuan Zhan

Skill Expansion and Composition in Parameter Space

Humans excel at reusing prior knowledge to address new challenges and developing skills while solving problems. This paradigm becomes …

Tenglong Liu, Jianxiong Li, Yinan Zheng, Haiyi Niu, Yixing Lan, Xin Xu, Xianyuan Zhan

Skill Expansion and Composition in Parameter Space

Are Expressive Models Truly Necessary for Offline RL?

Among various branches of offline reinforcement learning (RL) methods, goal-conditioned supervised learning (GCSL) has gained …

Guan Wang, Haoyi Niu, Jianxiong Li, Li Jiang, Jianming HU, Xianyuan Zhan

Are Expressive Models Truly Necessary for Offline RL?

Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning

One important property of DIstribution Correction Estimation (DICE) methods is that the solution is the optimal stationary distribution …

Liyuan Mao, Haoran Xu, Weinan Zhang, Xianyuan Zhan, Amy Zhang

Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning

Instruction-Guided Visual Masking

Instruction following is crucial in contemporary LLM. However, when extended to multimodal setting, it often suffers from misalignment …

Jinliang Zheng, Jianxiong Li, Sijie Cheng, Yinan Zheng, Jiaming Li, Jihao Liu, Yu Liu, Jingjing Liu, Xianyuan Zhan

Instruction-Guided Visual Masking

TESLA: Thermally Safe, Load-Aware, and Energy-Efficient Cooling Control System for Data Centers

The increasing demand for artificial intelligence and cloud computing has led to skyrocketing energy consumption of data centers (DCs). …

Hanfei Geng, Yi Sun, Yuanzhe Li, Jichao Leng, Xiangyu Zhu, Xianyuan Zhan, Yuanchun Li, Feng Zhao, Yunxin Liu

Bidirectional-Reachable Hierarchical Reinforcement Learning with Mutually Responsive Policies

Hierarchical reinforcement learning (HRL) addresses complex long-horizon tasks by skillfully decomposing them into subgoals. Therefore, …

Yu Luo, Fuchun Sun, Tianying Ji, Xianyuan Zhan