About

I am a fourth-year Ph.D. student at the Institute for AI Industry Research (AIR), Tsinghua University, advised by Prof. Yilun Chen and Prof. Ya-Qin Zhang. I received my B.S. from the University of Chinese Academy of Sciences (UCAS) in 2022, where I worked with Prof. Qingming Huang.

My research focuses on Embodied AI and Autonomous Driving, with the goal of developing, optimizing, and deploying AI algorithms in real-world industrial scenarios. I am especially interested in humanoid whole-body control, loco-manipulation, and world model.

Selected Publications ^{(* equal contribution)}

First-author / co-first-author works are highlighted below. A full list — including collaborations — is at the bottom of this section.

RSS 2026 Rhythm: Learning Interactive Whole-Body Control for Dual Humanoids

Hongjin Chen^*, Wei Zhang^*, Pengfei Li^*, Shihao Ma, Ke Ma, Yujie Jin, Zijun Xu, Xiaohui Wang, Yupeng Zheng, Zining Wang, Jieru Zhao, Yilun Chen, Wenchao Ding.

First unified framework for real-world dual-humanoid whole-body interaction — interaction-aware retargeting + interaction-guided RL — deployed on Unitree G1 (greeting, hugging, dancing).

Paper Project

Human and algorithmic visual attention teaser

npj Artificial Intelligence 2026 Human and Algorithmic Visual Attention in Driving Tasks

Chen Zheng^*, Pengfei Li^*, Bu Jin^*, Shanhe You, Ka I Chan, Ya-Qin Zhang, Guyue Zhou, Jiangtao Gong.

Decomposes human driving attention into spatial / feature-based / mixed phases and shows that injecting human semantic attention closes both the "reasoning" and "grounding" gaps of detection, planning, and VLM models.

Paper

ICRA 2025 Dual-AEB: Synergizing Rule-Based and Multimodal Large Language Models for Effective Emergency Braking

Wei Zhang^*, Pengfei Li^*, Junli Wang, Bingchuan Sun, Qihao Jin, Guangjun Bao, Shibo Rui, Yang Yu, Wenchao Ding, Peng Li, Yilun Chen.

First MLLM-augmented AEB system — combines fast rule-based reaction with rich open-scenario reasoning from a multimodal LLM.

Paper Code

AAAI 2025 LiON: Learning Point-wise Abstaining Penalty for Point Cloud Anomaly Detection

Shaocong Xu^*, Pengfei Li^*, Xinyu Liu, Qianpu Sun, Yang Li, Shihui Guo, Zhen Wang, Bo Jiang, Rui Wang, Kehua Sheng, Bo Zhang, Hao Zhao.

Reframes LiDAR outlier detection as selective classification with a learned point-wise abstaining penalty and synthetic-outlier curriculum — SOTA on SemanticKITTI and nuScenes.

Paper Code

ICRA 2023 LODE: Locally Conditioned Eikonal Implicit Scene Completion from Sparse LiDAR

Pengfei Li, Ruowen Zhao, Yongliang Shi, Hao Zhao, Jirui Yuan, Guyue Zhou, Ya-Qin Zhang.

An eikonal-constrained implicit representation that turns sparse outdoor LiDAR into dense semantic 3D scenes — the first locally conditioned eikonal completion for autonomous driving.

Paper Code

NeurIPS 2022 TOIST: Task Oriented Instance Segmentation Transformer with Noun-Pronoun Distillation

Pengfei Li, Beiwen Tian, Yongliang Shi, Xiaoxue Chen, Hao Zhao, Guyue Zhou, Ya-Qin Zhang.

Formulates task-oriented detection as preferred-object segmentation, and introduces noun-to-pronoun distillation so a transformer can act on verbs like "sit on" without explicit object naming.

Paper Code

More publications

ICLR 2025 Semi-Supervised Vision-Centric 3D Occupancy World Model for Autonomous Driving. Xiang Li, Pengfei Li, Yupeng Zheng, Wei Sun, Yan Wang, Yilun Chen.
Preprint 2025 LiloDriver: A Lifelong Learning Framework for Closed-loop Motion Planning in Long-tail Autonomous Driving Scenarios. Huaiyuan Yao^*, Pengfei Li^*, Bu Jin, Yupeng Zheng, An Liu, Lisen Mu, Qing Su, Qian Zhang, Yilun Chen, Peng Li.
ICCV 2025 World4Drive: End-to-End Autonomous Driving via Intention-aware Physical Latent World Model. Yupeng Zheng, Pengxuan Yang, Zebin Xing, Qichao Zhang, Yuhang Zheng, Yinfeng Gao, Pengfei Li, Teng Zhang, Zhongpu Xia, Peng Jia, Dongbin Zhao.
CVPR 2025 MMTL-UniAD: A Unified Framework for Multimodal and Multi-Task Learning in Assistive Driving Perception. Wenzhuo Liu, Wenshuo Wang, Yicheng Qiao, Qiannan Guo, Jiayin Zhu, Pengfei Li, Zilong Chen, Huiming Yang, Zhiwei Li, Lening Wang, Tiao Tan, Huaping Liu.
IROS 2025 Bench4Merge: A Comprehensive Benchmark for Merging in Realistic Dense Traffic with Micro-Interactive Vehicles. Zhengming Wang, Junli Wang, Pengfei Li, Zhaohan Li, Chunyang Liu, Bo Zhang, Peng Li, Yilun Chen.
IEEE RA-L Enhancing Indoor Occupancy Prediction via Sparse Query-Based Multi-Level Consistent Knowledge Distillation. Xiang Li, Yupeng Zheng, Pengfei Li, Yilun Chen, Ya-Qin Zhang, Wenchao Ding.
IEEE RA-L P-MapNet: Far-seeing Map Generator Enhanced by both SDMap and HDMap Priors. Zhou Jiang, Zhenxin Zhu, Pengfei Li, Huan-ang Gao, Tianyuan Yuan, Yongliang Shi, Hang Zhao, Hao Zhao.
IEEE RA-L GaussianGrasper: 3D Language Gaussian Splatting for Open-vocabulary Robotic Grasping. Yuhang Zheng, Xiangyu Chen, Yupeng Zheng, Songen Gu, Runyi Yang, Bu Jin, Pengfei Li, Chengliang Zhong, Zengmao Wang, Lina Liu, Chao Yang, Dawei Wang, Zhen Chen, Xiaoxiao Long, Meiqing Wang.
Preprint Afford-X: Generalizable and Slim Affordance Reasoning for Task-Oriented Manipulation. Xiaomeng Zhu, Yuyang Li, Leiyao Cui, Pengfei Li, Huan-ang Gao, Yixin Zhu, Hao Zhao.
Preprint OccLLaMA: A Unified Occupancy-Language-Action World Model for Autonomous Driving. Julong Wei, Shanshuai Yuan, Pengfei Li, Xinyi Quan, Lei Tai, Jieru Zhao, Zhongxue Gan, Wenchao Ding.
Preprint Unveiling the Surprising Efficacy of Navigation Understanding in End-to-End Autonomous Driving. Zhihua Hua, Junli Wang, Pengfei Li, Qihao Jin, Bo Zhang, Kehua Sheng, Yilun Chen, Zhongxue Gan, Wenchao Ding.
Preprint PlanAgent: A Multi-modal Large Language Agent for Closed-loop Vehicle Motion Planning. Yupeng Zheng, Zebin Xing, Qichao Zhang, Bu Jin, Pengfei Li, Yuhang Zheng, Zhongpu Xia, Kun Zhan, Xianpeng Lang, Yaran Chen, Dongbin Zhao.
ECCV 2024 TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes. Bu Jin, Yupeng Zheng, Pengfei Li, Weize Li, Yuhang Zheng, Sujie Hu, Xinyu Liu, Jinwei Zhu, Zhijie Yan, Haiyang Sun, Kun Zhan, Peng Jia, Xiaoxiao Long, Yilun Chen, Hao Zhao.
ICRA 2024 MonoOcc: Digging into Monocular Semantic Occupancy Prediction. Yupeng Zheng, Xiang Li, Pengfei Li, Yuhang Zheng, Bu Jin, Chengliang Zhong, Xiaoxiao Long, Hao Zhao, Qichao Zhang.
AAAI 2024 ModWaveMLP: MLP-based Mode Decomposition and Wavelet Denoising for Traffic Forecasting. Ke Sun, Pei Liu, Pengfei Li, Zhifang Liao.
KBS City-scale Continual Neural Semantic Mapping with Three-layer Sampling and Panoptic Representation. Yongliang Shi, Runyi Yang, Zirui Wu, Pengfei Li, Caiyun Liu, Hao Zhao, Guyue Zhou.
ICCV 2023 INT2: Interactive Trajectory Prediction at Intersections. Zhijie Yan, Pengfei Li, Zheng Fu, Shaocong Xu, Yongliang Shi, Xiaoxue Chen, Yuhang Zheng, Yang Li, Tianyu Liu, Chuxuan Li, Nairui Luo, Xu Gao, Yilun Chen, Zuoxu Wang, Yifeng Shi, Pengfei Huang, Zhengxiao Han, Jirui Yuan, Jiangtao Gong, Guyue Zhou, Hang Zhao, Hao Zhao.
ICCV 2023 3D Implicit Transporter for Temporally Consistent Keypoint Discovery. Chengliang Zhong, Yuhang Zheng, Yupeng Zheng, Hao Zhao, Li Yi, Xiaodong Mu, Ling Wang, Pengfei Li, Guyue Zhou, Chao Yang, Xinliang Zhang, Jian Zhao.
ICCV 2023 DQS3D: Densely-matched Quantization-aware Semi-supervised 3D Detection. Huan-ang Gao, Beiwen Tian, Pengfei Li, Hao Zhao, Guyue Zhou.
ICRA 2023 ADAPT: Action-aware Driving Caption Transformer. Bu Jin, Xinyu Liu, Yupeng Zheng, Pengfei Li, Hao Zhao, Tong Zhang, Yuhang Zheng, Guyue Zhou, Jingjing Liu.
ICRA 2023 STEPS: Joint Self-supervised Nighttime Image Enhancement and Depth Estimation. Yupeng Zheng, Chengliang Zhong, Pengfei Li, Huan-ang Gao, Yuhang Zheng, Bu Jin, Ling Wang, Hao Zhao, Guyue Zhou, Qichao Zhang, Dongbin Zhao.
ICRA 2023 From Semi-supervised to Omni-supervised Room Layout Estimation Using Point Clouds. Huan-ang Gao, Beiwen Tian, Pengfei Li, Xiaoxue Chen, Hao Zhao, Guyue Zhou, Yurong Chen, Hongbin Zha.
ICRA 2023 LATITUDE: Robotic Global Localization with Truncated Dynamic Low-pass Filter in City-scale NeRF. Zhenxin Zhu, Yuantao Chen, Zirui Wu, Chao Hou, Yongliang Shi, Chuxuan Li, Pengfei Li, Hao Zhao, Guyue Zhou.
ICRA 2023 Unsupervised Road Anomaly Detection with Language Anchors. Beiwen Tian, Mingdao Liu, Huan-ang Gao, Pengfei Li, Hao Zhao, Guyue Zhou.
CICAI 2023 M2Sim: A Long-Term Interactive Driving Simulator. Zhengxiao Han, Zhijie Yan, Yang Li, Pengfei Li, Yifeng Shi, Nairui Luo, Xu Gao, Yongliang Shi, Pengfei Huang, Jiangtao Gong, Guyue Zhou, Yilun Chen, Hang Zhao, Hao Zhao.
CICAI 2023 Long-Term Interactive Driving Simulation: MPC to the Rescue. Zhengxiao Han, Zhijie Yan, Yang Li, Pengfei Li, Yifeng Shi, Nairui Luo, Xu Gao, Yongliang Shi, Pengfei Huang, Jiangtao Gong, Guyue Zhou, Yilun Chen, Hang Zhao, Hao Zhao.

→ See full list on Google Scholar

Awards & Honors

20231st Place — ICRA 2023 PUB.R Competition (Preparation and Dish-Up of an English Breakfast with Robots).
2021National Scholarship (Undergraduate, Top 1%).
2020National Scholarship (Undergraduate, Top 1%).

Education

2022 – PresentPh.D. Student, Institute for AI Industry Research (AIR), Tsinghua University.
2018 – 2022B.S., School of Computer Science and Technology, University of Chinese Academy of Sciences.
- GPA 3.94 / 4.00, Rank 1 / 104.

About

Selected Publications (* equal contribution)

Awards & Honors

Education

Selected Publications ^{(* equal contribution)}