Conference Paper----Visual Information Processing and Learning (VIPL)

Feixiang Wang, Shuang Yang, Shiguang Shan, Xilin Chen. CogCM: Cognition-Inspired Contextual Modeling for Audio-Visual Speech Enhancement. IEEE/CVF International Conference on Computer Vision (ICCV), Honolulu, HI, USA, Oct. 19-23, 2025. PDF

Yufei Cai, Hu Han, Yuxiang Wei, Shiguang Shan, Xilin Chen. EfficientMT: Efficient Temporal Adaptation for Motion Transfer in Text-to-Video Diffusion Models. IEEE/CVF International Conference on Computer Vision (ICCV), Honolulu, HI, USA, Oct. 19-23, 2025. PDF

Zongyao Xue, Meina Kan, Shiguang Shan, Xilin Chen. Feature Decomposition-Recomposition in Large Vision-Language Model for Few-Shot Class-Incremental Learning. IEEE/CVF International Conference on Computer Vision (ICCV), Honolulu, HI, USA, Oct. 19-23, 2025. PDF

Sixian Zhang, Xinyao Yu, Xinhang Song, Yiyao Wang, Shuqiang Jiang. Function-centric Bayesian Network for Zero-Shot Object Goal Navigation. IEEE/CVF International Conference on Computer Vision (ICCV), Honolulu, HI, USA, Oct. 19-23, 2025. PDF

Mengdi Liu, Zhangyang Gao, Hong Chang, Ziqing Li, Shiguang Shan, Xilin Chen. G2PDiffusion: Cross-species Genotype-to-Phenotype Prediction via Evolutionary Diffusion. IEEE/CVF International Conference on Computer Vision (ICCV), Honolulu, HI, USA, Oct. 19-23, 2025. PDF

Jiahe Zhao, Ruibing Hou, Zejie Tian, Hong Chang, Shiguang Shan. HIS-GPT: Towards 3D Human-In-Scene Multimodal Understanding. IEEE/CVF International Conference on Computer Vision (ICCV), Honolulu, HI, USA, Oct. 19-23, 2025. PDF

Xiaorong Qin, Xinhang Song, Sixian Zhang, Xinyao Yu, Xinmiao Zhang, Shuqiang Jiang. Learning on the Go: A Meta-learning Object Navigation Model. IEEE/CVF International Conference on Computer Vision (ICCV), Honolulu, HI, USA, Oct. 19-23, 2025. PDF

Zhuo Li, Mingshuang Luo, Ruibing Hou, Xin Zhao, Hao Liu, Hong Chang, Zimo Liu, Chen Li. Morph: A Motion-free Physics Optimization Framework for Human Motion Generation. IEEE/CVF International Conference on Computer Vision (ICCV), Honolulu, HI, USA, Oct. 19-23, 2025. PDF

Zhaoxin Yuan, Shuang Yang, Shiguang Shan, Xilin Chen. Not Only Vision: Evolve Visual Speech Recognition via Peripheral Information. IEEE/CVF International Conference on Computer Vision (ICCV), Honolulu, HI, USA, Oct. 19-23, 2025. PDF

Mingquan Zhou, Chen He, Ruiping Wang, Xilin Chen. OV3D-CG: Open-vocabulary 3D Instance Segmentation with Contextual Guidance. IEEE/CVF International Conference on Computer Vision (ICCV), Honolulu, HI, USA, Oct. 19-23, 2025. PDF

Yuyi Liu, Xinhang Song, Tianliang Qi, Shuqiang Jiang. Trial-Oriented Visual Rearrangement. IEEE/CVF International Conference on Computer Vision (ICCV), Honolulu, HI, USA, Oct. 19-23, 2025. PDF

Fanglue Zhang, Shufan Shen, Chao Bi, Li Su, Qingming Huang, Shuhui Wang. SVDLoRA: Data-Driven Low-Rank Adaptation via Spectral Decomposition. IEEE International Conference on Data Mining Workshops (ICDMW), Washington, DC, USA, Dec. 12-15, 2025. PDF

Yifeng Xu, Zhenliang He, Shiguang Shan, Xilin Chen. CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation. International Conference on Learning Representations (ICLR), pp. 5844-5866, Singapore, Singapore, Apr. 24-28, 2025. PDF

Yifei Xing, Xiangyuan Lan, Ruiping Wang, Dongmei Jiang, Wenjun Huang, Zheng Qingfang, Yaowei Wang. EMMA: Empowering Multi-modal Mamba with Structural and Hierarchical Alignment. 13th International Conference on Learning Representations (ICLR), pp. 33369-33397, Singapore, Singapore, Apr. 24-28, 2025. PDF

Shufan Shen, Zhaobo Qi, Junshu Sun, Qingming Huang, Qi Tian, Shuhui Wang. Enhancing Pre-trained Representation Classifiability can Boost its Interpretability. The Thirteenth International Conference on Learning Representations (ICLR), pp. 38903-38927, Singapore, Singapore, Apr. 24-28, 2025. PDF

Yue Wu, Zhaobo Qi, Yiling Wu, Junshu Sun, Yaowei Wang, Shuhui Wang. Learning fine-grained representations through textual token disentanglement in composed video retrieval. The Thirteenth International Conference on Learning Representations (ICLR), pp. 91981-92003, Singapore, Singapore, Apr. 24-28, 2025. PDF

Wen Wang, Ruibing Hou, Hong Chang, Shiguang Shan, Xilin Chen. MATS: An Audio Language Model under Text-only Supervision. International Conference on Machine Learning (ICML), Vancouver, BC, Canada, Jul. 13-19, 2025. PDF

Cong Hua, Qianqian Xu, Zhiyong Yang, Zitai Wang, Shilong Bao, Qingming Huang. OpenworldAUC: Towards Unified Evaluation and Optimization for Open-world Prompt Tuning. International Conference on Machine Learning (ICML), Vancouver, BC, Canada, Jul. 13-19, 2025. PDF

Senwei Xie, Hongyu Wang, Zhanqi Xiao, Ruiping Wang, Xilin Chen. Robotic Programmer: Video Instructed Policy Code Generation for Robotic Manipulation. IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), pp. 14923-14930, Hangzhou, China, Oct. 19-25, 2025. PDF

Hao Liang, Meina Kan, Shiguang Shan, Xilin Chen. Task-Oriented Token Pruning for Efficient Object Detection and Segmentation. IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), pp. 7826-7833, Hangzhou, China, Oct. 19-25, 2025. PDF