Shuhui Wang----Visual Information Processing and Learning (VIPL)

Location：

Shuhui Wang

Shuhui Wang Professor

Email： wangshuhui@ict.ac.cn and shuhui.wang@vipl.ict.ac.cn

Research area： Multimedia analysis、Computer vision、Machine Learning、Data Mining

Shuhui Wang received the B.S. degree in electronic engineering from Tsinghua University, Beijing, China, in 2006, and the Ph.D. degree from the Institute of Computing Technology, Chinese Academy of Sciences, Beijing, China, in 2012. He is currently a full Professor with the Institute of Computing Technology, Chinese Academy of Sciences. He is also with the Key Laboratory of Intelligent Information Processing, Chinese Academy of Sciences. His research interests include semantic image analysis, image and video retrieval and large-scale Web multimedia data mining. Dr. Wang has published over 100 papers on prestigious journals and conferences including IEEE-TPAMI, IEEE-TIP, IEEE-TMM, IEEE-TKDE, IEEE-TCSVT, ACM-TKDD, ACM-TIST, and NeurIPS, ACMMM, CVPR, ICCV, ECCV, SIGMOD, VLDB, ICDM, CIKM.

Experience

Educational experience

2006.9 ～ 2012.7 Institute of Computing Technology Computer Science PHD

2002.9 ～ 2006.7 Tsinghua University Electronic Engineering Bachelor in Eng.

Academic service

Conference services

[1] Publication Chair, ACM International Conference on Internet Multimedia Computing and Service (ICIMCS'15), 17th-21th, Aug, 2015, Zhangjiajie, Hunan.

[2] PC Co-Chair, 1st International Workshop on Mobility Analytics for Spatio-temporal and Social Data (MATES)，VLDB'17， Sept. 1, 2017.

Research content

1. Multimodal reasoning and interaction

Focus on cross-modal representation learning, visual-linguistic retrieval, and interactive multimodal QA.

2. Vision and Multimedia Understanding

Focus on visual learning on large number of categories, domain adaptation and multimodal semantic analytics.

3. Heterogeneous multimedia big data analytics

Focus on recommendation systems, learning with noisy Web data and community discovery based on content and social context.

4. Multimodal perception

Focus on knowledge/memory/language guided multimodal perception and representation, and human-like multimodal active perception.

Research project

1. Research on object modeling and Cross-domain anlysis in heterogeneous big data

Project type: NSFC Project

Project time: 2017.01-2020.12

Project leader: Shuhui Wang

Invited Talks and Papers

Book

1. Siyuan Liu , Shuhui Wang, Qiang Qu. Trajectory Mining. Book chapter of Encyclopedia of GIS, Springer, ISBN: 978-3-319-23519-6 (Online), 2017.

Papers

Major publication in chronical order (see DBLP for full list)：

1. Shuhao Cui, Xuan Jin, Shuhui Wang, Yuan He, Qingming Huang. Heuristic Domain Adaptation. NeurIPS, 2020.

2. Zhaobo Qi, Shuhui Wang, Chi Su, Li Su, Qingming Huang, Qi Tian. Towards More Explainability: Concept Knowledge Mining Network for Event Recognition. ACM Multimedia, 2020.

3. Zhaobo Qi, Shuhui Wang, Chi Su, Li Su, Weigang Zhang, Qingming Huang. Modeling Temporal Concept Receptive Field Dynamically for Untrimmed Video Analysis. ACM Multimedia, 2020.

4. Xiaodan Li, Yining Lang, Yuefeng Chen, Xiaofeng Mao, Yuan He, Shuhui Wang, Hui Xue, Quan Lu. Sharp Multiple Instance Learning for DeepFake Video Detection. ACM Multimedia, 2020.

5. Xinzhe Han, Shuhui Wang, Chi Su, Weigang Zhang, Qingming Huang, Qi Tian. Interpretable Visual Reasoning via Probabilistic Formulation under Natural Supervision. ECCV, 2020.

6. Shuhui Wang, Ling Hu, Liang Li, Weigang Zhang, Qingming Huang. Two-Stream Deep Sparse Network for Accurate and Efficient Image Restoration. Computer Vision and Image Understanding (CVIU), 200: 103029, 2020.

7. Guoli Song, Shuhui Wang, Qingming Huang, Qi Tian. Learning Feature Representation and Partial Correlation for Multimodal Multi-Labeled Data. IEEE Transactions on Multimedia (TMM), accepted.

8. Dan Guo, Hui Wang, Shuhui Wang, Meng Wang. Textual-Visual Reference-aware Attention Network for Visual Dialog. IEEE Transactions on Image Processing (TIP), vol. 29, pp. 6655-6666, 2020.

9. Yiling Wu, Shuhui Wang, Guoli Song, Qingming Huang. Augmented Adversarial Training for Cross-modal Retrieval. IEEE Transactions on Multimedia (TMM), accepted.Code

10. Shijie Yang, Liang Li, Shuhui Wang, Weigang Zhang, Qingming Huang, Qi Tian. A Structured Latent Variable Recurrent Network with Stochastic Attention for Generating Weibo Comments. IJCAI, 2020.

11. Shuhao Cui, Shuhui Wang, Junbao Zhuo, Chi Su, Qingming Huang, Qi Tian. Gradually Vanishing Bridge for Adversarial Domain Adaptation. CVPR, 2020. Code

12. Shuhao Cui, Shuhui Wang, Junbao Zhuo, Liang Li, Qingming Huang, Qi Tian. Towards Discriminability and Diversity: Batch Nuclear-norm Maximization under Label Insufficient Situations. CVPR, 2020. (Oral) Code

13. Beichen Zhang, Liang Li, Shijie Yang, Shuhui Wang, Zheng-Jun Zha, Qingming Huang. State-relabling adversarial active learning. CVPR, 2020. (Oral)

14. Jun Wei, Shuhui Wang, Zhe Wu, Chi Su, Qingming Huang, Qi Tian. Label Decoupling Framework for Salient Object Detection. CVPR, 2020.

15. Dechao Meng, Liang Li, Xuejing Liu, Yadong Li, Shijie Yang, Zhengjun Zha, Xinyu Gao, Shuhui Wang, Qingming Huang. Parsing-based View-aware Embedding Network for Vehicle Re-Identification. CVPR, 2020.

16. Jun Wei, Shuhui Wang, Qingming Huang. F3Net: Fusion, Feedback and Focus for Salient Object Detection. AAAI, 2020. (Oral) Code

17. Yiling Wu, Shuhui Wang, Qingming Huang. Online Fast Adaptive Low-rank Similarity Learning for Cross-Modal Retrieval. IEEE Transactions on Multimedia (TMM), 22(5): 1310-1322, 2020.

18. Guoli Song, Shuhui Wang, Qingming Huang, Qi Tian. Harmonized Multimodal Learning with Gaussian Process Latent Variable Models. IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), accepted. Paper

19. Xuejing Liu, Liang Li, Shuhui Wang, Zheng-Jun Zha, Dechao Meng, Qingming Huang. Adaptive Reconstruction Network for Weakly Supervised Referring Expression Grounding. ICCV, 2019. Code

20. Yiling Wu, Shuhui Wang, Guoli Song, Qingming Huang. Learning Fragment Self-Attention Embeddings for Image-Text Matching. ACM Multimedia, pp. 2088-2096, 2019. (oral) Code

21. Xuejing Liu, Liang Li, Shuhui Wang, Zhengjun Zha, Li Su, Qingming Huang. Knowledge-guided Pairwise Reconstruction Network for Weakly Supervised Referring Expression Grounding. ACM Multimedia, pp. 539-547, 2019. (oral)

22. Shijie Yang, Liang Li, Shuhui Wang, Dechao Meng, Qingming Huang and Qi Tian. Structured Stochastic Recurrent Network for Linguistic Video Prediction. ACM Multimedia, pp. 21-29, 2019. (oral)

23. Shuhui Wang, Liang Li, Chenxue Yang, Qingming Huang. Regularized Topic-aware Latent Influence Propagation in Dynamic Relational Networks. GeoInformatica, 23(3): 329-352, 2019. Paper

24. Liang Li, Xinge Zhu, Yiming Hao, Shuhui Wang, Xingyu Gao, Qingming Huang. A Hierarchical CNN-RNN Approach for Visual Emotion Classification. ACM Trans. Multimedia Comput. Commun. Appl. (TOMM), 2019, 15(3s): 1-17.

25. Shijie Yang, Liang Li, Shuhui Wang, Weigang Zhang, Qingming Huang, Qi Tian. SkeletonNet: A Hybrid Network with a Skeleton-Embedding Process for Multi-view Image Representation Learning. IEEE Transactions on Multimedia, 21(11): pp. 2916-2929, 2019.

26. Yiling Wu, Shuhui Wang, Guoli Song, Qingming Huang. Online Asymmetric Metric Learning with Multi-Layer Similarity Aggregation for Cross-Modal Retrieval. IEEE Transaction on Image Processing, vol. 28, no. 9, pp. 4299-4312, 2019. Code

27. Junbao Zhuo, Shuhui Wang, Shuhao Cui, Qingming Huang. Unsupervised Open Domain Recognition by Semantic Discrepancy Minimization. In CVPR, 2019. Paper, Code

28. Zhe Xue, Guorong Li, Shuhui Wang, Weigang Zhang, Qingming Huang. Bilevel Multiview Latent Space Learning. IEEE Trans. Circuits Syst. Video Techn. 28(2): 327-341, 2018.

29. Yangyu Chen, Shuhui Wang, Weigang Zhang, Qingming Huang. Less is More: Picking Informative Frames for Video Captioning. ECCV, 2018.Code

30. Shuhui Wang, Yangyu Chen, Junbao Zhuo, Qingming Huang, Qi Tian. Joint Global and Co-Attentive Representation Learning for Image-Sentence Retrieval. ACM Multimedia, 2018. (Oral)

31. Yiling Wu, Shuhui Wang, Qingming Huang. Learning Semantic Structure-preserved Embeddings for Cross-modal Retrieval. ACM Multimedia, 2018.

32. Liang Li, Shuhui Wang, Shuqiang Jiang, Qingming Huang. Attentive Recurrent Neural Network for Weak-supervised Multi-label Image Classification. ACM Multimedia, 2018.

33. Guoli Song, Shuhui Wang , Qingming Huang, Qi Tian: Multimodal Similarity Gaussian Process Latent Variable Model. IEEE Trans. Image Processing 26(9): 4168-4181 (2017). Code

34. Jiaming Zhang, Shuhui Wang, Qingming Huang: Location-Based Parallel Tag Completion for Geo-Tagged Social Image Retrieval. ACM TIST 8(3): 38:1-38:21 (2017).

35. Siyuan Liu, Shuhui Wang: Trajectory Community Discovery and Recommendation by Multi-Source Diffusion Modeling. IEEE Trans. Knowl. Data Eng. 29(4): 898-911 (2017).

36. Yiling Wu, Shuhui Wang, Qingming Huang: Online Asymmetric Similarity Learning for Cross-Modal Retrieval. CVPR 2017: 3984-3993.

37. Shijie Yang, Liang Li, Shuhui Wang, Weigang Zhang, Qingming Huang: A Graph Regularized Deep Neural Network for Unsupervised Image Representation Learning. CVPR 2017: 7053-7061.

38. Guoli Song, Shuhui Wang, Qingming Huang, Qi Tian: Multimodal Gaussian Process Latent Variable Models with Harmonization. ICCV 2017: 5039-5047. Code

39. Junbao Zhuo, Shuhui Wang, Weigang Zhang, Qingming Huang: Deep Unsupervised Convolutional Domain Adaptation. ACM Multimedia 2017: 261-269.

40. Weiqing Min, Shuqiang Jiang, Shuhui Wang, Jitao Sang, Shuhuan Mei: A Delicious Recipe Analysis Framework for Exploring Multi-Modal Recipes with Various Attributes. ACM Multimedia 2017: 402-410.

41. Lingyang Chu, Yanyan Zhang, Guorong Li, Shuhui Wang, Weigang Zhang, Qingming Huang: Effective Multimodality Fusion Framework for Cross-Media Topic Detection. IEEE Trans. Circuits Syst. Video Techn. 26(3): 556-569 (6016).

42. Yan Hua, Shuhui Wang, Siyuan Liu, Anni Cai, Qingming Huang: Cross-Modal Correlation Learning by Adaptive Hierarchical Semantic Aggregation. IEEE Trans. Multimedia 18(6): 1201-1216 (2016).

43. Lingyang Chu, Shuhui Wang, Siyuan Liu, Qingming Huang, Jian Pei: ALID: Scalable Dominant Cluster Detection. PVLDB 8(8): 826-837 (2015).

44. Li Shen, Gang Sun, Qingming Huang, Shuhui Wang, Zhouchen Lin, Enhua Wu: Multi-Level Discriminative Dictionary Learning With Application to Large Scale Image Classification. IEEE Trans. Image Processing 24(10): 3109-3123 (2015).

45. Siyuan Liu, Qiang Qu, Shuhui Wang: Rationality Analytics from Trajectories. TKDD 10(1): 10:1-10:22 (2015).

46. Siyuan Liu, Shuhui Wang, Feida Zhu: Structured Learning from Heterogeneous Behavior for Social Identity Linkage. IEEE Trans. Knowl. Data Eng. 27(7): 2005-2019 (2015).

47. Guoli Song, Shuhui Wang, Qingming Huang, Qi Tian: Similarity Gaussian Process Latent Variable Model for Multi-modal Data Analysis. ICCV 2015: 4050-4058.

48. Yan Hua, Shuhui Wang, Siyuan Liu, Qingming Huang, Anni Cai: TINA: Cross-Modal Correlation Learning by Adaptive Hierarchical Semantic Aggregation. ICDM 2014: 190-199.

49. Siyuan Liu, Shuhui Wang, Feida Zhu, Jinbo Zhang, Ramayya Krishnan: HYDRA: large-scale social identity linkage via heterogeneous behavior modeling. SIGMOD Conference 2014: 51-62.

50. Lingyang Chu, Shuqiang Jiang, Shuhui Wang, Yanyan Zhang, Qingming Huang: Robust Spatial Consistency Graph Model for Partial Duplicate Image Retrieval. IEEE Trans. Multimedia 15(8): 1982-1996 (2013).

51. Li Shen, Shuhui Wang, Gang Sun, Shuqiang Jiang, Qingming Huang: Multi-level Discriminative Dictionary Learning towards Hierarchical Visual Categorization. CVPR 2013: 383-390.

52. Shuhui Wang, Qingming Huang, Shuqiang Jiang, Qi Tian: S3MKL: Scalable Semi-Supervised Multiple Kernel Learning for Real-World Image Applications. IEEE Trans. Multimedia 14(4): 1259-1274 (2012).

53. Shuhui Wang, Shuqiang Jiang, Qingming Huang, Qi Tian: Multi-feature metric learning with knowledge transfer among semantics and social tagging. CVPR 2012: 2240-2247.

54. Shuhui Wang, Shuqiang Jiang, Qingming Huang, Qi Tian: S3MKL: scalable semi-supervised multiple kernel learning for image data mining. ACM Multimedia 2010: 163-172.