Jiashuo Yu

Cited by

	All	Since 2019
Citations	465	465
h-index	10	10
i10-index	10	10

260

130

195

20212022202320242 16 256 189

Public access

View all

3 articles

1 article

available

not available

Based on funding mandates

Co-authors

Yinan HeShanghai Al LaboratoryVerified email at pjlab.org.cn
Yi WangShanghai AI LaboratoryVerified email at cse.cuhk.edu.hk
Limin WangNanjing UniversityVerified email at nju.edu.cn
Kunchang LiShenzhen Institutes of Advanced Technology, Chinese Academy of SciencesVerified email at siat.ac.cn
Ying ChengFudan UniversityVerified email at fudan.edu.cn
Yaohui WangResearch Scientist, Shanghai AI Laboratory; Prev. PhD from InriaVerified email at inria.fr
Xinyuan ChenShanghai AI LaboratoryVerified email at sjtu.edu.cn
Junfu PuTencent ARC Lab; University of Science and Technology of ChinaVerified email at mail.ustc.edu.cn
Xiao SunScientist, Shanghai AI LaboratoryVerified email at pjlab.org.cn

Jiashuo Yu

Shanghai AI Laboratory

Verified email at fudan.edu.cn

Computer Vision Multimodal Learning


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
Internvideo: General video foundation models via generative and discriminative learning Y Wang, K Li, Y Li, Y He, B Huang, Z Zhao, H Zhang, J Xu, Y Liu, Z Wang, ... arXiv preprint arXiv:2212.03191, 2022	160	2022
Internchat: Solving vision-centric tasks by interacting with chatbots beyond language Z Liu, Y He, W Wang, W Wang, Y Wang, S Chen, Q Zhang, Y Yang, Q Li, ... arXiv preprint arXiv:2305.05662, 2023	53	2023
Lavie: High-quality video generation with cascaded latent diffusion models Y Wang, X Chen, X Ma, S Zhou, Z Huang, Y Wang, C Yang, Y He, J Yu, ... arXiv preprint arXiv:2309.15103, 2023	49	2023
Internvid: A large-scale video-text dataset for multimodal understanding and generation Y Wang, Y He, Y Li, K Li, J Yu, X Ma, X Li, G Chen, X Chen, Y Wang, C He, ... ICLR2024, 2023	49	2023
MM-Pyramid: Multimodal Pyramid Attentional Network for Audio-Visual Event Localization and Video Parsing J Yu, Y Cheng, RW Zhao, R Feng, Y Zhang ACM MM2022, 2021	34	2021
Internvideo-ego4d: A pack of champion solutions to ego4d challenges G Chen, S Xing, Z Chen, Y Wang, K Li, Y Li, Y Liu, J Wang, YD Zheng, ... ECCV2022 Ego4D Workshop, 2022	29	2022
Modality-Aware Contrastive Instance Learning with Self-Distillation for Weakly-Supervised Audio-Visual Violence Detection J Yu, J Liu, Y Cheng, R Feng, Y Zhang ACM MM2022, 2022	19	2022
Seine: Short-to-long video diffusion model for generative transition and prediction X Chen, Y Wang, L Zhang, S Zhuang, X Ma, J Yu, Y Wang, D Lin, Y Qiao, ... ICLR2024, 2023	18	2023
Mpn: Multimodal parallel network for audio-visual event localization J Yu, Y Cheng, R Feng ICME2021, 2021	17	2021
Vbench: Comprehensive benchmark suite for video generative models Z Huang, Y He, J Yu, F Zhang, C Si, Y Jiang, Y Zhang, T Wu, Q Jin, ... CVPR2024, 2023	11	2023
Exploring Logical Reasoning for Referring Expression Comprehension Y Cheng, R Wang, J Yu, RW Zhao, Y Zhang, R Feng ACM MM2021, 2021	8	2021
Long-Term Rhythmic Video Soundtracker J Yu, Y Wang, X Chen, X Sun, Y Qiao ICML2023, 2023	5	2023
Improving multimodal speech enhancement by incorporating self-supervised and curriculum learning Y Cheng, M He, J Yu, R Feng ICASSP2021, 2021	5	2021
Internvideo2: Scaling video foundation models for multimodal video understanding Y Wang, K Li, X Li, J Yu, Y He, G Chen, B Pei, R Zheng, J Xu, Z Wang, ... arXiv preprint arXiv:2403.15377, 2024	4	2024
Learning Music-Dance Representations through Explicit-Implicit Rhythm Synchronization J Yu, J Pu, Y Cheng, R Feng, Y Shan IEEE Transactions on Multimedia, 2023	4*	2023

The system can't perform the operation now. Try again later.

Articles 1–15

Citations per year

Duplicate citations

Merged citations

Add co-authorsCo-authors

Follow

Cited by

Co-authors