近日,第20届国际计算机视觉大会(IEEE/CVF International Conference on Computer Vision, ICCV 2025)发布录用通知,计算机学院2022级本科生范聪毅以第一作者身份的研究成果“Align Your Rhythm: Generating Highly Aligned Dance Poses with Gating-Enhanced Rhythm-Aware Feature Representation”被大会录用,论文通讯作者关键副教授。
ICCV是计算机视觉领域最具影响力的三大顶级国际会议之一,也是中国计算机学会(CCF)推荐人工智能领域A类国际会议。ICCV每两年召开一次,本次会议将于美国夏威夷举办,共有11239份有效投稿,录用2698篇,录取率为24%。

图1节奏与姿态对齐的音乐驱动舞蹈生成方法
在虚拟现实与影视制作等领域,自动生成自然、多样且具有节奏感的音乐驱动人类舞蹈动作具有重要意义。然而,实现与音乐自然契合的舞蹈生成仍面临诸多挑战,现有方法普遍存在节拍对齐不足和动作动态不自然等问题。该研究提出了一种新颖的舞蹈生成框架 Danceba,引入门控机制以增强节奏感知特征表示,从而实现高节奏对齐性与节奏敏感性增强的舞蹈姿态生成。具体而言,提出基于相位的节奏提取(Phase-Based Rhythm Extraction, PRE)方法,从音乐相位数据中精确提取节奏信息,充分利用音乐的内在周期性与时间结构。此外,还提出了时序门控因果注意机制(Temporal-Gated Causal Attention, TGCA),用于关注全局节奏特征,确保舞蹈动作紧密跟随音乐节奏。与此同时,设计了并行Mamba动作建模架构(Parallel Mamba Motion Modeling, PMMM),分别建模上半身与下半身动作及其音乐特征,从而提升生成舞蹈动作的自然性与多样性。大量实验结果表明,所提出方法Danceba在节奏对齐与动作多样性方面显著优于当前主流方法。

多种类型音乐上的舞蹈生成示例
近年来,计算机学院倡导需求牵引与兴趣驱动相结合的科研育人理念,鼓励探索前沿技术与应用研究,不断探索人才培养新模式,学院本科生连续在国际顶级会议和领域国际权威竞赛取得佳绩。