学校首页
计算机学院音频团队获DCASE 2024挑战赛冠军及评委奖
作者
范世通
来源
计算机学院
点击数
更新时间
2024-11-18

分享

近日,在东京举办的第九届声学场景和事件检测与分类会议上,计算机学院关键副教授带领的智能信号处理组荣获评委奖,以表彰参赛团队在2024年声学场景和事件检测与分类挑战赛(Challenge on Detection and Classification of Acoustic Scenes and Events,简称DCASE)任务10基于声学的交通监测赛道的创新性解决方案。

基于声学的交通监测任务是设计一种解决方案,利用声学阵列传感器采集声音信号来计算车辆数量、区分车辆类型(如小汽车或商用车辆),并记录其行驶方向(左转或右转)。参赛团队成员由计算机学院关键副教授、研究生范世通、肖飞扬,和英国萨里大学视觉语音信号处理中心王文武教授、澳大利亚悉尼科技大学声学实验室朱乔茜博士等组成。该团队针对声音数据稀缺、车辆声音事件难以有效捕获的难点,提出音频预训练模型结合图注意力机制的细粒度音频表示方案。通过模型预训练增强音频特征表示能力,并利用图注意力建立音频上下文联系,捕获重要声音事件,由此大幅提升交通监测性能,获得该挑战任务冠军,并被授予评委奖。

评委奖由全球范围内声音识别领域专家进行评选,并在每年的DCASE会议期间进行颁发,授予本年度DCASE挑战中表现出色、最具创新性的理论和方法。DCASE挑战由IEEE音频与声学信号处理协会发起,是声音识别领域国际上最权威的竞赛,旨在鼓励开发用于解决现实世界声音感知挑战的解决方案,至今已经连续举办10届。历届赛事均吸引了全球范围内高校和企业的顶尖声学团队参与,包括卡内基梅隆大学、麻省理工学院、ETH、南洋理工大学、俄罗斯ITMO、和清华、上交等国内外学府,以及Google、三星、博世、NTT、三菱、日立、科大讯飞、小米和华为等众多领先企业。

关键副教授所带领的哈尔滨工程大学智能信号处理组已经连续三年参加 DCASE 挑战,并在所参加的多个任务中均取得优异成绩。此次大赛中,团队还在挑战任务9基于语言查询的声源分离赛道中获得亚军。

编辑:刘涛  审核:刘涛
视觉
新闻最新 更多>