学校首页
国际第三!哈工程GISP实验室在第八届国际权威声学场景和事件检测及分类竞赛(DCASE2022)中斩获佳绩
作者
关键
来源
计算机学院
点击数
更新时间
2022-07-04

分享

近日,第八届国际权威声学场景和事件检测及分类竞赛(IEEE AASP Challenge on Detection and Classification of Acoustic Scenes and Events, DCASE2022 Challenge)公布了挑战结果。由哈尔滨工程大学计算机学院GISP课题组领衔,英国萨里大学、悉尼科技大学、哈尔滨工业大学合作的三支比赛队伍从众多队伍中脱颖而出,力压三菱、日立、谷歌等国际公司研究团队,及清华大学、以色列理工、苏黎世联邦理工等国内外顶尖高校团队,分别取得了国际第三名(Task 2)、国际第六名(Task 6A)、国际第八名(Task 6B)的成绩。

DCASE挑战赛是由伦敦玛丽女王大学(Queen Mary University of London)于2013年发起、并由坦佩雷理工大学(Tampere University of Technology),及谷歌、NTT、日立等公司持续组织的声学场景识别竞赛,目前已成为声学领域的权威竞赛,并获得学术界及工业界的广泛关注和积极参与。DCASE 2022共设置六个任务,包括低复杂度的声学场景分类(Task1)、基于域泛化技术的无监督机器异音检测(Task 2)、真实空间声音场景下声音事件定位与检测评估(Task3)、室内环境声音事件检测(Task4)、小样本生物声学事件检测(Task 5)、自动音频字幕和基于语言的音频检索(Task 6)。本次竞赛吸引了包括华为、三星、谷歌、日立、SECOM等公司研究团队,以及清华大学、北京大学、上海交通大学、西北工业大学等国内高校和以色列理工、奥地利理工、瑞士洛桑联邦理工、苏黎世联邦理工、俄罗斯人工智能研究院等众多国际顶尖高校声学团队,共计135支队伍,410个系统参赛。

基于域泛化技术的无监督机器异音检测(Task 2)任务旨在通过对目标机器声音进行检测,判断机器运行状态是否正常。该任务为基于音频智能的工业设备非侵入式故障诊断及预测性维护提供了全新视角与策略。由于实际工业场景中异常数据种类多样和难以采集,本赛道仅提供正常声音数据用于系统训练,进行无监督异常声音检测。与往届DCASE相比,本届Task 2考虑了不同数据域下的异音检测泛化表现。在本届赛事中,GISP课题组共有两支队伍参加Task 2的挑战,分别提出了基于机器属性信息分类与聚类和基于自挑战学习与马氏距离度量策略的解决方案,实现域泛化条件下的机器异音检测,并取得了68.04%(国际第三)与67.12%(国际第六)的异音检测官方评价得分。

图1 Task 2赛道排名

自动音频字幕和基于语言的音频检(Task 6)包含自动音频字幕(Task 6A)与基于语言的音频检索(Task 6B)两项子任务。Task 6A旨在通过自然语言文本描述声学场景内容,该任务有助于智能城市声学监控、内容导向的人机交互、听力障碍人士辅助等应用场景;Task 6B致力于以自然语言描述检索相匹配的音频信号,有助于推进跨模态信息检索技术的发展与应用。在本届Task 6赛事中,GISP课题组从场景音频特征的时序性出发,设计基于图神经网络的特征编码结构,对音频特征所包含的场景语意信息进行感知与处理,从而在自动音频字幕任务中取得了0.291的SPIDEr指标表现并取得第六名,在基于语言的音频检索任务取得了9.7%的mAP10指标表现,获得第八名。

图2 Task6A赛道排名

图3 Task 6B赛道排名

计算机学院一直重视科技前沿领域探索研究,努力营造浓厚学术氛围,积极推动学科专业交叉融合建设。由关键老师所组建的智能信号处理组GISP,致力于人工智能技术驱动的信号处理基础理论及应用研究。本次竞赛充分展现了计算机学院在人工智能及声学信号处理领域的研究实力,促进了国际交流合作、扩大了我校的国际影响力。

编辑:刘涛  审核:刘涛
视觉
新闻最新 更多>