噪声数据库

梅逊雪

1531人浏览 · 2024-01-10 16:04:27

梅逊雪 · 2024-01-10 16:04:27 发布

语音降噪用到的场景噪声：Audio research group - Tampere University - TUT Acoustic scenes 2017 released
https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/YDEPUT

TUT 原声场景 2017 发布

发布日期：2017 年 11 月 13 日

我们的研究小组发布了用于声学场景分类研究的开放数据集，TUT Acoustic Scenes 2017。该数据集由来自各种声学场景的录音组成，所有这些场景都有不同的录音位置。对于每个录音位置，都会捕获 3-5 分钟长的录音。然后将原始录音分成长度为 10 秒的片段。数据集分为开发数据集和评估数据集两部分发布，可以从Zenodo下载。

该数据集于 06/2015 至 01/2017 期间在芬兰收集，该集合已获得欧洲研究理事会的资助。

数据集中的声学场景 (15)：

巴士 - 在城市内乘坐巴士（车辆）
咖啡厅/餐厅 - 小咖啡厅/餐厅（室内）
汽车 - 在城市中作为乘客驾驶或旅行（车辆）
市中心（室外）
林间小路（室外）
杂货店 - 中型杂货店（室内）
家庭（室内）
湖滨沙滩（室外）
图书馆（室内）
地铁站（室内）
办公室 - 多人，典型工作日（室内）
住宅区（室外）
火车（旅行、车辆）
有轨电车（旅行、车辆）
城市公园（室外）

记录和注释程序

对于所有声学场景，录音都是在不同的地点捕获的：不同的街道、不同的公园、不同的家庭。使用 Soundman OKM II Klassik/studio A3、驻极体双耳麦克风和 Roland Edirol R-09 录音机进行录音，采用 44.1 kHz 采样率和 24 位分辨率。麦克风经过专门设计，看起来像耳机，戴在耳朵上。因此，录制的音频与到达佩戴设备的人的人类听觉系统的声音非常相似。

记录数据的后处理涉及与记录个人隐私相关的方面。对于在私人场所录制的音频材料，必须获得所有相关人员的书面同意。在公共场所录制的材料不需要此类同意，但会进行内容筛选，并删除侵犯隐私的片段。

TAU Urban Acoustic Scenes 2020 Mobile, Development dataset

——————————————————————————————————————————

https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/YDEPUT Harvard 大学采集的纯净语音和混合之后的语音
原文不能收藏，转发，就写这里了：语音行业有什么好用的开源噪声库吗？
Audio research group - Tampere University - Datasets 这里面很多，下载比较麻烦点，需要找需要的
http://www.cs.tut.fi/sgn/arg/dcase2017/challenge/task-acoustic-scene-classification
. 语音和噪声相关数据集(持续更新) - 凌逆战 - 博客园：

语音数据集
 TIMIT
VCTK
AISHELL-ASR0009-OS1 开源中文语音数据库
 Mozilla Common Voice
Tatoeba
日语数据集
 气导骨导数据集
 噪声数据集
 noise-92
NOIZEUS数据集
 DEMAND
PNL 100 Nonspeech Sounds
rnnoise_ontributions
COUGHVID 众包数据集
 ESC-50：环境声音分类数据集
 ESC环境噪音分类数据集
 DESED dataset
DISCO
婴儿啼哭数据集
 风噪数据集
 YouTube--ASMR noise
FSD50K
MS-SNSD
QUT-NOISE
freesound-datasets
STARSS22：Sony-TAu Realistic Spatial Soundscapes 2022
VOICe Dataset
In-Vehicle Noise Dataset
Vehicle Interior Sound Dataset
MAVD交通数据集
 Dataset-AOB：城市声音事件分类
 CHiME-Home
UrbanSound
UrbanSound8K
SONYC Urban Sound Tagging
Isolated urban sound database
Acoustic Event Dataset
BBC音效
 NAR 数据集
 asr-noises
音乐数据集
 DCASE
综合数据集
 MUSAN
FSDnoisy18k
DS_10283_2791
CSTR NAM TIMIT Plus
参考

6. 希尔贝壳-专注于人工智能大数据和技术的创新

语音行业有什么好用的开源噪声库吗？

像是asr asv等等领域，我们经常要用噪声来做数据增强提升模型鲁棒性，那么有什么好用的开源噪声库吗？

我最喜欢用的就是openslr里面录制的混响和加性噪声~
混响的：http://www.openslr.org/resources/28/rirs_noises.zip
这个混响包含了real和simulated，用的比较多是simulated中的小房间中房间，对应房间大小分别是1~10m和10~30m
加性的：http://www.openslr.org/resources/17/musan.tar.gz
这个加性包含人声babble，音乐背景声和真实噪声。这两个噪声库强烈推荐Mark上~
另外就是用sox改改音速和音量，这些dither也可以纳入考虑
发布于 2019-03-25 12:29
赞同 3715 条评论分享
收藏喜欢

传统的开源噪声库有：
NOISEX-92
DEMAND
CHIME CHELLENGE里的噪声源
以上都是专门针对噪声鲁棒性训练和评价设计的噪声库。缺点是都比较小。

还有其他两个option:
~ 可以试试训练声音事件分类器用的数据集，比如AudioSet，数据很大。
~ 或者花钱买电影音效库，比如bbc什么的。数据很多，质量高。就是不便宜。
————————————————————

我用的不算专用的噪音库，是一个声学场景分类的噪音，场景比较多，但是不是非常符合噪音这个范畴，可以用来做aec。
TUT dataset：
Acoustic scenes for the task (15):