噪声数据库
- 语音降噪用到的 场景噪声:Audio research group - Tampere University - TUT Acoustic scenes 2017 released
- https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/YDEPUT
TUT 原声场景 2017 发布
发布日期:2017 年 11 月 13 日
我们的研究小组发布了用于声学场景分类研究的开放数据集,TUT Acoustic Scenes 2017。该数据集由来自各种声学场景的录音组成,所有这些场景都有不同的录音位置。对于每个录音位置,都会捕获 3-5 分钟长的录音。然后将原始录音分成长度为 10 秒的片段。数据集分为开发数据集和评估数据集两部分发布,可以从Zenodo下载。
该数据集于 06/2015 至 01/2017 期间在芬兰收集,该集合已获得欧洲研究理事会的资助。
数据集中的声学场景 (15):
- 巴士 - 在城市内乘坐巴士(车辆)
- 咖啡厅/餐厅 - 小咖啡厅/餐厅(室内)
- 汽车 - 在城市中作为乘客驾驶或旅行(车辆)
- 市中心(室外)
- 林间小路(室外)
- 杂货店 - 中型杂货店(室内)
- 家庭(室内)
- 湖滨沙滩(室外)
- 图书馆(室内)
- 地铁站(室内)
- 办公室 - 多人,典型工作日(室内)
- 住宅区(室外)
- 火车(旅行、车辆)
- 有轨电车(旅行、车辆)
- 城市公园(室外)
记录和注释程序
对于所有声学场景,录音都是在不同的地点捕获的:不同的街道、不同的公园、不同的家庭。使用 Soundman OKM II Klassik/studio A3、驻极体双耳麦克风和 Roland Edirol R-09 录音机进行录音,采用 44.1 kHz 采样率和 24 位分辨率。麦克风经过专门设计,看起来像耳机,戴在耳朵上。因此,录制的音频与到达佩戴设备的人的人类听觉系统的声音非常相似。
记录数据的后处理涉及与记录个人隐私相关的方面。对于在私人场所录制的音频材料,必须获得所有相关人员的书面同意。在公共场所录制的材料不需要此类同意,但会进行内容筛选,并删除侵犯隐私的片段。
TAU Urban Acoustic Scenes 2020 Mobile, Development dataset
- ——————————————————————————————————————————
- https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/YDEPUT Harvard 大学 采集的纯净语音和 混合之后的语音
-
原文不能收藏,转发,就写这里了:语音行业有什么好用的开源噪声库吗?
- Audio research group - Tampere University - Datasets 这里面很多,下载比较麻烦点,需要找需要的
- http://www.cs.tut.fi/sgn/arg/dcase2017/challenge/task-acoustic-scene-classification
- . 语音和噪声相关数据集(持续更新) - 凌逆战 - 博客园 :
目录
语音数据集
TIMIT
VCTK
AISHELL-ASR0009-OS1 开源中文语音数据库
Mozilla Common Voice
Tatoeba
日语数据集
气导骨导数据集
噪声数据集
noise-92
NOIZEUS数据集
DEMAND
PNL 100 Nonspeech Sounds
rnnoise_ontributions
COUGHVID 众包数据集
ESC-50:环境声音分类数据集
ESC环境噪音分类数据集
DESED dataset
DISCO
婴儿啼哭数据集
风噪数据集
YouTube--ASMR noise
FSD50K
MS-SNSD
QUT-NOISE
freesound-datasets
STARSS22:Sony-TAu Realistic Spatial Soundscapes 2022
VOICe Dataset
In-Vehicle Noise Dataset
Vehicle Interior Sound Dataset
MAVD交通数据集
Dataset-AOB:城市声音事件分类
CHiME-Home
UrbanSound
UrbanSound8K
SONYC Urban Sound Tagging
Isolated urban sound database
Acoustic Event Dataset
BBC音效
NAR 数据集
asr-noises
音乐数据集
DCASE
综合数据集
MUSAN
FSDnoisy18k
DS_10283_2791
CSTR NAM TIMIT Plus
参考
语音行业有什么好用的开源噪声库吗?
像是asr asv等等领域,我们经常要用噪声来做数据增强提升模型鲁棒性,那么有什么好用的开源噪声库吗?
我最喜欢用的就是openslr里面录制的混响和加性噪声~
混响的:http://www.openslr.org/resources/28/rirs_noises.zip
这个混响包含了real和simulated,用的比较多是simulated中的小房间中房间,对应房间大小分别是1~10m和10~30m
加性的:http://www.openslr.org/resources/17/musan.tar.gz
这个加性包含人声babble,音乐背景声和真实噪声。这两个噪声库强烈推荐Mark上~
另外就是用sox改改音速和音量,这些dither也可以纳入考虑
发布于 2019-03-25 12:29
赞同 3715 条评论分享
收藏喜欢
传统的开源噪声库有:
NOISEX-92
DEMAND
CHIME CHELLENGE里的噪声源
以上都是专门针对噪声鲁棒性训练和评价设计的噪声库。缺点是都比较小。
还有其他两个option:
~ 可以试试训练声音事件分类器用的数据集,比如AudioSet,数据很大。
~ 或者花钱买电影音效库,比如bbc什么的。数据很多,质量高。就是不便宜。
————————————————————
我用的不算专用的噪音库,是一个声学场景分类的噪音,场景比较多,但是不是非常符合噪音这个范畴,可以用来做aec。
TUT dataset:
Acoustic scenes for the task (15):
- Bus - traveling by bus in the city (vehicle)
- Cafe / Restaurant - small cafe/restaurant (indoor)
- Car - driving or traveling as a passenger, in the city (vehicle)
- City center (outdoor)
- Forest path (outdoor)
- Grocery store - medium size grocery store (indoor)
- Home (indoor)
- Lakeside beach (outdoor)
- Library (indoor)
- Metro station (indoor)
- Office - multiple persons, typical work day (indoor)
- Residential area (outdoor)
- Train (traveling, vehicle)
- Tram (traveling, vehicle)
- Urban park (outdoor)
有个可推荐的,不仅仅是噪声。
sox。SOund eXchange lib。
是个音频特效库。包括回声,变调,变速,带通等等。
但噪声方面比较弱,只自带了各种波形的发生器,自然环境噪声需要自己搜集一些音频文件。
最大的缺点是只能用文件到文件的模式处理音频,使用tmpfs可以有效缓解这个问题。
更多推荐
所有评论(0)