librosa：Python 音频分析库

lanyushidai687

181人浏览 · 2026-06-08 14:36:38

lanyushidai687 · 2026-06-08 14:36:38 发布

文章目录

librosa：Python 音频分析库

librosa：Python 音频分析库

librosa 是一个专注于音乐和音频信号分析的 Python 库，在 GitHub 上获得了 8,442 个 Star。

正文顶部截图

README区域截图

该库由 Brian McFee 等人创建，核心目标是降低音频分析的技术门槛。它将频谱分析、时域处理、特征提取等底层操作封装为统一的 Python 接口，研究者无需深入信号处理理论即可开展音频相关的实验和开发工作。

librosa 建立在 NumPy 和 SciPy 之上，音频文件的读取和解码则依赖 soundfile 与 audioread 两个库。不同操作系统和安装方式下，音频编码依赖的处理方式有所不同。通过 conda 安装时，相关依赖会自动处理；而通过 pip 在 Linux 上安装时，可能需要手动安装 libsndfile。对于 MP3 格式的支持，系统需要预先安装 ffmpeg 或 GStreamer。Mac 用户可通过 Homebrew 执行 brew install ffmpeg，Linux 用户根据包管理器类型选择 apt-get install ffmpeg 或 yum install ffmpeg，Windows 用户则需下载对应的二进制文件。

安装方式分为三种。最简单的是通过 PyPI 直接安装：

python -m pip install librosa

Anaconda 用户可以从 conda-forge 渠道安装，这种方式能自动处理音频编码依赖：

conda install -c conda-forge librosa

需要从源码构建的开发者，可以先克隆仓库，再使用 pip 以可编辑模式安装：

python -m pip install -e .

安装完成后，运行以下代码可验证环境并查看依赖版本：

import librosa
librosa.show_versions()

librosa 的功能覆盖了音频分析的多个维度。频域分析方面，支持短时傅里叶变换、梅尔频谱、梅尔频率倒谱系数、色度特征和常数 Q 变换的提取。时域分析方面，提供了 onset 检测、节拍跟踪和节奏估计等工具。这些算法返回结构化的 NumPy 数组，可直接输入到 scikit-learn 或 PyTorch 等机器学习框架中。

在实际应用场景中，librosa 的身影遍布音乐信息检索、语音识别、环境音分类和音频推荐系统等领域。研究者用它提取音频特征训练分类模型，音乐科技公司用它分析曲库中的节奏和调性信息，内容平台则用它生成音频内容的结构化标签。

可视化模块也是 librosa 的重要组成部分。结合 matplotlib，用户能够生成波形图、频谱图和各种特征热力图，帮助直观理解音频数据的时频结构。这对调试算法和展示分析结果都很有价值。

文档体系较为完善。官方站点提供了完整的 API 参考手册、入门教程和高级示例画廊。教程从音频加载和播放的基础操作讲起，逐步深入到复杂的特征工程和多轨道分析。librosa 的学术背景同样扎实，其设计理念在 SciPy 2015 会议上以论文形式发表。如果需要在学术工作中引用，可以直接使用 Zenodo 上的 DOI，或者从 0.10.2 版本起调用 librosa.cite() 方法自动获取对应版本的引用链接。

这个项目维护活跃，测试覆盖率和文档构建流程都通过 GitHub Actions 自动化执行。对于从事音乐信息检索、语音处理、音频分类或任何需要在 Python 中分析音频信号的开发者来说，librosa 提供了成熟、稳定且文档齐全的基础设施。

thon 中分析音频信号的开发者来说，librosa 提供了成熟、稳定且文档齐全的基础设施。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

第13讲：异步任务队列与长任务处理——Celery + Redis实战

欢迎来到《Python + AI Agent 实战开发完全指南》专栏！在前面的课程中，我们使用 FastAPI 将多智能体系统封装为了 RESTful API。但在真实的生产环境中，AI 推理和多智能体协作往往需要几秒甚至几分钟的时间。如果用户在发起请求后一直等待 HTTP 响应，不仅体验极差，还容易导致网关超时（Timeout）或服务器线程阻塞。在这一讲中，我们将引入工业界标准的解决方案：异步任

AtomGit开源社区

DevOps 生态介绍（十三）：Uptime Kuma 监控小工具推荐

AtomGit开源社区

UUV_AUV六自由度模型（运动学+动力学+扰动）（Matlab代码实现）

针对欠驱动水下无人航行器三维机动运动特性分析需求，本文依托两套完整时域仿真程序搭建统一的 UUV 动力学仿真体系。整体建模框架舍弃横滚运动自由度，构建兼顾惯性耦合、非线性水动力阻尼、静水力恢复力矩与舵控力矩的简化动力学模型，采用四阶龙格 - 库塔数值方法完成非线性微分方程组高精度离散求解。仿真体系设计两类典型任务工况，一类为恒定舵角驱动的匀速直线下潜任务，用于验证航行器纵向与垂向稳态运动性能；另一