情绪也能被 AI “听”出来?wav2vec2 情感识别模型正式上线 AtomGit AI!
当 AI 不再只“听懂你说了什么”,而是开始理解你“怎么说的”,语音智能,才算真正走进情绪层面。
今天为大家带来一款情感识别领域的经典模型 wav2vec2-large-robust-12-ft-emotion-msp-dim,现已上线 AtomGit AI 模型广场。
👉 点击即可体验:

基于 Wav2Vec 2.0 架构的维度语音情感识别模型 audeering / wav2vec2-large-robust-12-ft-emotion-msp-dim,该模型专注于连续维度情感识别(Dimensional Emotion Recognition),可从原始语音中直接预测情绪的 Valence(情感正负) 与 Arousal(情绪强度),Dominance(控制感 / 强势感),为语音理解、智能交互、情感计算等场景提供更细腻、更贴近真实人类感受的能力。
1|连续维度情感建模
该模型专注于连续维度情感识别,可直接从原始语音中预测三维情绪指标:
-
Arousal(激动程度 / 唤醒度)
-
Valence(情绪正负)
-
Dominance(控制感 / 强势感)
输出结果不仅是 0~1 数值,还提供中文简单描述,这种方式不仅可以分析微妙情绪、情绪波动和强度变化,还能反映说话者在情绪体验中的主导性与掌控感。
我们来使用游戏比赛中主播的音频进行测试:

2|基于 Wav2Vec 2.0 的端到端语音理解
模型基于 Wav2Vec 2.0 Large 预训练架构,已从海量语音中学习通用声学表示,并且无需手工提取 MFCC、Pitch 等传统特征,可直接端到端完成「语音 → 情绪维度」映射,即便存在背景音乐或环境噪声,也能稳定输出情绪结果。
有背景音乐:

只有人声:

3|鲁棒性增强,适应真实场景音频
该模型在训练阶段针对真实语音环境进行了优化,对背景噪声、录音设备差异具备更强鲁棒性,非常适合客服、访谈、社交语音等真实业务场景。
客服通话示例与分析结果:

4|支持多语言与跨说话人情绪建模
关注“情绪本身”,而不是“谁在说话”。依托大规模预训练语音表示,此模型已减弱对单一说话人特征的依赖,并提升跨性别、跨年龄、跨说话人的一致性,经过测试,在多语言或混合语音环境下仍保持稳定表现。
可用于构建通用型情感分析系统,下面是我们截取的多人录音的英语对话片段和测验结果:

💻|推理 API 即开即用
无需部署,直接调用即可使用:
-
支持直接上传音频预测三维度情绪;
-
返回连续数值 + 中文/英文描述,便于分析与集成;
-
支持在工作台管理 API 密钥,可控制可见性和安全性;
🔧 AtomGit AI 工作台:https://ai.gitcode.com/dashboard?tab=created&subtab=all
-
进入工作台之后,点击 API 密钥:

-
点击【新建 API 密钥】

-
和之前不同的是现在可以选择在创建之后是否支持多次查看:
-
仅创建时可见:仅在创建成功后显示一次;
-
支持多次查看(安全风险较高):可在 API 密钥管理页多次查看,但安全风险较高,请确保在安全环境下使用;
-

-
如果选择支持多次查看,我们可以直接在调用代码模块中选择支持多次查看的密钥来嵌入示例代码(使用时请确保处于安全环境避免泄露):

🌟|性能与优势展示
相比传统离散情绪分类模型,三维度情感识别模型优势:
-
情绪表达更细腻,连续而非跳变
-
同时刻画激动程度、情绪正负和控制感
-
更适合长语音与情绪变化分析
-
输出结果更利于趋势判断与策略决策
-
与真实人类情绪体验高度一致
🔗|快速体验模型能力
方式一:即刻在线体验
https://ai.gitcode.com/serverless-api?model=wav2vec2-large-robust-12-ft-emotion-msp-dim
无需部署、无需写代码,进入模型列表即可开始测试:
-
上传任意语音文件,即可获得 Arousal(激动程度)/ Valence(情绪正负)/ Dominance(控制感)三维度预测;
-
输出不仅包含数值,还提供简单描述;
-
可实时感知语音中的情绪变化,让 AI 不只听见内容,更理解说话者的态度与情绪;
方式二:调用推理 API
可将模型接入 AI 客户端或项目,通过 API 批量处理语音数据,快速完成情绪分析任务。
-
支持批量音频上传与推理;
-
输出结构清晰,可直接用于智能客服、语音交互、心理分析、访谈分析等场景;
-
高效、稳定、易集成,让语音情感分析变得简单、可靠;
👉 立即免费体验:
https://ai.gitcode.com/serverless-api?model=wav2vec2-large-robust-12-ft-emotion-msp-dim
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐




所有评论(0)