搭建自己的小爱助手!一款全面开源的轻量级、智能机器人对话系统,支持自定义配置对话,支持脑机交互
- 💂 个人网站: IT知识小屋
- 🤟 版权: 本文由【IT学习日记】原创、在CSDN首发、需要转载请联系博主
- 💬 如果文章对你有帮助、欢迎关注、点赞、收藏(一键三连)和订阅专栏哦
简介
W-Robot是一款轻量级、灵活、优雅、可定制化的中文语音对话机器人/智能音箱系统,可以帮助用户快速搭建个性化的智能音箱和语音助手。 W-Robot也是首个支持脑机唤醒的开源智能系统,支持多种语音识别与对话、天气播报、公文写作、拍照、出行规划等核心功能,可以广泛应用在智能家居、智能助手、远程控制等场景中,为用户构建具备个性化、真正智能化的语音交互体验。

特色
-
高度模块化: 功能插件、语音识别、语音合成、对话机器人都做到了高度模块化,第三方插件单独维护,方便继承和开发自己的插件。
-
中文支持: 集成百度、科大讯飞、阿里、腾讯、Apple、微软Edge、VITS声音克隆TTS 等多家中文语音识别和语音合成技术,且可以继续扩展。
-
对话机器人支持: 支持基于 AnyQ 的本地对话机器人,并支持接入图灵机器人、OpenAI ChatGPT 等在线对话机器人。
-
全局监听,离线唤醒: 支持 Porcupine 和 snowboy 两套离线语音指令唤醒引擎,并支持 Muse 脑机唤醒 以及行空板摇一摇唤醒等其他唤醒方式。
-
灵活可配置: 支持定制机器人名字,支持选择语音识别和合成的插件。
-
智能家居: 支持和小爱音箱、Siri、HomeAssistant、mqtt等智能家居协议联动,支持语音控制智能家电。
-
后台配套支持: 提供配套后台,可实现远程操控、修改配置和日志查看等功能。
-
开放API: 可利用后端开放的API,实现更丰富的功能。
-
安装简单,支持更多平台: 相比dingdang-robot ,舍弃了 PocketSphinx 的离线唤醒方案,安装变得更加简单,代码量更少,更易于维护并且能在 Mac 以及更多 Linux 系统中运行。
工作原理

W-Robot被唤醒后,用户的语音指令先经过 ASR 引擎进行 ASR 识别成文本,然后对识别到的文本进行 NLU 解析,再将解析结果进行技能匹配,交给适合处理该指令的技能插件去处理。插件处理完成后,得到的结果再交给 TTS 引擎合成成语音,播放给用户。
虽然一次交互可能包含多次网络请求,不过带来的好处是:每一个环节都可以被修改和定制。到了 5G 时代,音箱的响应速度将不再成为体验问题。可定制和个性化才是未来的主流,而届时W-robot将会是更好的选择!
功能列表
-
语音识别(ASR): 集成多家主流语音识别服务,支持多种语言与方言识别,识别速度快、准确率高,可灵活切换使用,适用于语音指令输入、语音搜索、语音控制等多种交互场景:
-
百度语音识别
-
阿里语音识别
-
腾讯语音识别
-
科大讯飞语音识别
-
OpenAI Whisper
-
-
语音合成(TTS): 内置多种语音合成引擎,输出自然流畅、富有情感的语音效果,满足不同场景下的发声需求,可用于语音播报、智能助手发声、通知提醒等功能:
- 百度 TTS、阿里 TTS、腾讯 TTS、科大讯飞 TTS、macOS Say、Han TTS
-
自然语言理解(NLU): 借助百度 UNIT 模块,能够理解用户意图、解析语义,实现更自然的人机交互:
-
支持多轮对话与上下文理解
-
能识别复杂指令并生成智能回复
-
提供开放的意图扩展机制,可自定义语义规则
-
-
离线唤醒: 提供高效稳定的离线唤醒能力,让语音助手随时响应,支持离线环境使用,提升隐私与可用性:
-
Snowboy:轻量化唤醒词引擎,支持自定义唤醒词
-
Muse 脑机唤醒:创新的脑机交互方式,通过脑电信号实现免唤醒指令
-
-
技能系统: 拥有丰富的内置技能,可轻松扩展第三方服务,打造全能型语音助手:
-
邮件检测:实时查询新邮件
-
音乐播放:语音点歌与播放控制
-
天气播报:获取实时与未来天气
-
新闻播报:自动朗读最新资讯
-
出行规划:提供路线与交通建议
-
智能家居:语音控制家电与场景联动
-
公文写作:语音生成办公文稿
-
拍照与写诗:结合 AI 进行创作
-
闲聊互动:多轮自然对话体验
-
-
智能家居: 能与主流智能家居系统无缝连接,实现语音化家庭控制:
-
支持 HomeAssistant、WOL、MQTT 等协议
-
可控制照明、温度、安防、家电等设备
-
支持自定义家庭自动化场景
-
-
远程控制: 支持跨设备、跨平台的远程语音控制与服务调用,适合智能家居管理、远程办公与设备监控等场景:
-
可通过 Siri、小爱音箱 等语音平台接入
-
提供 RESTful API,便于与第三方系统集成
-
支持后台管理与远程任务执行
-
-
闲聊功能: 内置多种智能聊天模型,支持自然、拟人化的多轮对话,可实现闲聊、问答、任务引导等功能,为语音助手增添温度与个性:
-
OpenAI ChatGPT
-
Emotibot
-
百度 AnyQ
-
其他第三方 AI 聊天模型
-

功能界面
行空板上的应用:实现支持流式对话的智能音箱


演示对话+音乐+开放API+智能家居


Siri联动

小爱同学联动

环境要求
Python版本:支持 Python >= 3.7 且 < 3.10 ,不支持 Python 2.x
设备要求:W-Robot支持运行在以下的设备和系统中
Intel Chip Mac (不支持 M1 芯片)
64bit Ubuntu(12.04 and 14.04)
全系列的树莓派(Raspbian 系统)
Pine 64 with Debian Jessie 8.5(3.10.102)
Intel Edison with Ubilinux (Debian Wheezy 7.8)
装有 WSL(Windows Subsystem for Linux) 的 Windows
开源地址&使用手册
点击下方的【IT学习日记】回复【资源】领取!
如果这篇文章对您有帮助,请一定帮我点个 “关注” 和 “点赞”,这对我非常重要。我将会继续推荐更多优质项目和新闻。

读取中...
写在最后
1000+优质开源项目更新进度:225/1000。如需更多类型优质项目推荐,请在文章后留言。

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)