多模态技术加持,讯飞全新 AI 眼镜解锁智能穿戴新体验
BEYOND Expo 2026科技展会近期在澳门举办,科大讯飞携自研新款AI眼镜亮相展会,展示了其在智能穿戴设备领域的前沿技术成果。目前不少智能穿戴设备以单一音频交互为主,在展会、商场、会议室等嘈杂环境下,交互识别效果容易受到影响。针对这类行业问题,讯飞依托自身语音算法和机器视觉的技术积累,对产品进行优化升级,搭载多模态降噪与唇动识别技术,通过音视结合的交互方案,改善了复杂环境下的设备交互效果,拓宽了智能眼镜的适用场景,也为消费级AI设备的升级提供了新的思路。
一、核心技术架构,构建音视融合识别体系
在降噪相关的硬件配置上,讯飞AI眼镜配备了六麦拾音降噪系统,将气导麦克风和骨传导麦克风搭配使用。通过多阵列麦克风的配合,设备可以有效分辨不同距离的声源,区分近处和远处的声音。同时搭配自适应动态降噪算法,能够过滤掉环境中的多余噪音,保证设备采集到的人声足够清晰,为后续的智能识别工作提供稳定、可靠的音频数据支持。
和传统只依靠音频降噪的智能设备不一样,这款讯飞AI眼镜新增了视觉识别辅助功能。设备镜框内部装有小型摄像组件,能够实时捕捉用户说话时的唇部动作变化。之后设备会将收集到的声音数据和唇部动作的视觉数据结合起来分析,形成双重识别模式。如果遇到环境噪音较大、人声信号模糊的情况,设备就可以借助唇部动作的特点修正识别结果,提升嘈杂场景下的语音识别和翻译匹配效果。
讯飞AI眼镜配备了六麦拾音降噪系统图
二、产品综合配置,兼顾轻量化与独立算力
在机身设计方面,这款AI眼镜采用了轻量化的制作思路,整机重量控制在40克左右,比同类产品轻约 20%,就算长时间日常佩戴或者办公使用,也不会产生明显的不适感,佩戴体验比较友好。在算力方面,设备搭载了专属的端侧AI芯片,拥有独立的数据运算能力。不需要连接手机、电脑等外部设备,就可以单独完成声音采集、智能数据分析、语言转换、字幕显示等一系列操作,实现了设备的独立使用运行。
在实际使用功能上,这款眼镜支持多种语言的互相翻译,内置了多个行业的专业词汇库。不管是日常人际沟通、商务合作洽谈、线上远程会议,还是跨国语言交流等场景,都可以完成语言转换工作,能够有效解决不同语言沟通不畅的问题,满足人们日常生活和职场工作中的多样化使用需求。
三、行业价值与发展展望
在本次展会的现场演示过程中,现场观众与体验者能够明显发现,这款讯飞AI眼镜在比较嘈杂的环境里也能稳定运行,整体表现十分平稳,也能够直观看出音视融合识别技术有着不错的实用性。现如今,智能穿戴设备的功能变得越来越丰富,不再只是简单的硬件产品,而是人工智能技术落地使用的重要方式。
能不能适应多种使用场景、能不能抵御外界环境的干扰,也慢慢成为大家判断穿戴设备好不好用的重要标准。这款讯飞AI眼镜做出的技术改进,解决了传统智能眼镜只能在安静环境使用的问题,能够适应生活、办公里的各种复杂场景。未来人工智能技术还会持续迭代,智能穿戴设备体验也将不断升级。科大讯飞也会深耕智能穿戴赛道,持续优化交互功能,拓展产品的落地场景。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐
所有评论(0)