本文智能体基于Rokid AI Glasses和灵珠AI平台开发。
开发指南:https://forum.rokid.com/index

站在博物馆里,你有没有过这种感觉——

展柜前聚了一堆人,导游举着小旗子讲解,耳机里导览声音嗡嗡响,但你真正想知道的,就那么一两句:这是啥、有啥特别、背后有啥意思。结果呢?说明书太短,扫码太麻烦,蹭听又听不完整。

我最近用灵珠 AI 和 Rokid 眼镜搭了一套东西,试着解决这个不大不小的问题。

01 它是怎么工作的

原理不复杂。

戴上 Rokid 眼镜,走到一件文物前,眨眨眼——或者干脆说句话,比如"这件给我讲讲"。灵珠 AI 上的「文博瞳解」智能体收到信号,会从年代、器型、工艺、纹样、故事这几个角度,用说人话的方式讲一遍。

不是念说明书,是真的在"讲"。

文字会浮在你眼前的玻璃面上,同时耳机里也会有声音。视线不用离开文物,手不用掏手机。

02 搭这个智能体,我填了什么

在灵珠 AI 平台上建了一个叫「文博瞳解」的智能体,核心配置就两样:功能介绍 + 提示词。

功能介绍填的是:

这是一款适配智能眼镜的文博实景讲解智能体,专为博物馆、美术馆、文物古迹场景打造。通过眼镜的视觉识别,自动识别眼前的文物展品,无需扫码、无需导览器,即可轻声为你讲解器物年代、纹饰寓意、工艺背景与历史典故,还能标注关键细节,帮你读懂文物背后的故事,让逛展更沉浸、更省心。

提示词是这么写的:

### 人设与回复逻辑
你是「文博瞳解」,一款适配智能眼镜的博物馆文物讲解智能体。
1.  **核心定位**:用户眼前的文物专属讲解员,通过视觉识别,轻声、通俗地讲解展品信息。
2.  **回复风格**:
    -   语言亲切自然,避免生硬的百科式朗读,像一位耐心的文博向导。
    -   讲解时重点突出,先讲年代与用途,再讲工艺、纹饰寓意和背后的历史故事。
    -   主动引导用户关注细节,比如“你看这个纹饰,它代表着……”,适配眼镜AR标注场景。
3.  **回复规则**:
    -   用户提到眼前的文物时,优先回应这件展品的核心信息,不跑题。
    -   用短句分段呈现,方便用户边看边听,不使用长难句和生僻词。
    -   不主动输出无关内容,只围绕用户眼前的展品进行讲解,保持专注。

在智能体设置页,完成这两项关键配置:

  • 智能体启动

    • 选择:图片(首轮传递)

    • 作用:用户唤醒时,系统会自动把眼镜摄像头拍到的画面,在第一轮就传给智能体,不用等用户额外发图,保证识别和讲解零延迟。

图像精度

  • 选择:低精度

  • 作用:降低图片分辨率,减少传输带宽和模型处理时间,适配眼镜端的实时响应需求。


添加控制插件

  1. 进入「添加插件」页面,切换到「探索工具」标签。

  2. 在插件列表中找到 「乐奇 AI 眼镜控制插件」

  3. 点击插件右侧的箭头,进入详情页,完成添加操作。


启用拍照控制能力

  1. 回到智能体的「技能」设置页,展开「插件」列表。

  2. 找到已添加的「乐奇 AI 眼镜控制插件」,启用它的 notify_take_photo 工具。

    • 工具说明:该工具仅向眼镜设备发送「拍照成功」的通知,不做额外处理,确保硬件端对焦、拍摄完成后,再进行后续流程。


03 在眼镜上怎么把它跑起来

搭好之后,需要在 Rokid 眼镜上把它调出来。步骤不复杂:

  1. 手机打开 Rokid App,底部导航进「主页」

找到「智能体调试」,找到「文博瞳解」,点启动

戴上眼镜开机,进入智能体,面对文物 ,喊一声”这是什么文物?"

  • 等几秒,眼前浮现文字,耳边响起声音

眼镜里的画面大概是这个样子:

文字分层出现,先年代用途,再工艺,最后才到纹样寓意——这个顺序是故意设计的,先建立基本认知,再逐步深入。

04 它能怎么用

单独逛博物馆

不用排队等讲解器,不用扫码,不用蹭旅行团的导游。自己走,想停多久停多久。

研学或者带孩子

专业词汇转成大白话之后,家长也能接上话,孩子问"这花纹是啥意思",至少能答上来。

特展或者不熟悉的领域

去一个完全不懂的展厅,智能体至少能让你离开时比进来时多懂一点点,而不是看完就忘。

05 效果怎么样

讲解听得下去吗

能听,比导览器里念论文的那种强

眼睛真的不用离开展品吗

是的,信息在眼前,不是手机上

响应快不快

正常对话速度,不会有明显等待感

长时间戴着累不累

眼镜本身不重,但博物馆逛一天还是会有点闷,适时休息

最后说两句

博物馆里的好东西太多了,但不是每个人都有精力、有背景知识去真正"看见"它们。一件器物在展柜里静静伫立,没人告诉你的话,你可能真的不知道它曾经盛过什么、见过谁、被谁的手抚摸过。

这套东西不能替代真正的导览,但至少能让一个普通观众,在一件文物前多停留三分钟,听一个有人味的解说,然后带着一点真实的印象走向下一件——这就够了。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐