你有没有过这种体验:站在一件千年文物前,玻璃柜里写着"战国·青铜冰鉴",你盯着它看了半天,除了"哦,是个酒器",什么都读不出来?

那种——明明站在历史面前,却和文化隔着一层玻璃的感觉。

这一次,我想带你想象一种完全不同的观展方式。

一、痛点:我们在博物馆里,到底失去了什么?

去过博物馆的人,大概都有过类似的经历:

  • 排了半小时队,终于挤到展柜前——标签上写着"商·后母辛鼎",旁边一行小字"1976年出土于殷墟",没了。

  • 想扫码听讲解,二维码糊了,旁边站了一圈人,你没好意思掏手机。

  • 请了讲解员,讲得不错,但你跟不上节奏,想追问的时候,队伍已经走了。

我们缺的,从来不是文物。

我们缺的是一双能"读懂"文物的眼睛,和一个愿意在那个瞬间讲给你听的声音。

二、方案:三件套,让文物"活"过来

工具组合:

角色

工具

作用

大脑

灵珠 AI 平台

创建"古识智镜"AI 智能体,处理识别、内容生成

眼睛

Rokid 智能眼镜

AR 画面叠加 + 私密音频通道

用户

戴上眼镜,正常看展,什么都不用做

核心逻辑一句话:

你站在文物前 → 眼镜捕捉画面 → AI 识别展品 → 眼前浮现解读 + 耳边响起故事

全程不需要掏手机,不需要扫码,不需要任何操作

文物在你眼前,故事在你耳畔。

三、搭建流程:手把手

第一步:创建智能体

登录灵珠 AI 平台,新建智能体,填写以下基础信息:

智能体名称:古识智镜
类别:娱乐

功能介绍填写参考:

本智能体是专为博物馆线下观展场景打造、适配智能眼镜终端的沉浸式 AI 导览交互系统,以实景视觉识别、空间 AR 渲染、多模态内容匹配为核心能力,彻底颠覆传统扫码、手动翻查资料的观展模式,为用户打造零负担、全感官的文博观览新体验。

核心功能上,智能体具备无感自动触发能力,依托智能眼镜的实景视觉感知,当用户在文物前驻足,系统即刻自动完成展品识别与内容唤醒,全程无需抬手扫码、手动搜索或低头翻查攻略,真正实现"驻足即触发,所见即所得",全程不打断观展沉浸感。

针对识别匹配的文物,智能体可同步推送全维度深度解读,全面覆盖器物流转年代、纹样吉祥寓意、背后历史典故,完整串联馆藏珍品的前世今生,让用户一眼读懂文物背后的千年中华文脉。同时通过轻量化 AR 标注技术,精准放大还原文物纤毫纹饰、传统工艺细节,打破肉眼观察的视觉局限。

此外,智能体搭配智能眼镜私密音频通道,同步推送贴合观展节奏的轻声语音解说,打造"眼前有画面、耳间有故事"的视听一体沉浸式体验,全程不干扰场馆观览秩序,让用户沉浸式解锁馆藏珍品的完整故事。

第二步:配置提示词

# 角色:博物馆智能眼镜AR导览AI智能体
专为博物馆线下观展场景打造、适配智能眼镜终端,以实景视觉识别、空间AR渲染、多模态内容匹配为核心能力,为用户提供零负担、全感官沉浸式文博导览服务的AI交互系统。
## 目标:
1. 颠覆传统扫码、手动翻查资料的博物馆观展模式,为用户打造无感、沉浸式、全维度的线下观展体验,助力用户深度读懂馆藏文物背后的千年中华文脉
2. 在不干扰场馆观览秩序、不打断用户观展节奏的前提下,完整传递文物的历史背景、文化内涵与工艺价值,最大化释放馆藏展品的文化魅力
## 技能:
1. 无感实景智能识别与自动触发能力:依托智能眼镜的实景视觉感知能力,可精准捕捉用户观展行为,当用户在文物前驻足时,即刻自动完成展品识别与内容唤醒,全程无需用户手动操作
2. 文物全维度深度内容解读能力:可精准匹配识别到的展品,同步推送覆盖器物流转年代、纹样吉祥寓意、背后历史典故的全维度权威文博内容,完整串联馆藏珍品的前世今生
3. 多模态沉浸式导览呈现能力:可通过轻量化AR标注技术精准还原并放大文物纤毫纹饰、传统工艺细节,同时搭配智能眼镜私密音频通道,同步推送贴合观展节奏的语音解说,打造视听一体的沉浸式体验
## 工作流:
1. 实时感知用户观展行为,通过智能眼镜的视觉感知模块持续捕捉用户视野与停留状态,当用户在文物展品前驻足时,即刻启动实景识别算法,完成展品的精准匹配与对应导览内容的唤醒
2. 同步启动视觉内容输出,在智能眼镜的用户视野内,以不遮挡核心展品的轻量化形式,呈现文物全维度深度解读文本,同时通过AR标注对文物的纹饰、工艺等肉眼难捕捉的细节进行放大、定位与还原
3. 同步触发音频解说输出,通过智能眼镜的私密音频通道,推送与当前视觉内容精准匹配、贴合用户观展节奏的轻声语音解说,完成完整的沉浸式导览服务,并持续适配用户的观展动线调整服务节奏
## 输出格式:
适配智能眼镜终端的双轨同步输出格式,具体要求如下:
1. 视觉输出:采用无干扰轻量化AR标注+边缘悬浮文本卡片形式,在不遮挡用户视野内核心展品的区域,分模块呈现文物核心信息、深度解读内容与工艺细节标注,内容简洁凝练、层级清晰
2. 音频输出:采用低干扰沉浸式轻声旁白格式,同步输出与视觉内容精准匹配的文物解说内容,语速平缓、叙事流畅,贴合线下观展的节奏,全程无突兀音效与冗余内容
## 限制:
- 严格遵循博物馆场馆观览管理规定,所有输出内容不得产生公共噪音干扰、不得引导用户做出违反场馆规定的行为,全程不干扰场馆正常观览秩序
- 仅在用户于文物展品前驻足时自动触发服务,无有效观展行为时不得推送冗余信息,全程不得强制用户进行扫码、手动搜索等操作,不得打断用户的观展沉浸感
- 所有文物相关解读内容必须严格遵循文博领域权威史料记载,不得虚构、篡改文物的历史背景、工艺信息与文化内涵,确保输出内容的专业性、准确性与严肃性

第三步:配置智能体信息

为了智能体能够正常接入智能眼镜,进行后续的操作,我们需要配置智能体相关信息

1. 基础设置信息

配置项

选项

说明

智能体启动

图片 (首轮传递)

选择「图片 (首轮传递)」,确保智能体在对话启动时就能接收、处理智能眼镜传递的图像流,是眼镜端拍照 / 图像交互的基础前提

图像精度

高精度

选择「高精度」,保证眼镜采集的画面细节能被 AI 清晰识别,避免低精度导致的图像信息丢失、指令识别失败

2.智能体插件

  • 插件名称:乐奇 AI 眼镜控制插件 /notify_take_photo

核心功能:向智能眼镜设备端发送拍照指令 command:take_photo,仅负责通知设备执行拍照动作,不直接处理图像数据,等待设备端拍照成功后再回传图像给智能体进行后续处理。

💡 提示: 提示词是这套方案的核心资产。配置完成后,建议先在平台测试窗口输入一件文物的描述(如"战国·青铜冰鉴"),观察输出内容的专业性和格式是否符合预期,再进行眼镜端实测。

第四步:连接 Rokid 眼镜,启用开发者调试

眼镜端的连接与调试,是整个链路跑通的关键:

1. 打开 Rokid App,连接眼镜

手机解锁,打开 Rokid App,确保蓝牙已开启并将眼镜开机配对。

2. 进入开发者选项,开启 ADB 调试

这一步是接入自定义智能体的前提:

  • 点击主页右上角的设置图标 → 进入「眼镜设置」

  • 向下滑动,找到并点击 「开发者」 选项

3. 进入智能体调试页面

在开发者页面中,点击「智能体调试」选项,

进入调试页面,找到「古识智镜」智能体卡片,点击右侧「开启」按钮。

四、使用流程:戴上那一刻,世界变了

搭建完成后,使用流程极其简单——简单到你几乎感觉不到自己在"操作"什么。

┌──────────────────────────────────────────────┐
│                                               │
│   第一步:佩戴眼镜,正常走进博物馆             │
│           ↓                                   │
│   第二步:站在任意文物前,询问智能体眼前是什么       │
│           ↓                                   │
│   第三步:跟随眼前指引 + 耳边故事              │
│           ↓                                   │
│   第四步:看完,继续走向下一个展品            │
│           ↓                                   │
│   【系统自动感知,切换到新展品】               │
│                                               │
└──────────────────────────────────────────────┘

五、场景想象:走进博物馆的那一刻

想象一下你真实的观展体验:

🎯 你站在"四库全书"展柜前

眼前:真实文物静静陈列,灯光柔和,周围安静无人打扰。

智能眼镜画面同步显示

“【语音讲解内容】”

### 视觉输出:
- **核心展品**:青铜酒器组合(含尊、爵、觥类)
- **工艺细节标注**:
  - 【纹饰】尊身环绕**饕餮纹**(AR高亮放大:兽面双目圆睁,鼻梁高耸,云雷纹衬底)
  - 【造型】爵杯三足鼎立,流口上扬;尊盖立兽钮,一侧衔**龙首提梁**(AR定位:龙角上扬,鳞片清晰)
  - 【锈色】铜绿与朱砂红锈交织,呈现**“孔雀蓝”“枣皮红”**自然包浆(AR色块标注)
- **历史背景**:商周时期青铜礼器,用于祭祀宴飨,彰显“**藏礼于器**”的等级制度

八、一句话总结

古识智镜,不是一件新工具。

它是一扇窗——让你第一次,真正站在历史面前,听懂了它在说什么。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐