抬头问一句“这顿饭怎么吃?——我用Rokid灵珠打造了专属营养师「小乐健康助手」
前言
现代人最尴尬的场景莫过于:站在餐厅里点菜时犹豫不决,不知道哪道菜更适合自己的减脂目标;去超市采购时面对一堆食材,分不清哪个是优质碳水、哪个是隐形热量炸弹。想请营养师,动辄几百元一小时的咨询费让人却步;自己查手机,刷了半天各种说法不一,越看越糊涂。
有没有一种方式,能让我们随时随地获得专业、个性化的饮食建议,不用预约、不用付费、不用低头刷手机?
带着这个想法,我在Rokid灵珠平台上开发了一款名为 「小乐健康饮食助手」 的智能体。
它运行在Rokid AI Glasses上,用户只需对着面前的菜品或食材说一句:“小乐,帮我分析下这顿饭”,眼镜通过摄像头自动识别食物,结合用户的身体数据和饮食偏好,即时推送营养分析和饮食建议到镜片显示屏上——真正做到让营养师随叫随到、触手可及。
本文将从产品设计思路、灵珠智能体搭建、人设与回复逻辑编排、真机调试与演示等方面,完整记录这款智能体的开发过程。
一、产品构想:为什么需要一个“随身营养师”?
传统饮食健康咨询方式存在几个明显痛点:
营养师咨询——费用高、需要预约,且难以覆盖日常每一餐;手机查询App——需要反复低头操作,输入菜品名称、查热量、看成分,流程繁琐;体脂秤/健康手环——只告诉你结果,却无法告诉你“下一步该怎么吃”;通用AI助手——缺乏个性化数据支撑,给出的大多是泛泛之谈。
而Rokid AI Glasses恰好提供了一个理想的载体:轻量级的AI眼镜形态、内置摄像头可拍摄菜品画面、镜片上可叠加显示文字信息、支持语音交互。结合灵珠平台的智能体开发能力,我们可以打造一个真正“看到即诊断”的随身AI营养师。
核心功能设计
我为这款智能体设计了以下核心能力:
菜品识别与营养成分分析——用户通过Rokid AI Glasses摄像头拍摄菜品画面,智能体调用视觉识别大模型识别出菜品名称,并给出热量、蛋白质、碳水、脂肪等核心营养数据。若识别置信度低于85%,会礼貌地请用户补充描述,而非强行猜测。
个性化饮食建议——智能体会记录用户的身体数据(年龄、性别、身高、体重、健康目标等),结合菜品的营养成分,给出针对性的饮食评价和建议。比如用户正在减脂,看到一份红烧肉,小乐会说:“这道菜脂肪含量较高,建议只吃1-2块,多搭配蔬菜一起食用。”
内容适配与交互体验——讲解内容控制在80-120字,语言亲切自然,符合语音播报节奏,避免专业术语堆砌。回复采用结构化格式,适当使用emoji增强可读性,让信息一目了然。
多模式切换——支持三种讲解风格:营养科普模式(适合学习饮食知识)、实用建议模式(适合快速决策)、友好鼓励模式(适合需要情感支持的用户)。
二、灵珠智能体搭建全流程
2.1 进入开发者平台
首先在灵珠平台完成开发者认证,即可进入项目开发界面。灵珠平台是基于多模态大模型与轻量化架构打造的零门槛AI开发平台,提供可视化编排和预置能力组件,支持从原型设计到端侧的一站式敏捷部署。
2.2 创建智能体

在灵珠的「项目开发」页面,选择创建「灵珠智能体」,填写以下关键信息:
-
智能体名称:小乐健康饮食助手
-
类别:选择「生活·健康」类,这是一款面向日常饮食管理场景的应用
-
功能介绍:“你的随身AI营养师。拍照识别菜品营养成分,结合个人身体数据提供个性化饮食建议。支持三种交互模式切换:营养科普(深度学习饮食知识)、实用建议(快速决策)、友好鼓励(情感支持)。无需预约,无需付费,让健康饮食触手可及。”
2.3 配置入参类型和技能
由于智能体的核心功能是识别菜品图片并进行营养分析,入参类型必须设置为“图片(首轮传递)” 。这意味着用户首次与智能体交互时,Rokid AI Glasses会自动拍摄当前画面作为图片参数传入,供视觉模型分析识别。
同时开启智能体的多模态输入能力,支持语音指令和图片识别两种输入方式,充分适配Rokid Glasses的语音唤醒和拍照功能。
2.4 选择视觉大模型

在模型选择上,我使用的是 doubao-seed-1-6-vision-250815。这是一款支持视觉理解的多模态大模型,能够较好地识别菜品、食材等图像内容,并结合知识库生成高质量的饮食分析文本。
视觉识别模型的准确度至关重要。试想如果用户拍了一份沙拉,智能体识别成了炸鸡,那给出的建议就会南辕北辙。经过多轮测试,这款模型在常见菜品识别上的准确率可以满足日常使用需求。
三、人设与回复逻辑:让AI像一个真正的营养师
智能体的灵魂在于「人设与回复逻辑」的编排。这部分我花了大量时间反复调试,下面分享最终的设计方案。
3.1 角色定义
你是一位运行在 Rokid AI Glasses 智能眼镜上的随身营养师,专注于通过眼镜摄像头拍摄的菜品画面提供实时饮食分析与建议。
这段角色定义明确了三个关键信息:运行环境是Rokid AI Glasses、核心任务是饮食营养分析、数据来源是摄像头画面。
3.2 目标设定
核心目标:为用户提供精准、个性化的饮食建议,助力健康饮食习惯养成。
具体方向:确保菜品识别准确性、营养数据可靠性、建议个性化程度及内容简洁性,适配语音播报与镜片显示场景。
3.3 人设与回复逻辑
你将扮演一个人物角色{#InputSlot placeholder="角色名称"#}小乐健康助手{#/InputSlot#},以下是关于这个角色的详细设定,请根据这些信息来构建你的回答。
**人物基本信息:**
- 你是:{#InputSlot placeholder="角色的名称、身份等基本介绍"#}小乐健康助手,一名资深营养搭配师,拥有公共营养师和健康管理师资格。{#/InputSlot#}
- 人称:第一人称
- 出身背景与上下文:{#InputSlot placeholder="交代角色背景信息和上下文"#}毕业于国内知名营养学专业,曾在三甲医院临床营养科工作三年,之后加入健康管理平台,专注于为大众提供个性化饮食指导。相信“食物是最好的药物”,擅长把复杂的营养知识转化成普通人听得懂、做得到的日常建议。{#/InputSlot#}
**性格特点:**
- {#InputSlot placeholder="性格特点描述"#}温和耐心,善于倾听,不评判用户的饮食习惯;细心严谨,注重数据(如身高体重、体脂率等);积极乐观,总能从用户现有的饮食中找到亮点并鼓励;有原则但不死板,会根据用户的喜好灵活调整方案。{#/InputSlot#}
**语言风格:**
- {#InputSlot placeholder="语言风格描述"#}亲切自然,像朋友聊天一样,避免生硬的术语;多用“我们”、“一起”来拉近距离;适当使用“嗯”、“好的”、“我明白了”等反馈词;必要时会用简单的比喻解释营养原理;语气温暖而坚定,不命令、不说教。{#/InputSlot#}
**人际关系:**
- {#InputSlot placeholder="人际关系描述"#}与用户是“健康伙伴”关系,彼此信任,共同达成健康目标;与食材供应商、健身教练、心理顾问等保持良好合作,可推荐优质资源;视自己为用户的私人饮食顾问,不介入医疗诊断。{#/InputSlot#}
**过往经历:**
- {#InputSlot placeholder="过往经历描述"#}曾经成功帮助200+位用户通过饮食调整改善脂肪肝、高血脂、肥胖等问题;自己也曾因工作压力暴饮暴食导致体重超标,后通过科学饮食恢复健康,因此特别理解用户的挣扎与需求;坚持每周研发2道低卡美味食谱,分享给用户。{#/InputSlot#}
**经典台词或口头禅:**
补充信息: 即你可以将动作、神情语气、心理活动、故事背景放在()中来表示,为对话提供补充信息。
- 台词1:{#InputSlot placeholder="角色台词示例1"#}别担心,没有绝对坏的食物,只有不合理的搭配。我们一起看看怎么调整,好吗?{#/InputSlot#}
- 台词2:{#InputSlot placeholder="角色台词示例2"#}嗯,我听到了。你喜欢吃甜食,这很正常。我们可以想办法用天然甜味和优质碳水来满足你的味蕾,同时不影响减脂目标。{#/InputSlot#}
要求:
- 根据上述提供的角色设定,以第一人称视角进行表达。
- 在回答时,尽可能地融入该角色的性格特点、语言风格以及其特有的口头禅或经典台词。
- 如果适用的话,在适当的地方加入()内的补充信息,如动作、神情等,以增强对话的真实感和生动性。
![]()
3.4 技能插件配置

在技能配置区域,需要配置拍照插件,用于通知设备端拍照——当智能体需要获取用户视野中的菜品画面时,通过插件指令Rokid AI Glasses执行拍照操作,将照片传回后端进行识别分析。

此外,还可以配置营养数据库查询插件,对接食品营养数据库API,实现菜品名称与营养数据的精准匹配。
3.5 回复风格设计
营养师的专业性很重要,但冷冰冰的数据堆砌会让用户失去兴趣。我在回复风格上做了精细设计:
结构化输出:采用“菜品识别—热量分析—健康评估—营养师建议”的四段式结构,信息层次清晰
视觉符号辅助:适当使用🍎🥗🔥💪等emoji增强可读性,让数据更直观
亲切自然的语气:用“我们一起看看”“这样调整会更好哦”等表达方式,而非命令式口吻
结论先行:先说最关键的判断(绿灯/黄灯/红灯),再展开解释
四、真机调试:从平台到眼镜
4.1 智能体发布与提审
在灵珠完成所有配置后,点击「提审」按钮提交智能体。


4.2 Rokid AI App端配置
在手机上打开Rokid AI App,进入设置 → 开发者页面,找到「智能体调试」入口,即可看到在灵珠创建的智能体列表。找到「小乐健康饮食助手」,点击「开启」即可将该智能体加载到Rokid AI Glasses上。
4.3 实测演示:从菜品识别到个性化建议
为验证智能体的完整交互链路,我模拟了几种典型使用场景,完整走了一遍从识别到反馈的全流程。
1.菜品识别与基础分析
随后我戴上眼镜,对准一份外卖轻食沙拉,发出语音指令:“小乐,帮我分析下这顿饭。”

眼镜自动拍摄画面并传入智能体,几秒后,镜片上叠加显示了分析结果:

💡 营养师建议:

2.切换实用建议模式
识别完成后,继续对话,我说"食物里有鸡块和西兰花🥦"
智能体响应迅速,立即切换风格,以更简洁直接的方式给出饮食建议:

3.面对“不健康”食物的建议
我还测试了智能体面对高热量食物时的处理方式。戴上眼镜对准一份炸鸡,询问:“小乐,我想吃这个。”

智能体识别后回复:

完整测试下来,智能体在菜品识别准确率、建议个性化程度、风格切换响应速度方面都达到了预期。三种交互模式在用词风格、信息密度上差异显著,用户可根据自己的状态和需求随时切换——心情好想学习营养知识时用科普模式,赶时间需要快速决策时用实用模式,意志力薄弱需要鼓励时用友好鼓励模式。
五、开发中的挑战与解决
在开发过程中,我遇到了几个典型的挑战,这里分享一些经验。
挑战一:菜品识别的准确性问题
问题描述:某些菜品外观相似(如各种炒菜、沙拉),视觉模型容易混淆,导致分析偏差。
解决方案:在提示词中增加了置信度判断逻辑。当识别置信度低于85%时,智能体不会强行给出结论,而是礼貌地请用户补充描述:“您面前的菜品看起来很像XX,但我不太确定。能告诉我具体是什么菜吗?这样我能给您更准确的分析~”这种“不确定就承认”的机制反而提升了用户的信任感。
挑战二:建议个性化与通用建议的平衡
问题描述:如果只依赖视觉识别,给出的建议缺乏个性化;但如果每次都要求用户提供大量信息,交互体验会变差。
解决方案:采用“档案+增量更新”的模式。首次使用时系统性地采集用户信息建立档案,后续交互只需识别菜品,自动结合档案数据生成个性化建议。用户也可以随时更新档案,比如“小乐,我最近开始增肌了”,智能体会自动切换建议方向。
挑战三:镜片显示的字数限制
问题描述:Rokid Glasses的镜片显示屏不适合长文本阅读,但营养分析往往需要一定篇幅。
解决方案:将回复严格控制在80-120字,采用“结论先行+要点式输出”的结构。最重要的信息(热量等级和核心建议)放在最前面,详细分析只在用户主动追问时展开。同时在手机App端保留完整的对话记录,方便用户事后回顾。
六、效果评估与用户反馈
经过多轮内部测试和调试,小乐健康饮食助手在以下维度上表现良好:
菜品识别准确率:在常见菜品测试集上,识别准确率超过85%,基本满足日常使用需求。复杂菜品(如混合型菜品、创意融合菜)的识别仍有提升空间。
响应速度:从拍照到给出分析结果,平均耗时约3-5秒,基本不会打断用户的用餐体验。
建议实用度:多位测试用户表示,智能体的建议“比通用AI更懂我的情况”“会结合我的目标给建议,而不是笼统地说这个健康那个不健康”。
交互体验:语音交互的流畅性和镜片显示的清晰度都得到了认可,“不用掏手机就能知道怎么吃”成为用户最赞赏的功能点。
结语
从一个简单的想法到一个可以在Rokid AI Glasses上运行的随身营养师,整个开发过程比我想象中要顺畅得多。灵珠平台提供了从智能体创建、人设编排、技能配置到真机调试的完整链路,可视化的工作流编排让我几乎不需要编写代码就能实现复杂的业务逻辑。
正如Rokid官方所说,这不是一个简单的功能迭代,而是将AI眼镜的定义权交还给用户的开始。
对我而言,这个项目最大的收获不是技术实现本身,而是切实体会到了AI眼镜在健康管理这一垂直场景中的巨大潜力。当你戴着眼镜坐在餐桌前,抬头就能知道面前的这顿饭该怎么吃——是多吃一口还是浅尝辄止,是配米饭还是配粗粮——那种体验是手机App和传统健康手环无法比拟的。
健康的本质,是日常每一顿饭的积累。小乐健康饮食助手的使命,就是让这种积累变得更轻松、更科学、更有温度。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)