QDKTAI相关岗位常见面试题11-20

m0_73724698

366人浏览 · 2026-04-03 06:34:02

m0_73724698 · 2026-04-03 06:34:02 发布

一、大模型幻觉问题：原因与避免策略

（一）幻觉产生的两大核心原因

大模型的本质局限：大模型基于数学概率计算生成下一个字符（TOKEN），本身不具备真正的认知能力和对错判断能力，仅靠训练数据的概率分布输出内容，存在低概率的错误输出可能。

用户提问不专业：这是最主要的原因，包括提问模棱两可（用户自身不清楚需求）、提供信息不全或错误（例如“林黛玉倒拔垂杨柳”这类矛盾信息），迫使大模型强行输出不符合事实的内容。

（二）避免幻觉的两大实用策略

提示词策略：明确告知AI“未知则不答”，禁止其编造内容。例如在提示词中注明“若对问题无明确答案，直接回复‘无法解答’，不得自行生成相关内容”，避免AI为迎合用户而产生虚假信息。

应用场景限制：不将大模型用于其能力之外的场景，包括儿童教育、医疗诊断、数学计算、未来预测等。这类场景要么需要专业知识储备，要么训练语料中无相关数据，强行使用必然导致幻觉。

二、文生图模型与Lora训练全攻略

（一）主流文生图模型盘点

类别	模型名称	核心特点	适用场景
国外开源	Flux	Stable Diffusion团队出走后开发，当前最先进的开源图像生成模型	专业图像创作、商业落地（可控性强）
国外商用	Midjourney	生成效果优质，社区生态完善	艺术创作、创意设计、可视化需求
国外开源	Stable Diffusion	开源生态成熟，支持大量插件和微调	个人创作、二次开发、低成本落地
国外商用	DALL·E	OpenAI旗下，与GPT生态联动	文本关联图像生成、创意快速落地
国内模型	文心一格、通义万象、GLM、豆包	适配中文场景，部分支持本土化需求	中文提示词创作、轻量可视化需求

注：国内主流实际应用中，Stable Diffusion和Flux占比最高，其他国内模型商用效果和可控性相对较低。

（二）常用文生图平台（零基础友好）

Liblib：国内最大的文生图社区，支持在线使用Flux、Stable Diffusion及各类Lora模型，操作门槛低，适合新手体验。

吐司Art：与Liblib同期上线，功能类似，支持模型微调与在线生成，用户量相对较少但体验流畅。

（三）Lora训练零基础指南

核心前提：仅开源模型（Stable Diffusion、Flux、GLM）支持Lora训练，国内闭源模型暂不支持，且GLM的Lora训练可控性低，实用价值有限。

训练成本：无需高配置设备，在线平台（Liblib、吐司Art）可直接体验，充值少量积分（几百积分即可）就能启动训练。

详细流程：

准备素材：上传20张左右具有相同主体（如特定人物、物体）或相同风格（如古风、赛博朋克）的图片。

标签处理：平台会自动为图片打标签，核心工作量是清洗混乱标签、补充关键信息标签（如“古风美女、红裙、水墨画风格”）。

启动训练：选择精度（高精度训练时间长，低精度效率高），进行多轮训练，全程约半小时（不含标签处理时间）。

模型使用：训练完成后会生成多个Lora模型，选择效果最佳的即可用于文生图创作。

三、AI Agent、Lang chain与Control Net辨析

（一）AI Agent：定义与应用

两大核心定义：

设计范式：将全部工作交给AI决策和执行，类似“智能代理”，适用于低复杂度、低决策维度的场景。

国内平台形态：以扣子、Dify为代表的智能体平台，核心价值是降低AI使用门槛——由专业人员编写提示词制作智能体，普通人无需懂提示词即可直接使用。

发展前景：未来几年智能体平台将持续发展，是普通人用上AI的核心方向。

（二）Lang chain：开发框架的核心认知

本质属性：基于Python的大模型开发框架，需通过代码调用（import相关方法），无拖拽式操作，对技术要求高。

现状与替代方案：2023年曾热门，但因架构臃肿，2024年后实际应用较少；目前企业多基于国内智能体平台（扣子、Dify）搭建Agent，而非从零编写Lang chain代码。

同类框架：Meta GPT、Agentic、Autogen（微软）、Autogpt，均为代码级开发工具，非专业技术人员无需深入学习。

（三）Control Net：AI绘画插件的核心作用

定位：仅用于Stable Diffusion、Flux的AI绘画插件，与AI Agent无任何关联。

核心功能：让AI生成图像时遵循特定约束，例如：

基于线稿涂色；

生成固定人物姿势的图像；

制作图片二维码（将二维码轮廓融入图像）。

四、AI项目经验：从0到1打造与面试应答

（一）零基础快速搭建AI项目

推荐平台：扣子智能体平台（无需代码基础，拖拽节点即可搭建）。

时间成本：学习+搭建共1天（熟练后半天可完成），可快速落地一个具体场景的AI产品（如智能客服、文案生成器），用于面试展示。

（二）模型选择的两大核心维度

模型特性匹配：

文案创作、营销内容：选择指令依从性强的第一梯队模型（如文心一言4.0、Deepseek 2.5）；

翻译、长文本处理：选择参数小但上下文支持长度长的模型（无需高推理能力，侧重信息承载）；

推理性任务：选择逻辑推理能力强的模型（如Deepseek 2.5，合并了code模型的推理能力）。

价格因素：国内模型价格较低，非长文本、高复杂度场景可选用小型模型降低成本。

（三）主流模型版本与更新动态

模型名称	最新版本	核心更新能力
文心一言	4.0	后续停止模型更新，专注应用落地
Deepseek	2.5	合并code与chat模型，推理能力+语言理解能力双提升
Kimi	-	即将全量开放200万上下文，支持缓存定价、自动选模型，灰度测试多模态能力
星火	4.0特宝	新增视觉识别、音图视频生成能力
GLM	plus/4V	新增视觉理解能力，版本众多，适配场景丰富（需查看官网bigmodel.cn）

（四）项目难点与解决方案（面试重点）

核心难点：提示词调优（大模型易生成不符合预期的内容）。

应答策略（零基础可直接参考）：

用JSON模式约束输出：通过JSON格式定义输出结构，无需过多示例即可让大模型输出可控内容，同时便于下游环节提取信息（替代传统正则表达式）；

优化提示词撰写：运用“输出推理过程、添加分隔符、提供示例、结构化要求”等提示词范式，解决大模型输出死板、幻觉、不听话等问题。

五、AI项目效果评估与优化

（一）不同范式项目的评估指标（无算法指标！）

Embedding式项目（关键信息提取类）：评估输出信息的可靠性、下游节点可用性（即提取的关键信息是否准确，能否直接用于后续流程）；

Copilot式项目（伴随式工具，如文档续写）：评估唤醒次数（用户是否主动使用，反映工具实用性）；

Agent式项目（托管式任务，如自动生成报告）：评估调度准确性（是否拆分清楚任务环节）、最终输出质量（能否独立完成任务）。

（二）项目优化的三大实用方向

增加过程指标监控：类似产品埋点，统计AI的执行环节数据，对比预期效果进行调整；

竞品学习：定期刷Product Hunt，参考同类AI产品的设计思路和迭代方向；

提示词版本管理：建立提示词迭代记录，监控输入输出效果，持续优化提示词质量。

六、AI创业与商业模式相关面试题应答

（一）“用GPT创业”的应答误区与正确思路

误区纠正：GPT是产品而非创业工具，且国内禁止使用，面试时需指出“国内创业应选用Kimi、Deepseek等合规模型”；

核心立场：不建议创业（创业门槛高、风险大，面试中体现稳定性），转而分享看好的AI业务方向（结合面试公司业务场景最佳）。

（二）热门AI业务方向与壁垒

智能客服场景：壁垒在于知识库拆分精度和提示词调优（相同知识库+不同提示词=不同输出效果）；

内容营销场景：壁垒在于用户认知差（80%用户无法区分60分与80分的AI生成内容，可快速抢占下沉市场）。

（三）未来商业模式与产品策略前景

短期（3年内）：智能体平台（如扣子）——降低AI使用门槛，让普通人用上AI；

长期（2年以上）：智能体驱动的“新型劳动力”——AI创造能独立执行任务的智能体，替代部分人工，提升生产力。

七、大厂大模型业务布局分析（面试参考）

公司	优势	不足
字节	全场景布局、人力/资本/流量投入大；视频模型为核心	语言模型相对薄弱，可落地场景仍在探索
阿里	通义大模型参数与可用性强；应用场景丰富（淘系、办公）	暂无明显不足
百度	投入早、数据语料丰富（搜索引擎优势）；场景适配文字类内容	模型体验不及宣传；智能体项目产品力弱（对比字节扣子）
腾讯	社交生态衍生大量场景；内容资源丰富	投入力度不足，除混元模型外无过多实际动作

八、AI技术趋势学习方法（零基础适用）

（一）核心信息渠道

社群：加入各类AI相关社群，获取聚焦讨论和前沿动态；

优质社区：极客社区（AI探索站、人工智能小组）——国内AI信息密度最高、质量最优；

一手信源：X（原推特）——大厂前沿信息首发平台；

聚合工具：付费AI周刊（如AIGC Weekly）、Fold APP（AI信源聚合）、RSS订阅。

（二）高效学习方法

固定时间：每周至少半天集中学习，避免碎片化浏览；

实践优先：看完资讯后，必须注册体验提到的AI应用（哪怕仅体验Demo），直观感受技术落地效果。

九、To B与To C AI产品的核心区别

对比维度	To C AI产品	To B AI产品
应用价值	必须解决具体问题，有明确体验提升（用户需感知AI价值）	可仅提供“AI赋能”名义价值，无需实际解决问题
容错率	较高（用户可接受少量错误，如Kimi聊天出错）	极低（企业级应用不允许错误，否则影响业务）
可控性	一键操作，控制维度少（如仅1个输入框/按钮）	需开放多参数控制（如temperature、top P、JSON mode等）
用户感知	无感知AI存在（体验提升但无需操作AI）	明确展示AI功能，开放系统级配置权限
示例	豆包AI、Flomo（AI辅助笔记）	Notion（多参数配置）、企业级智能客服平台