倒数第二天




又模拟面试了一次:
1、为什么转专业?大一结束不能转吗?
2、哈希冲突的解决方法?
3、lora的本质为什么会有效?因为QKV矩阵本质上都是低阶的
4、秩是什么意思? 极大线性无关组
5、为什么会过拟合? 本质的原因是什么? 模型规模过大,改进的方法也是要降低模型的规模
6、梯度消失和梯度爆炸的本质的原因是什么? 链式法则
7、创新点?
8、代码量多少?做了多久?1000多行,半年左右
9、MLP 英语全程是什么?Multilayer Perception(多层感知机)
10、交叉熵损失公式是什么?-plogp
11、Adam/SGD优化器 区别,本质上 ? 哪个效果好?
12、Transformer 优缺点?
后续针对这些缺点:有哪些改进?模型结构上的改进?moe、GQA
13、c语言里面函数指针、指针函数;
14、强化学习了解吗?
强化学习: 没有标准答案,但有“奖惩”机制,模型通过不断试错,学习如何做出能获得最多奖励的决策。
函数指针
指向“函数”的指针变量,本质是存储函数地址。可用于回调、函数参数传递等。
指针函数
返回值是“指针”的函数。
人工智能
问题1:什么是人工智能?有哪四种定义?
答案:
人工智能有四种定义:
| 维度 | 标准 | 核心思想 |
|---|---|---|
| 类人行为 | 图灵测试 | 机器能否像人一样行动 |
| 类人思考 | 认知建模 | 机器能否像人一样思考 |
| 理性思考 | 思维法则 | 机器能否进行正确推理 |
| 理性行为 | 理性智能体 | 机器能否做正确的事 |
问题4:强人工智能和弱人工智能有什么区别?
答案:
-
弱人工智能(狭义AI):专注于特定任务,如人脸识别、下棋、语音助手。当前所有AI都属于此类。
-
强人工智能(通用AI):具有人类水平的通用智能,能理解、学习、应用于任何领域。目前尚未实现。
-
超人工智能:超越人类智能的AI,目前属于理论探讨。
问题5:什么是智能体?智能体由什么构成?
答案:
智能体(Agent):能够感知环境并通过执行器作用于环境的任何实体。
结构:智能体 = 架构(Architecture)+ 程序(Program)
-
感知(Perceive):通过传感器获取环境信息
-
推理(Reason):处理信息做出决策
-
行动(Act):通过执行器影响环境
问题6:理性智能体的定义是什么?理性的衡量标准是什么?
答案:
理性智能体:在给定的感知序列和环境知识下,选择最大化性能度量期望值的行动。
衡量标准(PEAS框架):
-
P(Performance Measure):性能度量(目标)
-
E(Environment):环境
-
A(Actuators):执行器
-
S(Sensors):传感器
理性不等同于完美:理性基于已知信息,完美需要全知全能。
问题14:模拟退火算法的工作原理是什么?
答案:
模拟退火模拟金属退火过程:
-
初始温度T:设置较高初始温度
-
随机移动:随机选择邻域状态
-
接受准则:
-
如果新状态更好 → 接受
-
如果新状态更差 → 以概率 e^(-ΔE/T) 接受
-
-
降温:按照退火计划降低温度
-
终止:温度降到0时结束
特点:高温时接受较差解,低温时趋向最优解。理论上,足够慢的降温速度可保证找到全局最优。
问题18:AlphaGo使用了哪些关键技术?
答案:
AlphaGo的核心技术:
-
蒙特卡罗树搜索(MCTS):搜索框架
-
策略网络(Policy Network):
-
监督学习:学习人类棋谱
-
强化学习:自我对弈提升
-
-
价值网络(Value Network):评估局面胜率
-
快速走子策略(Rollout Policy):快速模拟到终局
AlphaZero改进:
-
不使用人类棋谱,纯自我对弈
-
策略网络和价值网络共享网络架构
-
适用于围棋、象棋、将棋等多种游戏
问题25:什么是概率编程?有哪些应用?
答案:
概率编程:将概率模型和编程语言结合,自动进行概率推理。
特点:
-
声明式建模:用户定义概率模型
-
自动推理:系统自动进行贝叶斯推理
-
灵活组合:支持复杂模型构建
监督学习有标签指导,无监督学习没有标签让模型自己发现规律。但两者都需要模型"自己跑"——核心区别在于有没有标签作为学习目标。
问题30:卷积神经网络(CNN)的核心组件有哪些?
答案:
CNN核心组件:
-
卷积层:
-
使用卷积核提取局部特征
-
参数共享,减少参数量
-
输出特征图
-
-
池化层:
-
最大池化、平均池化
-
降维,保持平移不变性
-
减少计算量
-
-
激活函数:
-
ReLU:f(x)=max(0,x)
-
引入非线性
-
-
全连接层;最终分类或回归
-
经典架构:LeNet、AlexNet、VGG、ResNet
| 对比项 | FFN | MLP |
|---|---|---|
| 全称 | Feed-Forward Network | Multilayer Perceptron |
| 中文 | 前馈网络 | 多层感知机 |
| 本质 | 相同 | 相同 |
| 结构 | 全连接层 + 激活函数 | 全连接层 + 激活函数 |
| 区别 | 命名角度不同 | 命名角度不同 |
简单说:FFN ≈ MLP,是同一个东西的不同叫法。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)