又模拟面试了一次:

1、为什么转专业?大一结束不能转吗?
2、哈希冲突的解决方法?
3、lora的本质为什么会有效?因为QKV矩阵本质上都是低阶的
4、秩是什么意思? 极大线性无关组
5、为什么会过拟合? 本质的原因是什么? 模型规模过大,改进的方法也是要降低模型的规模
6、梯度消失和梯度爆炸的本质的原因是什么?  链式法则
7、创新点?
8、代码量多少?做了多久?1000多行,半年左右
9、MLP 英语全程是什么?Multilayer Perception(多层感知机)
10、交叉熵损失公式是什么?-plogp
11、Adam/SGD优化器 区别,本质上 ? 哪个效果好?
12、Transformer 优缺点?
    后续针对这些缺点:有哪些改进?模型结构上的改进?moe、GQA
13、c语言里面函数指针、指针函数;
14、强化学习了解吗?
    强化学习: 没有标准答案,但有“奖惩”机制,模型通过不断试错,学习如何做出能获得最多奖励的决策。

函数指针
指向“函数”的指针变量,本质是存储函数地址。可用于回调、函数参数传递等。
指针函数
返回值是“指针”的函数。

人工智能

问题1:什么是人工智能?有哪四种定义?

答案:
人工智能有四种定义:

维度 标准 核心思想
类人行为 图灵测试 机器能否像人一样行动
类人思考 认知建模 机器能否像人一样思考
理性思考 思维法则 机器能否进行正确推理
理性行为 理性智能体 机器能否做正确的事

问题4:强人工智能和弱人工智能有什么区别?

答案:

  • 弱人工智能(狭义AI):专注于特定任务,如人脸识别、下棋、语音助手。当前所有AI都属于此类。

  • 强人工智能(通用AI):具有人类水平的通用智能,能理解、学习、应用于任何领域。目前尚未实现。

  • 超人工智能:超越人类智能的AI,目前属于理论探讨。

问题5:什么是智能体?智能体由什么构成?

答案:
智能体(Agent):能够感知环境并通过执行器作用于环境的任何实体。

结构:智能体 = 架构(Architecture)+ 程序(Program)

  • 感知(Perceive):通过传感器获取环境信息

  • 推理(Reason):处理信息做出决策

  • 行动(Act):通过执行器影响环境

问题6:理性智能体的定义是什么?理性的衡量标准是什么?

答案:
理性智能体:在给定的感知序列和环境知识下,选择最大化性能度量期望值的行动。

衡量标准(PEAS框架)

  • P(Performance Measure):性能度量(目标)

  • E(Environment):环境

  • A(Actuators):执行器

  • S(Sensors):传感器

理性不等同于完美:理性基于已知信息,完美需要全知全能。

问题14:模拟退火算法的工作原理是什么?

答案:
模拟退火模拟金属退火过程:

  1. 初始温度T:设置较高初始温度

  2. 随机移动:随机选择邻域状态

  3. 接受准则

    • 如果新状态更好 → 接受

    • 如果新状态更差 → 以概率 e^(-ΔE/T) 接受

  4. 降温:按照退火计划降低温度

  5. 终止:温度降到0时结束

特点:高温时接受较差解,低温时趋向最优解。理论上,足够慢的降温速度可保证找到全局最优。

问题18:AlphaGo使用了哪些关键技术?

答案:
AlphaGo的核心技术

  1. 蒙特卡罗树搜索(MCTS):搜索框架

  2. 策略网络(Policy Network)

    • 监督学习:学习人类棋谱

    • 强化学习:自我对弈提升

  3. 价值网络(Value Network):评估局面胜率

  4. 快速走子策略(Rollout Policy):快速模拟到终局

AlphaZero改进

  • 不使用人类棋谱,纯自我对弈

  • 策略网络和价值网络共享网络架构

  • 适用于围棋、象棋、将棋等多种游戏

问题25:什么是概率编程?有哪些应用?

答案:
概率编程:将概率模型和编程语言结合,自动进行概率推理。

特点

  • 声明式建模:用户定义概率模型

  • 自动推理:系统自动进行贝叶斯推理

  • 灵活组合:支持复杂模型构建

监督学习有标签指导,无监督学习没有标签让模型自己发现规律。但两者都需要模型"自己跑"——核心区别在于有没有标签作为学习目标

问题30:卷积神经网络(CNN)的核心组件有哪些?

答案:
CNN核心组件

  1. 卷积层

    • 使用卷积核提取局部特征

    • 参数共享,减少参数量

    • 输出特征图

  2. 池化层

    • 最大池化、平均池化

    • 降维,保持平移不变性

    • 减少计算量

  3. 激活函数

    • ReLU:f(x)=max(0,x)

    • 引入非线性

  4. 全连接层;最终分类或回归

  5. 经典架构:LeNet、AlexNet、VGG、ResNet

对比项 FFN MLP
全称 Feed-Forward Network Multilayer Perceptron
中文 前馈网络 多层感知机
本质 相同 相同
结构 全连接层 + 激活函数 全连接层 + 激活函数
区别 命名角度不同 命名角度不同

简单说:FFN ≈ MLP,是同一个东西的不同叫法。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐