人工智能发展漫谈：从专家系统到AIGC，再探深度学习核心与Pytorch入门

郝学胜-神的一滴

230人浏览 · 2026-03-15 10:00:00

郝学胜-神的一滴 · 2026-03-15 10:00:00 发布

人工智能发展漫谈：从专家系统到AIGC，再探深度学习核心与Pytorch入门

一、AI发展四阶段：从“听专家的话”到“AI生成一切”
二、深度学习核心拆解：从感知机到反向传播，读懂底层逻辑
三、深度学习与机器学习：厘清关系，掌握核心差异
四、深度学习框架入门：Pytorch的核心基础
五、写在最后：AI的发展，永无止境

✨ 人工智能的发展犹如一场跨越数十年的科技远征，从早期的专家经验驱动，到机器学习的统计规律探索，再到深度学习的神经网络突破，直至如今AIGC的万物生成时代，每一个阶段都镌刻着技术的迭代与创新。本文将沿着AI的发展脉络，拆解核心技术节点，解析深度学习的关键原理，并初探当下主流的深度学习框架Pytorch，带你沉浸式感受AI技术的魅力与精髓。✨

一、AI发展四阶段：从“听专家的话”到“AI生成一切”

人工智能的发展并非一蹴而就，而是历经了四次关键的浪潮迭代，每一次浪潮都因核心技术的突破，推动AI向更智能、更实用的方向迈进。这四个阶段层层递进，从依赖人类专家经验，到机器自主学习规律，再到神经网络的深度挖掘，最终迎来了AIGC的全民化应用时代。

🔹 第一阶段：专家系统主导，经验为王

这是AI发展的启蒙阶段，核心逻辑是**“听行业专家的话，按专家的经验行事”**。彼时的AI技术尚未具备自主学习能力，所有的决策和判断都依托于行业内资深专家总结的规则和经验，构建成对应的专家系统来解决特定领域问题。

就像网络上热议的“上海公园大爷炒股”的趣事：大爷被股票套牢后，凭借自己的“经验”预测上证指数能突破5000点甚至6000点，声称“闭着眼睛买股票都能赚一倍”，不少人听信后买入，结果大爷解套离场，众多股民被深套。这个例子虽非真正的“专家行为”，但生动诠释了早期AI“以专家经验为核心”的底层逻辑——真正的专家系统，依托的是经过验证、专业度极高的行业专家知识，而非主观臆断的经验。

这一阶段也诞生了AI领域的经典里程碑——图灵测试。图灵测试的核心是：将测试者与被测试者（人或机器）分隔开，测试者通过键盘向对方提问，根据回答判断对方是人还是机器，若机器的回答让测试者的误判率超过30%，则认为机器通过测试。为纪念图灵的贡献，计算机界的最高奖项被命名为图灵奖，而坊间也流传着苹果手机的“缺角苹果”图标是为纪念图灵的佳话。

🔹 第二阶段：机器学习崛起，统计寻规律

1962年，IBM研发的跳棋程序战胜人类高手，标志着AI进入机器学习阶段，这也是AI发展的第二次浪潮。此阶段的核心是用统计模型解决问题，摆脱了对人类专家经验的绝对依赖，让机器学会从海量数据中自主寻找公式、挖掘规律。

简单来说，机器学习的逻辑是：给机器投喂大量的标注数据，机器通过算法对数据进行训练，拟合出适合的模型，当新的数据输入时，模型就能依据学习到的规律做出判断和预测。这一阶段的AI，开始具备了“自主学习”的雏形，也是后续深度学习发展的重要基础。

🔹 第三阶段：神经网络爆发，深度学习开天辟地

2012年是深度学习的元年，AlexNet的诞生成为深度学习的开山之作，而2016年阿尔法狗（AlphaGo）战胜世界级围棋高手李世石，更是让深度学习彻底走进大众视野，AI发展迎来第三次浪潮。

AlexNet是经典的卷积神经网络（CNN），在ImageNet图像识别挑战赛中取得了颠覆性的成绩，让卷积神经网络成为计算机视觉领域的核心模型。而阿尔法狗之所以能战胜人类围棋高手，核心在于其采用了深度学习中的强化学习思路——寻求最短路径，获取最大奖励。围棋的棋局变化无穷，人类高手最多能预判几十步，而计算机凭借超强的算力，能预判成千上万步，通过强化学习不断优化走棋策略，最终战胜人类。

这一阶段的核心是神经网络，通过构建多层的神经元网络，模拟人类大脑的思考方式，让机器能对复杂数据进行深度挖掘和分析，处理能力较机器学习阶段实现了质的飞跃。

🔹 第四阶段：Transformer问世，AIGC时代来临

随着自然语言处理（NLP） 领域的核心模型Transformer的出现，AI正式迈入AIGC（AI Generated Content）时代，这也是我们当下所处的阶段。AIGC即AI生成内容，核心是让AI根据用户的指令，自动生成文本、图像、视频、音频等各类内容，实现“AI生成万事万物”。

AIGC的本质是Transformer模型带来的自然语言理解与生成能力的突破，如今我们日常使用的豆包、DeepSeek等智能问答系统，是文本生成的典型应用；而文生图的Midjourney、Stable Diffusion，文生视频的Runway等，更是让AIGC的应用场景无限拓展。可以说，AIGC让人工智能从“辅助决策”走向了“主动创造”，真正融入了大众的工作和生活。

📊 AI发展四阶段核心信息汇总表

发展阶段	核心技术	里程碑事件	核心能力
专家系统阶段	专家经验规则	图灵测试提出、图灵奖设立	依托专家经验解决特定领域问题
机器学习阶段	统计模型、传统算法	1962年IBM跳棋程序战胜人类高手	从海量数据中挖掘统计规律
神经网络阶段	深度学习、卷积神经网络/强化学习	2012年AlexNet问世、2016年阿尔法狗战胜李世石	模拟人脑神经元，深度挖掘复杂数据规律
AIGC阶段	Transformer、自然语言处理	各类文生图/文生视频/智能问答产品落地	AI自主生成文本、图像、视频等多元内容

二、深度学习核心拆解：从感知机到反向传播，读懂底层逻辑

深度学习是当下AI技术的核心，而其发展也历经了从早期感知机的雏形，到反向传播（BP） 算法的突破，再到算力提升后的全面复兴。想要读懂深度学习，就必须从其底层的神经元模型和核心算法入手，理解“正向传播”与“反向传播”的核心逻辑。

🔹 早期雏形：感知机的局限

20世纪40年代，科学家开始模仿人类生物神经系统的神经元，研发出了深度学习的早期雏形——感知机。感知机的核心是模拟神经元的信号传递，实现简单的分类和判断，但它存在一个致命的局限：只能正向传播，无法反向更新参数。

正向传播是指数据从输入层进入，经隐藏层处理后传递到输出层，最终得到结果，但感知机无法根据输出结果的误差，对网络中的权重和偏置进行调整，导致模型的拟合效果极差，无法处理复杂的数据分析任务。这一局限，也让早期的神经网络发展陷入了瓶颈。

🔹 关键突破：反向传播（BP）算法

1986年，反向传播（Back Propagation，BP） 算法的发表，成为深度学习发展的关键转折点，解决了感知机“无法更新参数”的核心问题。反向传播是深度学习中最核心的算法之一，也是面试中的高频考点，其与正向传播相辅相成，构成了深度学习模型训练的核心逻辑。

🧠 正向传播与反向传播的核心流程（Mermaid流程图）

图表说明：该流程图展示了深度学习模型训练的闭环过程，正向传播实现“数据输入到结果输出”，反向传播实现“基于误差优化参数”，二者反复迭代，让模型的预测结果越来越接近真实值，拟合效果不断提升。

核心概念解析

加权求和：神经元的核心计算逻辑，公式为y = WX + b（W为权重，X为输入特征，b为偏置）。以一个简单的神经元为例，若有5个输入特征，则需要5个权重（W1-W5）+1个偏置（b），共6个参数，参数的数量随输入特征和网络层数的增加而指数级增长（如1.5B模型即拥有15亿个参数）。
正向传播：数据从输入层出发，经隐藏层逐层进行“加权求和+激活函数”处理，最终传递到输出层得到预测结果的过程，是“从因到果”的计算过程。
反向传播：当正向传播得到预测结果后，计算预测结果与真实结果的损失值，再从输出层向输入层逆向传播，基于损失值对每一层的权重（W）和偏置（b）进行更新调整的过程，是“从果溯因”的优化过程。

简单来说，反向传播的核心是“更新权重”，通过反复的“正向传播算结果→算损失→反向传播更参数”，让模型的参数越来越接近正确值，最终实现模型的精准拟合。

反向传播的发展瓶颈：算力不足

尽管1986年反向传播算法就已问世，但在当时并未掀起热潮，核心原因只有两个字：算力。人工智能的发展离不开三大要素：数据+算法+算力，彼时的计算机算力极低，无法支撑大规模神经网络的训练，且对图像、语音等复杂数据的处理能力薄弱，因此深度学习在当时并未得到广泛应用，机器学习仍占据主流地位。

🔹 深度学习的复兴：算力提升+技术突破

进入21世纪后，计算机算力实现了跨越式提升，显卡、云计算等技术的发展，为深度学习的训练提供了强大的算力支撑，深度学习迎来了全面复兴：

2012年，AlexNet卷积神经网络在ImageNet图像识别挑战赛中取得颠覆性成绩，让CNN（卷积神经网络） 成为计算机视觉领域的核心模型；
后续NLP（自然语言处理） 技术的突破，推动了Transformer模型的诞生，最终促成了AIGC时代的来临。

算力的提升，让深度学习终于能发挥其处理复杂数据的优势，成为当下AI技术的核心支柱。

三、深度学习与机器学习：厘清关系，掌握核心差异

很多初学者会混淆深度学习和机器学习的概念，其实二者是包含与被包含的关系，深度学习是机器学习的进阶版本，二者的核心差异在于特征工程的处理方式。下面我们从关系、差异、深度学习特点和应用场景四个维度，彻底厘清二者的区别与联系。

🔹 核心关系：机器学习 ⊃ 深度学习

深度学习并非独立于机器学习的技术，而是机器学习的重要分支，是机器学习在神经网络、算力支撑下的进阶形态。简单来说，机器学习是“大概念”，深度学习是“小概念”，深度学习的所有技术都属于机器学习的范畴。

🔹 核心差异：特征工程由人还是机器处理

特征工程是指将原始数据转化为适合模型训练的特征的过程，是机器学习/深度学习模型训练的关键步骤，而这也是二者最核心的差异：

机器学习：特征工程由人工处理。需要工程师凭借专业知识和经验，对原始数据进行清洗、筛选、提取，构建适合模型训练的特征，人工成本高，且特征的质量直接决定模型效果；
深度学习：特征工程由算法自动提取。模型能通过神经网络，从原始数据中自主挖掘、提取有效特征，无需人工干预，能处理更复杂的原始数据（如图像、语音、文本），是其相较于传统机器学习的核心优势。

🔹 深度学习的四大核心特点

深度学习之所以能处理复杂数据、实现精准拟合，源于其四大核心特点，其中自动提取特征和可解释性差是最核心的两个特点，也是必须掌握的考点：

深层非线性框架：通过构建多层神经元网络，引入激活函数实现非线性映射，能拟合复杂的非线性数据规律；
自动提取特征：无需人工处理特征工程，模型自主从原始数据中提取有效特征，适配复杂数据场景；
依赖大数据和计算能力：网络层数深、参数数量大，需要海量的训练数据和强大的算力支撑；
可解释性差：深度学习模型被称为“黑箱模型”，只能得到预测结果，无法清晰解释“为什么得到这个结果”，这也是其现阶段的主要局限。

🔹 深度学习的四大核心应用场景

深度学习的应用场景已覆盖各行各业，核心可总结为四大类，涵盖了计算机视觉、自然语言处理、推荐系统和多模态融合等多个领域：

计算机视觉（CV）：基于CNN等模型，实现图像识别、目标检测、人脸识别、图像生成等功能，应用于安防、自动驾驶、医疗影像等领域；
自然语言处理（NLP）：基于Transformer、RNN等模型，实现文本分类、机器翻译、智能问答、文本生成等功能，是AIGC的核心应用领域；
推荐系统：通过挖掘用户的行为数据，实现个性化的内容推荐，应用于电商、短视频、资讯平台等；
多模态大模型：融合文本、图像、音频、视频等多种数据类型，实现跨模态的理解和生成，是当下AI发展的主流方向。

📌 常见深度学习模型速记

模型类型	核心应用领域	处理数据类型
CNN（卷积神经网络）	计算机视觉（CV）	图像、视频等视觉数据
NLP/ RNN（循环神经网络）	自然语言处理	文本、语音等序列数据

四、深度学习框架入门：Pytorch的核心基础

掌握了深度学习的核心原理后，就需要通过深度学习框架将理论落地为实际代码，Pytorch是当下最主流的深度学习框架之一，基于Python语言开发，简洁易用、灵活性高，成为科研和工业界的首选框架。接下来我们来了解Pytorch的核心基础信息。

🔹 Pytorch的核心定义

Pytorch是基于Python语言的开源深度学习框架，由Facebook人工智能研究院（FAIR）研发，兼具灵活性和高效性：一方面，Python的语法让Pytorch的代码编写简洁易懂，适合初学者入门；另一方面，Pytorch支持GPU加速训练，能高效处理大规模的神经网络训练任务。

🔹 Pytorch的核心数据结构：张量（Tensor）

Pytorch的核心是将所有数据封装成张量（Tensor），张量是Pytorch中最基本的数据结构，类似于Python中的列表、Numpy中的数组，但张量支持GPU加速计算，是深度学习模型训练的核心数据载体。

简单来说，张量是多维数组，可以表示标量（0维）、向量（1维）、矩阵（2维）和更高维的数组（如3维的图像数据、4维的视频数据）。在Pytorch中，所有的特征数据、模型参数、中间计算结果，都是以张量的形式存在的。

🌟 核心代码：Pytorch张量的简单创建


# 导入Pytorch库
import torch

# 创建标量（0维张量）
scalar = torch.tensor(5)
# 创建向量（1维张量）
vector = torch.tensor([1, 2, 3, 4, 5])
# 创建矩阵（2维张量）
matrix = torch.tensor([[1, 2], [3, 4]])
# 创建随机初始化的3维张量（模拟图像数据：通道数×高度×宽度）
tensor_3d = torch.randn(3, 224, 224)

# 打印张量及维度
print("标量：", scalar, "，维度：", scalar.dim())
print("向量：", vector, "，维度：", vector.dim())
print("矩阵：", matrix, "，维度：", matrix.dim())
print("3维张量：", tensor_3d.shape)

代码说明：上述代码展示了Pytorch中不同维度张量的创建方式，包括标量、向量、矩阵和模拟图像的3维张量，同时通过dim()和shape方法查看张量的维度和形状，是Pytorch入门的基础操作。

Pytorch的核心功能围绕张量展开，包括张量的运算、求导、GPU迁移等，掌握张量的基本操作，是学习Pytorch的第一步。后续还将学习基于Pytorch构建神经网络、实现模型训练和推理等核心内容，让深度学习的理论真正落地。

五、写在最后：AI的发展，永无止境

从专家系统到AIGC，从感知机到反向传播，从机器学习到深度学习，人工智能的发展跨越了数十年，每一个阶段的突破，都离不开科学家的探索、算力的提升和数据的积累。如今的AIGC时代，让人工智能从实验室走进了大众生活，而Pytorch等深度学习框架，更是让普通人也能参与到AI的开发和应用中。

人工智能的发展从未停止，未来，随着多模态大模型、通用人工智能（AGI）的不断探索，AI将在更多领域实现突破，为人类的生产生活带来更多改变。而对于我们学习者而言，厘清AI的发展脉络，掌握深度学习的核心原理，熟练使用主流的深度学习框架，是走进AI世界的关键步骤。

技术的浪潮滚滚向前，唯有持续学习，才能紧跟AI发展的步伐，在这场科技远征中，找到属于自己的方向。🚀

在这里插入图片描述

我可以帮你将这篇博客拆解为AI发展阶段、深度学习核心、Pytorch入门三个独立的短博客，适配不同的发布场景，需要吗？

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

2026最新！专科生必备的降AI率工具 —— 千笔

AtomGit开源社区

基于模型预测控制(MPC)的微电网调度优化的研究（Python代码实现）

💥💥💞💞❤️❤️💥💥💥💥💞💞❤️❤️💥💥博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️行百里者，半于九十。

AtomGit开源社区

《硬件学习杂记B》成为AI时代更全面的自己

方波、直流电、噪声都是它的不同组合形式。单片机电路里到处都是正弦波的影子，但你肉眼在示波器上看到的主线，通常是方波和直流。如果电源是正弦波，单片机一会儿得电一会儿没电，早就重启甚至烧坏了。当你给单片机接上 3.3V 或 5V 电源时，理想情况下，电源输出的是一条。导线因为会有寄生电感，因而高频信号会优先选择电容这一路去走。任何一段电感，都是电阻+电感的组合体。电流和电容的公式如下，频率变化越大，则