第3章概率与统计：随机变量及其分布——从事件到量化描述

华夏之光永存

222人浏览 · 2026-03-14 23:47:08

华夏之光永存 · 2026-03-14 23:47:08 发布

第3章概率与统计：随机变量及其分布——从事件到量化描述

一、为什么要引入随机变量

前两章我们用集合、事件、概率描述随机现象，逻辑严谨，但有一个明显局限：

事件多是文字描述（正面、反面、点数为偶、下雨、不下雨）；
不方便计算、比较、建模、做工程。

我们需要把“随机结果”变成数，用数学工具统一处理。
这就是随机变量的意义：
把随机事件数量化，让概率论真正变成可计算的数学体系。

二、随机变量的定义

设 $Ω\Omega$ 为样本空间，若对每一个结果 $ω∈Ω\omega\in\Omega$ ，都唯一对应一个实数 $X(ω)X(\omega)$ ，则称
$X=X(\omega)$
为随机变量。

通俗理解：

随机试验的结果是“不确定的东西”；
随机变量就是给它贴一个数字标签；
之后我们只研究这个数字的规律，不再管原来的具体事件。

常用大写字母 $X,Y,Z,…X,Y,Z,\dots$ 表示随机变量，小写字母 $x,y,z,…x,y,z,\dots$ 表示它取的具体值。

三、离散型随机变量与分布律

1. 定义

若随机变量 $X$ 的所有可能取值为有限个或可列无限个（可以一个一个数完），称为离散型随机变量。

例如：

抛硬币：正面=1，反面=0；
掷骰子点数：1,2,3,4,5,6；
某时间段内接到的电话数：0,1,2,…

2. 分布律（概率分布）

设 $X$ 的可能取值为 $x1,x2,…x_1,x_2,\dots$ ，且
$P(X=x_k)=p_k,\quad k=1,2,\dots$
满足：

$pk≥0p_k\ge 0$
$∑kpk=1\sum\limits_k p_k=1$

称 ${p_k\}$ 为 $X$ 的分布律。
它完整描述了离散型随机变量的全部概率规律。

四、常见离散型分布

1. 0–1分布（两点分布）

只取两个值：0 或 1。
$P(X=1)=p,\quad P(X=0)=1-p,\quad 0<p<1$
适用：一次试验只有两种结果（成功/失败、合格/不合格、是/否）。

2. 二项分布 $X∼B(n,p)X\sim B(n,p)$

$n$ 次独立重复试验，每次成功概率 $p$ ，成功总次数为 $X$ ：
$P(X=k)=\binom{n}{k}p^k(1-p)^{n-k},\quad k=0,1,\dots,n$

3. 泊松分布 $X∼P(λ)X\sim P(\lambda)$

描述单位时间/空间内稀有事件发生次数：
$P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!},\quad k=0,1,2,\dots$
$λ>0\lambda>0$ 为均值。

五、连续型随机变量与概率密度

1. 定义

若随机变量 $X$ 的取值充满某个区间，不可一一列举，且存在非负函数 $f (x)$ ，使得对任意区间 $(a, b]$ ：
$P(a<X\le b)=\int_a^b f(x)\,dx$
称 $X$ 为连续型随机变量， $f (x)$ 为概率密度函数，简称密度。

2. 密度的性质

$f(x)≥0f(x)\ge 0$
$dx=1\int_{-\infty}^{+\infty}f(x)\,dx=1$

直观理解：

密度 $f (x)$ 不直接是概率；
面积才是概率：区间上曲线下面积 = 随机变量落在该区间的概率。

重要结论：
连续型随机变量取单点值的概率为 0：
$P(X=x_0)=0$
因此连续型中：
$P(a\le X\le b)=P(a<X<b)=P(a\le X<b)$

六、常见连续型分布

1. 均匀分布 $X∼U(a,b)X\sim U(a,b)$

在区间 $[a, b]$ 上“等可能”：
$\begin{cases} \displaystyle\frac{1}{b-a},&a\le x\le b\\ 0,&\text{其他} \end{cases}$

2. 指数分布 $X∼E(λ)X\sim E(\lambda)$

描述寿命、等待时间、间隔时间：
$\begin{cases} \lambda e^{-\lambda x},&x\ge 0\\ 0,&x<0 \end{cases}$
$λ>0\lambda>0$ 。

3. 正态分布 $X∼N(μ,σ2)X\sim N(\mu,\sigma^2)$

自然界、测量误差、大量随机因素叠加最常见分布：
$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},\quad x\in\mathbb{R}$

$μ\mu$ ：位置参数（中心）
$σ\sigma$ ：尺度参数（分散程度）

标准正态分布： $μ=0,σ=1\mu=0,\sigma=1$ ，记为 $N (0, 1)$ 。

七、分布函数（统一描述：离散+连续）

1. 定义

对任意随机变量 $X$ ，定义
$F(x)=P(X\le x),\quad x\in\mathbb{R}$
为 $X$ 的分布函数。

2. 统一意义

离散型：
$F(x)=\sum_{x_k\le x}p_k$
连续型：
$F(x)=\int_{-\infty}^x f(t)\,dt$
且在 $f (x)$ 连续点：
$F^{'} (x) = f (x)$

3. 性质

$F (x)$ 单调不减；
$0≤F(x)≤10\le F(x)\le 1$ ；
右连续；
$F(+∞)=1F(-\infty)=0,\ F(+\infty)=1$ 。

分布函数是唯一能统一描述所有随机变量的工具。

八、本章总结

本章完成了概率论的关键一步：事件→数量→函数：

随机变量：把随机结果数字化；
离散型用分布律，连续型用密度；
分布函数统一离散与连续；
0–1、二项、泊松、均匀、指数、正态是全领域最常用的基础模型。

从本章开始，概率论真正进入可计算、可建模、可工程化阶段。

下一章我直接写：

第4章概率与统计：多维随机变量——联合、边缘与条件关系

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

2026金三银四求职指南：大模型应用AI开发工程师技能图谱与职业突围策略

AtomGit开源社区

图像算法工程师面试宝典

定义：以矩阵形式展示模型的预测结果，行代表真实标签，列代表预测标签，核心包含4类结果： - 真阳性（TP）：实际正、预测正 - 真阴性（TN）：实际负、预测负 - 假阳性（FP）：实际负、预测正（误判） - 假阴性（FN）：实际正、预测负（漏判）作用：直观展示模型误分类情况，可通过矩阵计算精确率、召回率等所有指标。分类： - 训练后量化：无需重训练，简单快捷 - 量化感知训练：精度损失更小，效果