数据库：关系运算整理大全（包括关系代数、元组关系演算、域关系演算）

Yushan_Ji

12887人浏览 · 2023-11-15 13:18:45

Yushan_Ji · 2023-11-15 13:18:45 发布

关系运算

关系运算包含
- 关系代数（relational algebra）：关系代数是一种过程化查询语言，通过描述对关系的运算来表达查询、获取数据
- 关系演算：非过程化查询语言，通过描述想要获取的数据的信息来获取数据（不需要给出运算过程）
  - 关系演算可以分为元组关系演算和域关系演算两种语言
为了方便用户查询处理关系数据，定义了结构化查询语言SQL 来操作处理关系数据

关系代数

关系代数定义了一个关系数据的运算的集合
关系运算以一个或者两个关系为输入；输出一个新的关系作为运算结果
关系是一个以元组为元素的多重集合（multiset）：可能包含重复元素
关系代数运算本质上是对多重集合的运算

基本关系代数运算

包括选择、投影、并、差、笛卡尔积和重命名（期中，选择、投影、重命名为一元运算，并、差、笛卡尔积为二元运算）

基本关系代数运算可以用来表达任何传统关系代数运算

选择

选择运算 $\sigma$ 可以从关系 $R$ 中获取满足条件的元组：
$\sigma_p(R)=\{t\mid t\in R\land p(t)=\text{True}\}$

$p$ 为选择谓词：

$p$ 是由逻辑运算符与 $\land$ 、或 $\lor$ 、非 $\lnot$ 连接的若干原子表达式构成的公式
原子表达式的形式为： $X\ \Box \ Y$
- $X, Y$ ：属性名、常量，或者函数值
- $\Box$ 为比较运算符，包括 $=\ >\ <\ \neq\ \leq\ \geq$

投影

投影运算 $\Pi$ 可以从关系 $R$ 中获取某些列组成新的关系：
$\Pi_{A_1,A_2,\ldots,A_k}(R)=\{t[A_1,A_2,\ldots,A_k]\mid t\in R\}$

$A_1,A_2,\ldots,A_k$ 为R中的属性列
返回R中元组在 $A_1,A_2,\ldots,A_k$ 列上的值
删除重复元组

并

并运算 $\cup$ 返回两个关系 $R$ 和 $S$ 中元组取并集的结果：
$R\cup S=\{t\mid t\in R\lor t\in S\}$

R和S中属性个数要相同
R和S中的属性应存在一一对应关系
R中每个属性的域和S中对应属性的域要相同

Union：去重

Union all：不去重

差

差运算 $-$ 返回在关系R中但是不在关系S中的元组集合：
$R-S=\{t\mid t\in R \land t\notin S\}$

R和S中属性个数要相同
R和S中的属性应存在一一对应关系
R中每个属性的域和S中对应属性的域要相同

笛卡尔积

笛卡尔积运算 $\times$ 返回关系R中元组和关系S中的元组做笛卡尔积的结果：
$R\times S=\{(t,q)\mid t\in R\ \land\ q\in S\}$

$(t, q)$ 为R中元组t和S中元组q拼接在一起得到的元组
$R\times S$ 中有 $|R|\times|S|$ 个元组

例如： $\text{instructor}\times\text{teaches}$

重命名

重命名运算 $\rho$ 将关系R重命名为关系S：
$\rho_{S(A_1,A_2,\dots,A_n)}(R)$

同时将各属性按照从左到右的顺序重命名为 $A_1,A_2,\ldots,A_n$
$\rho_{S}R$ ：只修改关系名，不修改属性名

附加关系代数运算

基本关系代数运算写出来的表达式比较冗长，因此定义了附加关系代数运算
附加关系代数运算是由基本关系代数运算导出的运算，可以简化表达式
附加关系代数运算和基本关系代数运算的表达能力相同

交

交运算 $\cap$ 返回两个关系R和S中元组取交集的结果：
$R\cap S=\{t\mid t\in R\land t\in S\}$

R和S中属性个数要相同
R和S中的属性应存在一一对应关系
R中每个属性的域和S中对应属性的域要相同

交运算可以通过差运算来表示： $R\cap S=R-(R-S)$

连接

连接运算 $\Join$ 返回关系R和S笛卡尔积运算结果中满足一定条件的元组：
$R\Join_{p}S=\{(t,q)\mid t\in R\land q\in S\land p(t,q)=\text{True}\}$

$p$ 为选择谓词

$p$ 是由逻辑运算符与 $\land$ 、或 $\lor$ 、非 $\lnot$ 连接的若干原子表达式构成的公式
原子表达式的形式为： $R.X\ \Theta\ S.Y$
- X是R的属性，Y是S的属性，X和Y所属域具有相同的数据类型
- $\Theta$ ：比较运算符，包括=、>、<、≥、≤、≠ （当 $\Theta$ 为=时，称为等值连接）

连接运算可通过组合笛卡尔积运算和选择运算来表示

自然连接
- 自然连接是一种特殊的等值连接
- 将连接条件指定为R和S中属性名相同的列做等值连接，因此p可省略
外连接：连接运算的扩展，可以处理缺失值
1. 左外连接（R⟕S）会保留左边关系R的所有元组，对于R中的元组，若在S中没有在同名属性上取值相同的元组，会用空值来填充S中的属性
2. 右外连接（R⟖S）会保留右边关系S的所有元组，对于S中在R中不存在同名属性上取值相同的元组，会用空值来填充R中的属性
3. 全外连接（R⟗S）的查询结果是左外连接和右外连接查询结果的并集

赋值

赋值运算 $\leftarrow$ 将右侧的关系代数表达式结果赋值给左侧的关系变量： $T\leftarrow E$

T为临时关系变量
E为关系代数表达式

例如：

对学生表和学生选课表进行连接运算，连接的条件为学生表中的Sno列和学生选课表中的Sno列的值相等，并将连接结果赋值给关系变量result
$\begin{aligned} & temp\leftarrow Student\times SC\\ & result\leftarrow \sigma_{Student.Sno=SC.Sno}(temp) \end{aligned}$

除

设 $R(A_1,A_2,\dots,A_m,B_1,B_2,\dots,B_n)$ 和 $S(B_1,B_2,\dots,B_n)$ 是两个关系，则 $R\div S$ 的属性为 $A_1,A_2,…,A_m$ ，且：

$R\div S=\{t\mid t\in \Pi_{A_1,A_2,\dots,A_n}(R)\land (\forall q\in S,(t,q)\in R)\}$

除运算（÷）会返回R中在属性 $A_1,A_2,\dots,A_m$ 上的元组t，其中元组t和关系S中的任意元组q的组合都会出现在关系R中
如果S中有R中没有的属性，则无法进行除运算

除运算可以用投影运算和笛卡尔积运算表示：
$R\div S=\Pi_{A_1,A_2,\dots,A_n}(R)-\Pi_{A_1,A_2,\dots,A_n}((\Pi_{A_1,A_2,\dots,A_n}(R)\times S)-R)$

扩展关系代数运算

扩展关系代数运算定义了使用基本关系代数运算和附加关系代数运算无法实现的运算

去重

去重运算 $\delta$ 可以将关系R中的重复元组去除，并返回去除重复元组后的关系： $\delta(R)$

广义投影

广义投影运算 $\Pi$ 允许在投影列表中使用算术运算和字符串函数等来对投影运算进行扩展：
$\Pi_{F_1,F_2,\dots,F_k}(R)$

R为关系
$F_1,F_2,\dots,F_k$ 为包含常量、变量（R中列）、运算符（算术运算符，逻辑运算符，关系运算符）、函数等的多个表达式

聚集

聚集运算 $\mathcal{G}$ 可以查询关系R按某些列的值聚集在一起的结果：
$\mathcal{G}_{F_1(A_1),F_2(A_2),\dots,F_k(A_k)}(R)$

$A_1,A_2,\dots,A_k$ 为R中的属性列
$F_i$ 为作用在属性 $A_i$ 上的聚集函数（1≤i≤k）

常见的聚集函数包括count, sum, avg, min, max等

聚集函数对空值NULL的处理：

count()
count(*)：不忽略空值
count(某个字段)：忽略空值

sum()：可以对单个/多个列求和
忽略NULL值，且当对多个列运算求和时，如果运算的列中任意一列的值为NULL，则忽略这行的记录
例如： sum(A+B+C)，A、B、C 为三列，如果某行记录中A列值为NULL，则不统计这行

avg()：忽略NULL值，而不是将其作为0参与计算
min(), max()：忽略NULL值

分组

分组运算首先对关系R中的元组按照某些列的值进行分组，然后在各组上应用聚集运算：
$_{G_1,G_2,\dots,G_l}\mathcal{G}_{F_1(A_1),F_2(A_2),\dots,F_k(A_k)}(R)$

$G_1,G_2,…,G_l$ 是用来分组的一系列属性，为R中的列，在这些列上取值都相同的元组将被分到同一组
$A_1,A_2,\dots,A_k$ 为R中的属性列， $F_i$ 为作用在属性 $A_i$ 上的聚集函数（1≤i≤k）
查询结果中会包含 $G_1,G_2,\dots,G_l$ 和 $F_1 (A_1 ),F_2 (A_2 ),\dots,F_k (A_k )$ 列

排序

排序运算 $\tau$ 将关系R中的元组按照一列或多列的值排序： $\tau_{A_1,A_2,\dots,A_k}(R)$

$A_1,A_2,\dots,A_k$ 是用来排序的列
首先将R中的元组按照 $A_1$ 的值排序，对于 $A_1$ 列取值相同的元组，按照 $A_2$ 的值排序，以此类推。

注意：排序运算 $\tau$ 是按照 $A_i$ 的升序排列的，也就是从小到大排列。

总结

关系代数运算	表达式
选择	$\sigma_p(R)=\{t\mid t\in R\land p(t)=\text{True}\}$
投影	$\Pi_{A_1,A_2,\ldots,A_k}(R)=\{t[A_1,A_2,\ldots,A_k]\mid t\in R\}$
并	$R\cup S=\{t\mid t\in R\lor t\in S\}$
差	$R-S=\{t\mid t\in R \land t\notin S\}$
笛卡尔积	$R\times S=\{(t,q)\mid t\in R\ \land\ q\in S\}$
重命名	$\rho_{S(A_1,A_2,\dots,A_n)}(R)$
交	$R\cap S=\{t\mid t\in R\land t\in S\}$
连接	$R\Join_{p}S=\{(t,q)\mid t\in R\land q\in S\land p(t,q)=\text{True}\}$
赋值	$T\leftarrow E$
除	$R\div S=\{t\mid t\in \Pi_{A_1,A_2,\dots,A_n}(R)\land (\forall q\in S,(t,q)\in R)\}$
去重	$\delta(R)$
广义投影	$\Pi_{F_1,F_2,\dots,F_k}(R)$
聚集	$\mathcal{G}_{F_1(A_1),F_2(A_2),\dots,F_k(A_k)}(R)$
分组	$_{G_1,G_2,\dots,G_l}\mathcal{G}_{F_1(A_1),F_2(A_2),\dots,F_k(A_k)}(R)$
排序	$\tau_{A_1,A_2,\dots,A_k}(R)$

元组关系演算

关系代数是一种过程化查询语言，通过在关系代数表达式中指定一个运算的序列，并按照此序列依次执行，可以得到查询的结果
元组关系演算是非过程化查询语言，只描述想要获取数据的信息，不描述获取信息的具体过程

元组关系演算表达式的定义为： $\{t\mid P(t)\}$

上述表达式返回所有使得公式P为真的元组t的集合
P由原子公式组成，原子公式可以是以下形式之一：
1. $t\in R$ ：其中t是元组变量，R是关系
2. $t[x]\Theta s[y]$ ：其中t和s是元组变量，x是t所属的关系的属性，y是s所属的关系的属性， $\Theta$ 是比较运算符
3. $t[x]\Theta c$ ，其中t，x， $\Theta$ 同上，c是属性x的域中的常量

域关系演算

域关系演算也是非过程化查询语言
域关系演算使用属性域中取值的域变量来代替元组关系演算中的元组变量

域关系演算表达式的定义为： $\{<x_1,x_2,\dots,x_k>\mid P(x_1,x_2,\dots,x_k)\}$

其中 $x_1,x_2,\dots,x_k$ 均为域变量， $P$ 是由原子公式组成的公式
上述表达式返回所有使得公式 $P$ 为真的域变量 $x_1,x_2,\dots,x_k$ 组成的元组的集合
原子公式可以是以下形式之一：
- $<x_1,x_2,\dots,x_k>\in R$ ，其中R是包含k个属性的关系， $x_1,x_2,\dots,x_k$ 为域变量或域常量
- $x\ \Theta\ y$ ，其中x和y是域变量， $\Theta$ 是比较运算符（包括>，<，=，≥，≤，≠）
- $x\ \Theta\ c$ ，其中x， $\Theta$ 同上，c是x所属属性的属性域中的常量

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m