关于正则表达式中?=、?!、?＜=、?＜!、?:的理解与应用

千叶KE

14259人浏览 · 2023-04-23 10:46:09

千叶KE · 2023-04-23 10:46:09 发布

一、?=、?!、?＜=、?＜!、?:的解释

1. 先看一下比较官方的解释

(?=pattern)：正向先行断言，表示匹配位置后面必须紧跟着满足 pattern 的字符串，但不包括这个字符串在匹配结果中。
(?!pattern)：负向先行断言，表示匹配位置后面不能紧跟着满足 pattern 的字符串，也不包括这个字符串在匹配结果中。
(?<=pattern)：正向后行断言，表示匹配位置前面必须是满足 pattern 的字符串，但不包括这个字符串在匹配结果中。
(?<!pattern)：负向后行断言，表示匹配位置前面不能是满足 pattern 的字符串，也不包括这个字符串在匹配结果中。
(?:pattern)：非捕获型分组，表示将 pattern 包含在一个分组中，但不把这个分组的匹配结果保存到分组编号中。这个分组通常用于表示可选的或重复的子表达式，或者是限制量词的作用范围，而不需要把它们的匹配结果单独提取出来。

2. 再看一下比较通俗易懂的解释：

RegExp1(?=RegExp2) 匹配后面是RegExp2 的 RegExp1
RegExp1(?!RegExp2) 匹配后面不是RegExp2 的 RegExp1
(?<=RegExp2)RegExp1 匹配前面是RegExp2 的 RegExp1
(?<!RegExp2)RegExp1 匹配前面不是RegExp2 的 RegExp1
(?:RegExp) 这个等下单独解释，与上面的不太一样

是不是有点明白了，其实?=、?!、?＜=、?＜!的意思可以理解为 if 判断，即只有先通过它们（RegExp2）的判断之后，才可以获取到正则（RegExp1）的匹配结果。

3. 零宽度断言

?=、?!、?＜=、?＜!其实就是正则表达式中的零宽度断言，以上面的举例来解释↓

RegExp2匹配到的内容是不会返回的，也不会消耗匹配到的字符，只会返回RegExp1的匹配结果，这就是零宽度断言，零宽度断言在正则表达式中非常有用，因为它们可以在不改变匹配结果的情况下，对匹配位置前后的内容进行限制或判断。

4. ?: 的解释

(?:) 并不是零宽度断言，而是非捕获组，它跟普通的括号 () 的区别在于，它不会保存匹配到的内容，但是它仍然会消耗字符并返回匹配内容，只是不会保存匹配结果。

()表示捕获分组，它会把匹配到的内容保存到内存中，开发者可以使用$n(n是一个数字)来代表第n个()中匹配到的内容
(?:)表示非捕获组，它匹配的内容不会被保存，所以无法使用$n获取，但也因为没有被保存所以节省了一部分内存空间

二、举例

?=

'我喜欢苹果'.replace(/我喜欢(?=苹果)/,'我讨厌') // 匹配 我喜欢苹果 中的 我喜欢 并替换为 我讨厌，因为是零宽度断言所以不包含苹果，故结果为 我讨厌苹果

'我喜欢橘子'.replace(/我喜欢(?=苹果)/,'我讨厌') // 我喜欢后面不是苹果，所以这里正则未通过，匹配不到任何内容，故结果仍为 我喜欢橘子

?!

'我喜欢苹果'.replace(/我喜欢(?!苹果)/,'我讨厌') // 匹配后面不是苹果的我喜欢，正则未通过，故结果仍为 我喜欢苹果

'我喜欢橘子'.replace(/我喜欢(?!苹果)/,'我讨厌') // 正则通过，匹配到 我喜欢 进行替换，因为是零宽度断言所以橘子不在匹配结果中，故结果为 我讨厌橘子

?<=

'我喜欢苹果'.replace(/(?<=我喜欢)苹果/,'西红柿') // 匹配到 苹果 ，故结果为 我喜欢西红柿

'我喜欢橘子'.replace(/(?<=我喜欢)苹果/,'西红柿') // 匹配不通过，故结果仍为 我喜欢橘子

?<

'我讨厌苹果'.replace(/(?<!我喜欢)苹果/,'西红柿') // 匹配到 苹果 ，故结果为 我讨厌西红柿

'我喜欢苹果'.replace(/(?<!我喜欢)苹果/,'西红柿') // 匹配不通过，故结果仍为 我喜欢苹果

?:

'hello world'.replace(/(?:hello) (world)/,'$1') // 匹配内容为hello world，但是hello并没有被保存，因此$1取的是world，故结果为world

三、特殊情况

正则平时我们很少会自己写，一般都是复制别人的~~~~~（别人的才是最好的）~~。然后就经常看到一种写法，比如：

/(?=.*[A-Z])[A-Za-z]{5,10}/

这时候可能有些人就想，咦，(?=)不都是符合条件后匹配它前面的内容吗？这里为什么能放在开头呢，他前面没内容啊？其实大家可以这么理解，当(?=)前面没有内容，或者说(?=)被放在正则开头使用时，(?=)的作用就相当于检索全部内容是否符合它的要求，如果不符合也就没必要继续向后匹配了，这就很像if判断，只有当条件为true时，才能执行后面的内容。

所以这里的正则意为：先检查内容中是否至少包含一个大写字母，如果有，则继续检查并匹配5~10个大小写字母，将这5~10个大小写字母作为结果返回。

四、实例应用

姓名脱敏（添加*号）

'李小龙'.replace(/(?<=[\u4e00-\u9fa5])[\u4e00-\u9fa5]/g, '*') // 李**

手机号/银行账号脱敏

'13912345678'.replace(/(?<=\d{3})\d(?=\d{3})/g, '*') // 139*****678

强密码规则校验

// 密码不能为空，8-30位，至少包含一个大写字母、小写字母、数字、特殊字符
/^(?=.*[A-Z])(?=.*[a-z])(?=.*[0-9])(?=.*[\W_])(?!.*[\u4e00-\u9fa5])(?!\s)[a-zA-Z0-9\W_]{8,30}$/

如若转载，请注明出处，谢谢😄😄😄

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m