Webcourse/04-JavaScript基础/32-正则表达式.md

393 lines
11 KiB
JavaScript
Raw Normal View History

2019-06-18 18:27:52 +08:00
## 正则表达式简介
**定义**正则表达式用于定义一些字符串的规则
**作用**计算机可以根据正则表达式来检查一个字符串是否符合指定的规则或者将字符串中符合规则的内容提取出来
2019-06-20 19:40:49 +08:00
如果你想查看正则更多的内容可以查阅官方文档关于 RegExp 这个内置对象的用法
## 创建正则表达式的对象
2019-06-20 19:56:47 +08:00
### 方式一使用构造函数创建正则表达式的对象
2019-06-18 18:27:52 +08:00
语法
```javascript
2019-06-20 19:40:49 +08:00
var 变量 = new RegExp("正则表达式"); // 注意,参数是字符串
2019-06-18 18:27:52 +08:00
var 变量 = new RegExp("正则表达式", "匹配模式"); // 注意,两个参数都是字符串
```
备注`RegExp`的意思是 **Regular expression**使用typeof检查正则对象会返回object
2019-06-20 19:40:49 +08:00
上面的语法中既可以传一个参数也可以传两个参数
创建了正则表达式的对象后该怎么使用呢大致分为两个步骤
- 1创建正则表达式的对象 reg
- 2使用 reg 的test() 方法判断指定字符串是否符合规则
2019-08-04 17:41:02 +08:00
**正则表达式的`test()`方法**重要
```javascript
myReg.test(str); // 判断字符串 str 是否符合 指定的 myReg 这个正则表达式的规则
```
解释使用`test()`这个方法可以用来检查一个字符串是否符合正则表达式的规则**如果符合则返回true否则返回false**
2019-06-20 19:40:49 +08:00
我们来看看下面的例子
2019-06-18 18:27:52 +08:00
2019-06-20 19:40:49 +08:00
**1传一个参数时**
构造函数 RegExp 可以只传一个参数
代码举例
2019-06-18 18:27:52 +08:00
```javascript
var reg = new RegExp("a"); // 定义一个正则表达式:检查一个字符串中是否含有 a
var str1 = "qianguyihao";
var str2 = "smyh";
// 通过 test()方法,判断字符串是否符合 上面定义的 reg 规则
console.log(reg.test(str1)); // 打印结果true
console.log(reg.test(str2)); // 打印结果false
```
注意上面的例子中我们是先定义了一个正则表达式的规则然后通过正则表达式的`test()`方法来判断字符串是否符合之前定义的规则
2019-06-20 19:56:47 +08:00
**2传两个参数时**匹配模式 重要
2019-06-20 19:40:49 +08:00
构造函数 RegExp 也可以传两个参数我们可以传递一个**匹配模式**作为第二个参数这个参数可以是
- `i` 忽略大小写这里的 i 指的是 ignore
- `g` 全局匹配模式这里的 g 指的是 global
代码举例
```javascript
var reg = new RegExp('A', 'i');
var str = 'qiangu';
console.log(reg.test(str)); // 打印结果true
```
2019-06-20 19:56:47 +08:00
### 方式二使用字面量创建正则表达式
2019-06-20 19:40:49 +08:00
我们可以使用字面量来创建正则表达式
语法
```javascript
var 变量 = /正则表达式/; // 注意,这个语法里没有引号
var 变量 = //; //
```
2019-06-20 19:56:47 +08:00
代码举例
2019-06-20 19:40:49 +08:00
```javascript
2019-06-20 19:56:47 +08:00
var reg = /A/i; // 定义正则表达式的规则:检查一个字符串中是否含有 a。忽略大小写。
var str = "qiangu";
2019-06-20 19:40:49 +08:00
2019-06-20 19:56:47 +08:00
console.log(typeof reg); // 打印结果object
console.log(reg.test(str)); // 打印结果true
2019-06-20 19:40:49 +08:00
```
2020-02-06 14:54:04 +08:00
### 以上两种方式的对比
2019-06-20 19:40:49 +08:00
- 方式一使用构造函数创建时更加灵活因为参数中还可以传递变量
- 方式二使用字面量的方式创建更加简单
代码举例
```javascript
2019-06-20 19:56:47 +08:00
var reg = new RegExp("a", "i"); // 方式一
2019-06-20 19:40:49 +08:00
2019-06-20 19:56:47 +08:00
var reg = /a/i; // 方式二
2019-06-20 19:40:49 +08:00
```
2019-06-20 19:56:47 +08:00
上面这两行代码的作用是等价的
2020-02-06 14:54:04 +08:00
### 避坑指南全局匹配 g 慎用test()方法
对于非全局匹配的正则表达式`test()`只会检测**是否存在某个目标字符串**只要存在就为 true多次检测的结果都相同例如
```javascript
const reg = /test/;
const str = '_test_test';
reg.test(str) // true
reg.test(str) // true
reg.test(str) // true
```
重点来了
当设置全局标志 `/g` 一旦字符串中还存在匹配test() 方法都将返回 true同时匹配成功后将把 `lastIndex` 属性的值**设置为上次匹配成功结果之后的第一个字符所在的位置**下次匹配将从 `lastIndex` 指示的位置开始匹配不成功时返回 false同时将 lastIndex 属性的值重置为 0
举例很重要的例子看仔细
```javascript
const reg = /test/g;
const str = '_test_test';
console.log(reg.test(str)); // true
console.log(reg.lastIndex); // 5
console.log(reg.test(str)); // true
console.log(reg.lastIndex); // 10
console.log(reg.test(str)); // false
console.log(reg.lastIndex); // 0
```
**总结**
全局匹配模式`g`一般用于 `exec()``match()``replace()`等方法
全局匹配模式`g`如果用于test()方法会有问题因为g模式会生成一个`lastindex`参数来存储匹配最后一次的位置
参考链接
- [JS正则表达式全局匹配的那些坑](https://juejin.im/post/5de9bd5fe51d45582c27b6f3)
- [javascript正则全局匹配g慎用test方法](https://blog.csdn.net/Leolu007/article/details/8576490)
- [issues](https://github.com/qianguyihao/Web/issues/69)
2019-08-02 20:36:14 +08:00
## 正则表达式的简单语法
2019-06-20 19:40:49 +08:00
### 检查一个字符串中是否包含 a或b
2019-06-22 17:47:47 +08:00
**写法1**
2019-06-20 19:40:49 +08:00
```javascript
var reg = /a|b/;
```
解释使用 `|` 表示``的意思
2019-06-22 17:47:47 +08:00
**写法2**
2019-06-20 19:40:49 +08:00
```javascript
var reg = /[ab]/; // 跟上面的那行语法,是等价的
```
解释这里的`[]`也是表示``的意思
`[]`这个符号在正则还是比较常用的我们接下来看几个例子
### []表示
一些规则
- `/[ab]/` 等价于 `/a|b/`检查一个字符串中是否包含 **a或b**
- `/[a-z]/`检查一个字符串那种是否包含**任意小写字母**
- `/[A-Z]/`任意大写字母
- `/[A-z]/`任意字母
- `/[0-9]/`任意数字
- `/a[bde]c/`检查一个字符串中是否包含 abc adc aec
### [^ ] 表示除了
举例1
```javascript
2019-08-02 20:36:14 +08:00
var reg = /[^ab]/; // 规则字符串中除了a、b之外还有没有其他的字符内容
2019-06-20 19:40:49 +08:00
var str = "acb";
console.log(reg.test(str)); // 打印结果true
```
举例2可以用来验证某字符串是否为 纯数字
```javascript
2019-08-02 20:36:14 +08:00
var reg = /[^0-9]/; // 规则:字符串中,除了数字之外,还有没有其他的内容?
2019-06-20 19:40:49 +08:00
var str1 = "1991";
var str2 = "199a1";
console.log(reg.test(str1)); // 打印结果false (如果字符串是 纯数字,则返回 false
console.log(reg.test(str2)); // 打印结果true
2019-06-18 18:27:52 +08:00
```
2019-06-20 19:40:49 +08:00
## 支持正则表达式的 String 对象的方法
String对象的如下方法是支持正则表达式的
| 方法 | 描述 | 备注 |
|:-------------|:-------------|:-------------|
| split() | 将字符串拆分成数组 | |
2019-06-22 17:47:47 +08:00
| search() | 搜索字符串中是否含有指定内容返回索引 index | |
2019-06-20 19:56:47 +08:00
| match() | 根据正则表达式从一个字符串中将符合条件的内容提取出来 | |
| replace() | 将字符串中的指定内容替换为新的内容并返回 | |
2019-06-18 18:27:52 +08:00
2019-06-20 19:56:47 +08:00
下面来分别介绍和举例
2019-06-18 18:27:52 +08:00
2019-06-20 19:40:49 +08:00
### split()
2019-06-18 18:27:52 +08:00
2019-11-12 16:56:33 +08:00
`split()`将一个字符串拆分成一个数组可以接受一个正则表达式作为参数
2019-06-20 19:56:47 +08:00
2019-08-02 20:36:14 +08:00
备注关于`split()`更详细的用法可以看之前的关于内置对象String这篇文章
2019-06-20 19:56:47 +08:00
**正则相关的举例**根据任意字母将字符串拆分成数组
2019-06-20 19:40:49 +08:00
代码实现通过正则
```javascript
var str = "1a2b3c4d5e6f7g";
2019-11-12 16:56:33 +08:00
var result = str.split(/[A-z]/); // 参数是一个正则表达式:表示所有字母
2019-06-20 19:40:49 +08:00
console.log(result);
```
打印结果
```json
["1", "2", "3", "4", "5", "6", "7", ""]
```
### search()
`search()`搜索字符串中是否含有指定内容如果搜索到指定内容则会返回第一次出现的索引否则返回-1
`search()`方法可以接受一个正则表达式作为参数然后会根据正则表达式去检索字符串`serach()`只会查找第一个即使设置全局匹配也没用
**举例**
```javascript
var str = "hello abc hello aec afc";
/*
* 搜索字符串中是否含有abc aec afc
*/
result = str.search(/a[bef]c/);
console.log(result); // 打印结果6
```
### match()
`match()`根据正则表达式从一个字符串中将符合条件的内容提取出来封装到一个数组中返回即使只查询到一个结果
2019-08-02 20:36:14 +08:00
**注意**默认情况下`match()`方法只会找到**第一个**符合要求的内容找到以后就停止检索我们可以设置正则表达式为**全局匹配**模式这样就会匹配到所有的内容并以**数组**的形式返回
2019-06-20 19:40:49 +08:00
2019-08-02 20:36:14 +08:00
另外我们可以为一个正则表达式设置多个匹配模式且匹配模式的顺序无所谓
2019-06-20 19:40:49 +08:00
**代码举例**
```javascript
var str = "1a2a3a4a5e6f7A8B9C";
var result1 = str.match(/[a-z]/); // 找到符合要求的第一个内容,然后返回
2019-08-02 20:36:14 +08:00
var result2 = str.match(/[a-z]/g); // 设置为“全局匹配”模式,匹配字符串中 所有的小写字母
var result3 = str.match(/[a-z]/gi); // 设置多个匹配模式,匹配字符串中 所有的字母(忽略大小写)
2019-06-20 19:40:49 +08:00
console.log(result1); // 打印结果:["a"]
console.log(result2); // 打印结果:["a", "a", "a", "a", "e", "f"]
console.log(result3); // 打印结果:["a", "a", "a", "a", "e", "f", "A", "B", "C"]
```
**总结**
match()这个方法还是很实用的可以在一个很长的字符串中提取出**有规则**的内容这不就是爬虫的时候经常会遇到的场景么
2019-06-20 19:56:47 +08:00
### replace()
2019-06-20 19:40:49 +08:00
`replace()`将字符串中的指定内容替换为新的内容并返回不会修改原字符串
语法
```javascript
新的字符串 = str.replace(被替换的内容新的内容);
```
参数解释
- 被替换的内容可以接受一个正则表达式作为参数
- 新的内容默认只会替换第一个如果需要替换全部符合条件的内容可以设置正则表达式为**全局匹配**模式
代码举例
```javascript
//replace()方法:替换
var str2 = "Today is fine day,today is fine day !!!"
console.log(str2);
console.log(str2.replace("today","tomorrow")); //只能替换第一个today
console.log(str2.replace(/today/gi,"tomorrow")); //这里用到了正则且为“全局匹配”模式才能替换所有的today
```
2019-06-18 18:27:52 +08:00
2019-08-02 20:36:14 +08:00
## 常见正则表达式举例
### 检查一个字符串是否是一个合法手机号
手机号的规则
- 以1开头
- 第二位是3~9之间任意数字
- 三位以后任意9位数字
正则实现
```javascript
var phoneStr = "13067890123";
var phoneReg = /^1[3-9][0-9]{9}$/;
console.log(phoneReg.test(phoneStr));
```
**备注**如果在正则表达式中同时使用`^``$`符号则要求字符串必须完全符合正则表达式
### 去掉字符串开头和结尾的空格
正则实现
```javascript
str = str.replace(/^\s*|\s*$/g,"");
```
解释如下
```javascript
str = str.replace(/^\s*/, ""); //去除开头的空格
str = str.replace(/\s*$/, ""); //去除结尾的空格
```
2019-08-04 17:41:02 +08:00
### 判断字符串是否为电子邮件
正则实现
```javascript
var emailReg = /^\w{3,}(\.\w+)*@[A-z0-9]+(\.[A-z]{2,5}){1,2}$/;
var email = "abchello@163.com";
console.log(emailReg.test(email));
```
2019-08-02 20:36:14 +08:00
## 我的公众号
想学习**代码之外的技能**不妨关注我的微信公众号**千古壹号**id`qianguyihao`
扫一扫你将发现另一个全新的世界而这将是一场美丽的意外
![](http://img.smyhvae.com/20190101.png)