JavaScript学习—— 三、正则表达式
一、为什么学习正则表达式
典型的搜索和替换操作要求提供与预期的搜索结果匹配的确切文本。虽然这种技术对于对静态文本执行简单搜索和替换任务可能已经足够了,但它缺乏灵活性,若采用这种方法搜索动态文本,即使不是不可能,至少也会变得很困难。
通过使用正则表达式,可以:
- 测试字符串内的模式
例如,可以测试输入字符串,以查看字符串内是否出现电话号码模式或信用卡号码模式。这称为数据验证。 - 替换文本
可以使用正则表达式来识别文档中的特定文本,完全删除该文本或者用其他文本替换它。 - 基于模式匹配从字符串中提取子字符串
可以查找文档内或输入域内特定的文本。
正则表达式的使用,可以通过简单的办法来实现强大的功能。
二、语法
PegExp是正则表达式的缩写,它是一种强大的字符模式匹配规则,简单的有一个字符的匹配,复杂的有多个字符的匹配,如:邮箱、出生日期等。
正则表达式有两种模式:简单模式、复合模式。
- 简单模式指通过普通字符的组合表达的模式。例如:
var reg=/abc0d/; - 简单模式表示具体的匹配,如果要匹配邮箱或电话号码就需要用到复合模式。例如:
var reg=/a+b?\w/;
其中的+、?、\都属于通配符,表示特殊的含义。
语法如下
var expression = /pattern / flags;
其中 pattern 部分是正则表达式。 flags 部分是标记也称为修饰符,正则表达式的标记用于指定额外的匹配策略,正则表达式的匹配模式支持一下3种:
| 修饰符 | 含义 | 描述 |
|---|---|---|
| i | ignore - 不区分大小写 | 将匹配设置为不区分大小写,搜索时不区分大小写: A 和 a 没有区别。 |
| g | global - 全局匹配 | 查找所有的匹配项。 |
| m | multi line - 多行匹配 | 使边界字符 ^ 和 $ 匹配每一行的开头和结尾,记住是多行,而不是整个字符串的开头和结尾。 |
var reg1=/a|bd/;
console.log(reg1.test("bd")); //测试是否有符合正则规则的字串,结果为真或假
console.log(reg1.exec("cd")); //把符合正则规则的字串,放在数组中,没有则返回null
console.log("ad".match(reg1)); //同上,还可以提取符合正则规则的字串
普通字符
| 字符 | 描述 |
|---|---|
| [ABC] | 匹配 […] 中的所有字符, |
| [^ABC] | 匹配除了 […] 中字符的所有字符, |
| [A-Z] | [A-Z] 表示一个区间,匹配所有大写字母,[a-z] 表示所有小写字母。 |
| [\s\S] | 匹配所有。\s 是匹配所有空白符,包括换行,\S 非空白符,不包括换行。 |
| \w | 匹配字母、数字、下划线。等价于 [A-Za-z0-9_] |
| . | 匹配除换行符(\n、\r)之外的任何单个字符,相等[^\n\r]。 |
特殊字符
| 特殊字符 | 描述 |
|---|---|
| $ | 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 ‘\n’ 或 ‘\r’。要匹配 $ 字符本身,请使用 $。 |
| ( ) | 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符,请使用 ( 和 )。 |
| * | 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 *。 |
| + | 匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 +。 |
| . | 匹配除换行符 \n 之外的任何单字符。要匹配 . ,请使用 . 。 |
| [ | 标记一个中括号表达式的开始。要匹配 [,请使用 [。 |
| ? | 匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。要匹配 ? 字符,请使用 ?。 |
| \ | 将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如, ‘n’ 匹配字符 ‘n’。’\n’ 匹配换行符。序列 ‘\’ 匹配 “”,而 ‘(’ 则匹配 “(”。 |
| ^ | 匹配输入字符串的开始位置,除非在方括号表达式中使用,当该符号在方括号表达式中使用时,表示不接受该方括号表达式中的字符集合。要匹配 ^ 字符本身,请使用 ^。 |
| { | 标记限定符表达式的开始。要匹配 {,请使用 {。 |
| l | 指明两项之间的一个选择。要匹配 l,请使用 \ l。 |
限定符
| 字符 | 描述 |
|---|---|
| * | 匹配前面的子表达式零次或多次。例如,zo* 能匹配 “z” 以及 “zoo”。* 等价于{0,}。 |
| + | 匹配前面的子表达式一次或多次。例如,‘zo+’ 能匹配 “zo” 以及 “zoo”,但不能匹配 “z”。+ 等价于 {1,}。 |
| ? | 匹配前面的子表达式零次或一次。例如,“do(es)?” 可以匹配 “do” 、 “does” 中的 “does” 、 “doxy” 中的 “do” 。? 等价于 {0,1}。 |
| {n} | n 是一个非负整数。匹配确定的 n 次。例如,‘o{2}’ 不能匹配 “Bob” 中的 ‘o’,但是能匹配 “food” 中的两个 o。 |
| {n,} | n 是一个非负整数。至少匹配n 次。例如,‘o{2,}’ 不能匹配 “Bob” 中的 ‘o’,但能匹配 “foooood” 中的所有 o。‘o{1,}’ 等价于 ‘o+’。‘o{0,}’ 则等价于 ‘o*’。 |
| {n,m} | m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,“o{1,3}” 将匹配 “fooooood” 中的前三个 o。‘o{0,1}’ 等价于 ‘o?’。请注意在逗号和两个数之间不能有空格。 |
定位符
| 字符 | 描述 |
|---|---|
| ^ | 匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与 \n 或 \r 之后的位置匹配。 |
| $ | 匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与 \n 或 \r 之前的位置匹配。 |
| \b | 匹配一个单词边界,即字与空格间的位置。 |
| \B | 非单词边界匹配。 |
运算符优先级
| 运算符 | 描述 |
|---|---|
| \ | 转义符 |
| (), (?:), (?=), [] | 圆括号和方括号 |
| *, +, ?, {n}, {n,}, {n,m} | 限定符 |
| ^, $, \任何元字符、任何字符 | 定位点和序列(即:位置和顺序) |
| l | 替换,“或"操作。字符具有高于替换运算符的优先级,使得"mlfood"匹配"m"或"food”。若要匹配"mood"或"food",请使用括号创建子表达式,从而产生"(mlf)ood"。 |
三、应用
利用正则表达式可以实现很多表单的验证。
- 账户名
//账户名只能使用数字、字母、下画线,且数字不能开头,长度在6~15.
var reg1=/^\D+\w{5,14}$ /;
- 密码
//密码是由6~12个英文字母(区分大小写)或数字组成。
var reg1=/^([0-9] | [A-Z] | [a-z]){6,12}$ /;
- 邮箱
//邮箱开始是数字、字母、下画线,@之后是数字、字母、下画线,最后追加.com、.net、.cn或.com.cn。
var reg1=/^\w+@\w+\.(com |net |cn |com\.cn)$ /;
//或:var reg1=/^([A-Za-z0-9_-])+@[A-Za-z0-9_-]+(\.[A-Za-z0-9_-])+/;
- 手机号码
//手机号码共11位数字,第一位只能是1,第二位是34578其中之一,其余全是数字。
var reg1=/^1[34578][0-9]{9}$ /;
- 检查邮政编码
//邮政编码共6位,第一位不能为0。
var reg1=/^[1-9]\d{5}$ /;
- 身份证号码
//身份证号码共18位,首位是非0数字(即1~9),结尾是数字或者X,中间全是数字。
var reg1=/^[1-9]\d{16}(\d|X)$ /;
- 检查文件压缩包
var reg1=/^\w+\.(zip|gz|rar)$ /;
- 删除多余空格
str.replace(/\s+/,’’);
- 删除首尾空格
str.replace(/^\s+/,’’);
str.replace(/\s+$/,’’);
- 日期
//如xxxx-xx-xx \ xxxx/xx/xx \ xxxx.xx.xx 等格式的正则规则。
var reg1=/^\d{2}|\d{4}[-\ / \ .] \d{2}[-\ / \ .] \d{2}$ /;
- 只能输入中文 (\u4e00-\u9fa5是汉字的unicode编码)
str.replace( / ^\u4e00-\u9fa5/g,’’);
- 验证IP
//验证IP如0-255.0-255. 0-255.0-255格式正则规则。
var reg1=/^(2[0-4]\d | 25[0-5] | 1\d{2}| [1-9]\d[1-9]) (\.2[0-4]\d | 25[0-5] | 1\d{2} | [1-9]\d | \d) {3}$ /;
本文详细介绍了正则表达式在JavaScript中的重要性,包括为何学习正则、正则的基本语法以及实际应用。通过正则,可以进行模式测试、文本替换和数据验证等操作,如账户名、邮箱和手机号码的验证。文中还提到了正则的简单模式和复合模式,以及各种通配符和修饰符的使用。
836

被折叠的 条评论
为什么被折叠?



