爱问知识人 爱问教育 医院库

javascript中的正则表达式有什么规范

首页

javascript中的正则表达式有什么规范


        

提交回答

全部答案

    2018-06-05 04:45:54
  •   正则表达式规则
    1。 正则表达式规则
    1。1 普通字符
    字母、数字、汉字、下划线、以及后边章节中没有特殊定义的标点符号,都是"普通字符"。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。
      
    举例1:表达式 "c",在匹配字符串 "abcde" 时,匹配结果是:成功;匹配到的内容是:"c";匹配到的位置是:开始于2,结束于3。(注:下标从0开始还是从1开始,因当前编程语言的不同而可能不同)
    举例2:表达式 "bcd",在匹配字符串 "abcde" 时,匹配结果是:成功;匹配到的内容是:"bcd";匹配到的位置是:开始于1,结束于4。
      
    --------------------------------------------------------------------------------
    1。2 简单的转义字符
    一些不便书写的字符,采用在前面加 "" 的方法。
      这些字符其实我们都已经熟知了。
    表达式
    可匹配

    ,
    代表回车和换行符


    制表符

    \
    代表 "" 本身
    还有其他一些在后边章节中有特殊用处的标点符号,在前面加 "" 后,就代表该符号本身。
      比如:^, $ 都有特殊意义,如果要想匹配字符串中 "^" 和 "$" 字符,则表达式就需要写成 "^" 和 "$"。
    表达式
    可匹配

    ^
    匹配 ^ 符号本身

    $
    匹配 $ 符号本身


      
    匹配小数点(。)本身
    这些转义字符的匹配方法与 "普通字符" 是类似的。也是匹配与之相同的一个字符。
    举例1:表达式 "$d",在匹配字符串 "abc$de" 时,匹配结果是:成功;匹配到的内容是:"$d";匹配到的位置是:开始于3,结束于5。
      
    --------------------------------------------------------------------------------
    1。3 能够与 '多种字符' 匹配的表达式
    正则表达式中的一些表示方法,可以匹配 '多种字符' 其中的任意一个字符。
      比如,表达式 "d" 可以匹配任意一个数字。虽然可以匹配其中任意字符,但是只能是一个,不是多个。这就好比玩扑克牌时候,大小王可以代替任意一张牌,但是只能代替一张牌。
    表达式
    可匹配

    d
    任意一个数字,0~9 中的任意一个

    w
    任意一个字母或数字或下划线,也就是 A~Z,a~z,0~9,_ 中任意一个

    s
    包括空格、制表符、换页符等空白字符的其中任意一个


      
    小数点可以匹配除了换行符( )以外的任意一个字符
    举例1:表达式 "dd",在匹配 "abc123" 时,匹配的结果是:成功;匹配到的内容是:"12";匹配到的位置是:开始于3,结束于5。
    举例2:表达式 "a。
      d",在匹配 "aaa100" 时,匹配的结果是:成功;匹配到的内容是:"aa1";匹配到的位置是:开始于1,结束于4。
    --------------------------------------------------------------------------------
    1。
      4 自定义能够匹配 '多种字符' 的表达式
    使用方括号 [ ] 包含一系列字符,能够匹配其中任意一个字符。用 [^ ] 包含一系列字符,则能够匹配其中字符之外的任意一个字符。同样的道理,虽然可以匹配其中任意一个,但是只能是一个,不是多个。
      
    表达式
    可匹配

    [ab5@]
    匹配 "a" 或 "b" 或 "5" 或 "@"

    [^abc]
    匹配 "a","b","c" 之外的任意一个字符

    [f-k]
    匹配 "f"~"k" 之间的任意一个字母

    [^A-F0-3]
    匹配 "A"~"F","0"~"3" 之外的任意一个字符
    举例1:表达式 "[bcd][bcd]" 匹配 "abc123" 时,匹配的结果是:成功;匹配到的内容是:"bc";匹配到的位置是:开始于1,结束于3。
      
    举例2:表达式 "[^abc]" 匹配 "abc123" 时,匹配的结果是:成功;匹配到的内容是:"1";匹配到的位置是:开始于3,结束于4。
    --------------------------------------------------------------------------------
    1。
      5 修饰匹配次数的特殊符号
    前面章节中讲到的表达式,无论是只能匹配一种字符的表达式,还是可以匹配多种字符其中任意一个的表达式,都只能匹配一次。如果使用表达式再加上修饰匹配次数的特殊符号,那么不用重复书写表达式就可以重复匹配。
      
    使用方法是:"次数修饰"放在"被修饰的表达式"后边。比如:"[bcd][bcd]" 可以写成 "[bcd]{2}"。
    表达式
    作用

    {n}
    表达式重复n次,比如:"w{2}" 相当于 "ww";"a{5}" 相当于 "aaaaa"

    {m,n}
    表达式至少重复m次,最多重复n次,比如:"ba{1,3}"可以匹配 "ba"或"baa"或"baaa"

    {m,}
    表达式至少重复m次,比如:"wd{2,}"可以匹配 "a12","_456","M12344"。
      。。

    ?
    匹配表达式0次或者1次,相当于 {0,1},比如:"a[cd]?"可以匹配 "a","ac","ad"


    表达式至少出现1次,相当于 {1,},比如:"a b"可以匹配 "ab","aab","aaab"。
      。。

    *
    表达式不出现或出现任意次,相当于 {0,},比如:"^*b"可以匹配 "b","^^^b"。。。
    举例1:表达式 "d 。?d*" 在匹配 "It costs $12。
      5" 时,匹配的结果是:成功;匹配到的内容是:"12。5";匹配到的位置是:开始于10,结束于14。
    举例2:表达式 "go{2,8}gle" 在匹配 "Ads by goooooogle" 时,匹配的结果是:成功;匹配到的内容是:"goooooogle";匹配到的位置是:开始于7,结束于17。
      
    --------------------------------------------------------------------------------
    1。6 其他一些代表抽象意义的特殊符号
    一些符号在表达式中代表抽象的特殊意义:
    表达式
    作用

    ^
    与字符串开始的地方匹配,不匹配任何字符

    $
    与字符串结束的地方匹配,不匹配任何字符

    
    匹配一个单词边界,也就是单词和空格之间的位置,不匹配任何字符
    进一步的文字说明仍然比较抽象,因此,举例帮助大家理解。
      
    举例1:表达式 "^aaa" 在匹配 "xxx aaa xxx" 时,匹配结果是:失败。因为 "^" 要求与字符串开始的地方匹配,因此,只有当 "aaa" 位于字符串的开头的时候,"^aaa" 才能匹配,比如:"aaa xxx xxx"。
      
    举例2:表达式 "aaa$" 在匹配 "xxx aaa xxx" 时,匹配结果是:失败。因为 "$" 要求与字符串结束的地方匹配,因此,只有当 "aaa" 位于字符串的结尾的时候,"aaa$" 才能匹配,比如:"xxx xxx aaa"。
      
    举例3:表达式 "。。" 在匹配 "@@@abc" 时,匹配结果是:成功;匹配到的内容是:"@a";匹配到的位置是:开始于2,结束于4。
    进一步说明:"" 与 "^" 和 "$" 类似,本身不匹配任何字符,但是它要求它在匹配结果中所处位置的左右两边,其中一边是 "w" 范围,另一边是 非"w" 的范围。
      
    举例4:表达式 "end" 在匹配 "weekend,endfor,end" 时,匹配结果是:成功;匹配到的内容是:"end";匹配到的位置是:开始于15,结束于18。
    一些符号可以影响表达式内部的子表达式之间的关系:
    表达式
    作用

    |
    左右两边表达式之间 "或" 关系,匹配左边或者右边

    ( )
    (1)。
       在被修饰匹配次数的时候,括号中的表达式可以作为整体被修饰
    (2)。 取匹配结果的时候,括号中的表达式匹配到的内容可以被单独得到
    举例5:表达式 "Tom|Jack" 在匹配字符串 "I'm Tom, he is Jack" 时,匹配结果是:成功;匹配到的内容是:"Tom";匹配到的位置是:开始于4,结束于7。
      匹配下一个时,匹配结果是:成功;匹配到的内容是:"Jack";匹配到的位置时:开始于15,结束于19。
    举例6:表达式 "(gos*) " 在匹配 "Let's go go go!" 时,匹配结果是:成功;匹配到内容是:"go go go";匹配到的位置是:开始于6,结束于14。
      
    举例7:表达式 "¥(d 。?d*)" 在匹配 "$10。9,¥20。5" 时,匹配的结果是:成功;匹配到的内容是:"¥20。5";匹配到的位置是:开始于6,结束于10。单独获取括号范围匹配到的内容是:"20。5"。
    --------------------------------------------------------------------------------
    2。
       正则表达式中的一些高级规则
    2。1 匹配次数中的贪婪与非贪婪
    在使用修饰匹配次数的特殊符号时,有几种表示方法可以使同一个表达式能够匹配不同的次数,比如:"{m,n}", "{m,}", "?", "*", " ",具体匹配的次数随被匹配的字符串而定。
      这种重复匹配不定次数的表达式在匹配过程中,总是尽可能多的匹配。比如,针对文本 "dxxxdxxxd",举例如下:
    表达式
    匹配结果

    (d)(w )
    "w " 将匹配第一个 "d" 之后的所有字符 "xxxdxxxd"

    (d)(w )(d)
    "w " 将匹配第一个 "d" 和最后一个 "d" 之间的所有字符 "xxxdxxx"。
      虽然 "w " 也能够匹配上最后一个 "d",但是为了使整个表达式匹配成功,"w " 可以 "让出" 它本来能够匹配的最后一个 "d"
    由此可见,"w " 在匹配的时候,总是尽可能多的匹配符合它规则的字符。虽然第二个举例中,它没有匹配最后一个 "d",但那也是为了让整个表达式能够匹配成功。
      同理,带 "*" 和 "{m,n}" 的表达式都是尽可能地多匹配,带 "?" 的表达式在可匹配可不匹配的时候,也是尽可能的 "要匹配"。这 种匹配原则就叫作 "贪婪" 模式 。
    非贪婪模式:
    在修饰匹配次数的特殊符号后再加上一个 "?" 号,则可以使匹配次数不定的表达式尽可能少的匹配,使可匹配可不匹配的表达式,尽可能的 "不匹配"。
      这种匹配原则叫作 "非贪婪" 模式,也叫作 "勉强" 模式。如果少匹配就会导致整个表达式匹配失败的时候,与贪婪模式类似,非贪婪模式会最小限度的再匹配一些,以使整个表达式匹配成功。举例如下,针对文本 "dxxxdxxxd" 举例:
    表达式
    匹配结果

    (d)(w ?)
    "w ?" 将尽可能少的匹配第一个 "d" 之后的字符,结果是:"w ?" 只匹配了一个 "x"

    (d)(w ?)(d)
    为了让整个表达式匹配成功,"w ?" 不得不匹配 "xxx" 才可以让后边的 "d" 匹配,从而使整个表达式匹配成功。
      因此,结果是:"w ?" 匹配 "xxx"
    更多的情况,举例如下:
    举例1:表达式 "(。*)" 与字符串 "
    aa

    bb
    " 匹配时,匹配的结果是:成功;匹配到的内容是 "
    aa

    bb
    " 整个字符串, 表达式中的 "" 将与字符串中最后一个 "" 匹配。
      
    举例2:相比之下,表达式 "(。*?)" 匹配举例1中同样的字符串时,将只得到 "
    aa
    ", 再次匹配下一个时,可以得到第二个 "
    bb
    "。
      
    --------------------------------------------------------------------------------
    2。2 反向引用 1, 2。。。
    表达式在匹配时,表达式引擎会将小括号 "( )" 包含的表达式所匹配到的字符串记录下来。
      在获取匹配结果的时候,小括号包含的表达式所匹配到的字符串可以单独获取。这一点,在前面的举例中,已经多次展示了。在实际应用场合中,当用某种边界来查找,而所要获取的内容又不包含边界时,必须使用小括号来指定所要的范围。比如前面的 "(。*?)"。
    其实,"小括号包含的表达式所匹配到的字符串" 不仅是在匹配结束后才可以使用,在匹配过程中也可以使用。
      表达式后边的部分,可以引用前面 "括号内的子匹配已经匹配到的字符串"。引用方法是 "" 加上一个数字。"1" 引用第1对括号内匹配到的字符串,"2" 引用第2对括号内匹配到的字符串……以此类推,如果一对括号内包含另一对括号,则外层的括号先排序号。
      换句话说,哪一对的左括号 "(" 在前,那这一对就先排序号。
    举例如下:
    举例1:表达式 "('|")(。*?)(1)" 在匹配 " 'Hello', "World" " 时,匹配结果是:成功;匹配到的内容是:" 'Hello' "。
      再次匹配下一个时,可以匹配到 " "World" "。
    举例2:表达式 "(w)1{4,}" 在匹配 "aa bbbb abcdefg ccccc 111121111 999999999" 时,匹配结果是:成功;匹配到的内容是 "ccccc"。
      再次匹配下一个时,将得到 999999999。这个表达式要求 "w" 范围的字符至少重复5次,注意与 "w{5,}" 之间的区别。
    举例3:表达式 "。*?" 在匹配 "" 时,匹配结果是成功。如果 "" 与 "" 不配对,则会匹配失败;如果改成其他配对,也可以匹配成功。
      
    正则表达式规则如下:
    表达式 描述 表达式 描述
    ^ 匹配行首 $ 匹配行尾

       匹配任何单个字符 [] 匹配集合中的字符
    [^] 匹配不在集合中的字符 ? 匹配前一个样式0或1次
    * 匹配前一个样式0或更多次 匹配前一个样式1或更多次
    | 匹配前一个或后一个样式 & 匹配前一个样式0或更多次
    # 匹配前一个样式1或更多次 {} Group char to form one pattern
    () Group and remember 下一个字符直接用原意(只对a-z之外的字符有效)
    匹配词的结尾
    x## 匹配ASCII码为##(16进制)的字符 N### 匹配ASCII码为##(10进制)的字符
    o### 匹配ASCII码为##(8进制)的字符 a 匹配 a
     匹配  f 匹配 f
    匹配 0x13(回车) 匹配 0x09(跳格)
    v 匹配 v e 匹配 Esc(0x05)
    匹配0x10(换行) s 匹配空格(回车,换行,制表符,空格)
    S 匹配非空格(!s) w 整字匹配
    W 非整字匹配 d 匹配数字
    D 匹配非数字 U 匹配大写字母
    L 匹配小写字母 C 后面开始大小写敏感
    c 后面开始大小写不敏感 # 匹配前面定义的组(#: 1-9, a-f)。

    崔***

    2018-06-05 04:45:54

类似问题

换一换
  • JAVA相关 相关知识

  • 电脑网络技术
  • 电脑网络

相关推荐

正在加载...
最新资料 推荐信息 热门专题 热点推荐
  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200
  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200
  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200
  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200

热点检索

  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 178-197
返回
顶部
帮助 意见
反馈

确定举报此问题

举报原因(必选):