正则表达式大法bb

re函数

re.findall()

  • re.findall() 返回字符串中所有匹配正则表达式的子字符串列表
  • re.S 表示将整个字符串视为一个文本块,包括换行符,从而 '.' 可以匹配到换行符。
  • re.M 表示将字符串视为多行文本,当使用 '^' 和 '$' 进行匹配时,'^' 会匹配行首,'$' 会匹配行尾。
例如,如下正则表达式的含义如下:
  • 如果不使用 re.M,那么该正则表达式只会匹配到字符串中第一个数字块,不会匹配到其他行的数字块。
  • 如果使用了 re.M,那么该正则表达式会匹配到每一行的数字块。同时,如果使用 re.MULTILINE 代替 re.M,也能实现相同的效果。

re.search()

  • re.search() 在字符串中搜索第一个匹配正则表达式的子字符串,并返回一个MatchObject对象,可以使用group()方法来获取匹配的字符串
 
re.sub()源代码、参数及其意义:
 
 

正则表达式中的元字符是具有特殊含义的字符,它们用于匹配文本中的模式。以下是一些常见的正则表达式元字符及其含义:
  1. .:匹配任意单个字符,除了换行符。
  1. :匹配前面的字符零次或多次。
  1. +:匹配前面的字符一次或多次。
  1. ?:匹配前面的字符零次或一次。
  1. |:用于分隔多个选择项,类似于逻辑上的“或”。
  1. []:定义字符集,匹配其中的任意一个字符。
  1. [^]:定义反向字符集,匹配除了其中字符以外的任意字符。
  1. ():用于分组操作,可以改变操作符的优先级。
  1. \\:转义字符,用于匹配元字符本身。
  1. ^:匹配字符串的开头。
  1. $:匹配字符串的结尾。
  1. \\b:匹配单词的边界。
  1. \\d:匹配数字字符,等价于 [0-9]
  1. \\w:匹配字母、数字、下划线,等价于 [a-zA-Z0-9_]
  1. \\s:匹配空白字符,包括空格、制表符、换行等。
  1. \\t:匹配制表符。
  1. \\n:匹配换行符。
  1. \\r:匹配回车符。
这只是一些常见的元字符示例,正则表达式中还有很多其他元字符和组合。请注意,元字符的含义可能会因正则表达式引擎的不同而有所不同。如果你要使用特定的元字符,最好查阅你所使用编程语言或工具的正则表达式文档,以确保你理解它们的准确含义。