正则表达式是用于匹配字符串中字符组合的模式。

正则表达式的基本思想是通过字符的组合,描述字符串的特征,从而达到匹配(或不匹配)目标字符串的目的。例如,你可以使用正则表达式来:

  1. 检查一个字符串是否符合特定的格式要求。
  2. 从文本中提取符合特定模式的信息。
  3. 替换文本中符合特定模式的部分。
  4. 在文本中搜索符合特定条件的字符串。

正则表达式的语法由元字符(metacharacters)和普通字符组成。元字符具有特殊的含义,而普通字符表示它们自身。例如,^ 表示字符串的开头,. 表示任意字符,\d 表示数字等。

Examples

以下是一些常见的正则表达式元字符和它们的含义:

  • ^:匹配字符串的开头。
  • $:匹配字符串的结尾。
  • .:匹配任意字符。
  • *:匹配前一个字符的零次或多次。
  • +:匹配前一个字符的一次或多次。
  • ?:匹配前一个字符的零次或一次。
  • \d:匹配数字。
  • \w:匹配字母、数字或下划线。
  • [ ]:字符类,匹配方括号中的任意字符。
  • |:或操作,匹配两个选项之一。

例如,正则表达式 ^\d{3}-\d{2}-\d{4}$ 可以用于匹配美国社会安全号码的格式(例如,123-45-6789)。

正则表达式在文本处理、数据提取、文本替换等方面有广泛的应用,是编程和文本处理中强大而灵活的工具。

这个网站收录了一些常见的正则表达式:regex101: Community Pattern Library