网站首页 > 精选文章 / 正文
需要在 Python 中使用正则表达式来匹配不以给定模式开头的字符串吗?
如果是这样,你可以使用下面的语法来查找所有的字符串,除了那些不以https 开始的字符串。
r"^(?!https).*"
复制代码
第一步:匹配不以模式开头的字符串
在这个例子中,我们有一个 URL 的列表。假设你想得到所有不以https 开始的网址。
为了这个目的,我们将使用负数查找。
import re
texts = [
'https://en.wikipedia.org/wiki/Main_Page/',
'http://en.wikipedia.org/wiki/National_Park_Service/',
'https://en.wikipedia.org/wiki/Hoover_Dam/',
'http://en.wikipedia.org/wiki/United_States_Bureau_of_Reclamation/',
'https://en.wikipedia.org/wiki/Central_African_Republic/',
'en.wikipedia.org/wiki/Africa/',
'ftp://en.wikipedia.org/wiki/Central_African_Republic/',
]
for text in texts:
print(re.findall(r"^(?!https).*", text))
复制代码
其结果是。
[]
['http://en.wikipedia.org/wiki/National_Park_Service/']
[]
['http://en.wikipedia.org/wiki/United_States_Bureau_of_Reclamation/']
[]
['en.wikipedia.org/wiki/Africa/']
['ftp://en.wikipedia.org/wiki/Central_African_Republic/']
复制代码
它是如何工作的?
- ^ - 断定位置在字符串的开头
- (?!https) - 负向查找 - 断言重码不匹配 - https
- .* - 匹配0到无限次之间的任何字符
第2步:匹配不以几个模式开始的字符串
现在,让我们试着找到所有不以......开头的字符串。
- https
- ftp
我们可以使用| ,也就是在regex语法中 -r"^(?!https|ftp).*" 。
for text in texts:
print(re.findall(r"^(?!https|ftp).*", text))
复制代码
结果是。
[]
['http://en.wikipedia.org/wiki/National_Park_Service/'] [
]
['http://en.wikipedia.org/wiki/United_States_Bureau_of_Reclamation/']
[
]
['en.wikipedia.org/wiki/Africa/' ]
[]
注意:你可以用| 添加许多模式。
第3步:匹配不以列表中的字符开始的字符串
最后让我们看看如何匹配所有不以几个字符开头的字符串,比如。
- f
- h
这次我们要列出方括号内的所有字符:[^hf] 。语句[hf] 意味着匹配字母 -f 或h ,而^ 则否定匹配。
换句话说,匹配列表中不存在的单个字符 -[hf] 。
所以我们可以使用。
for text in texts:
print(re.findall(r"^[^hf].*", text))
复制代码
这将给我们带来。
[]
[]
[]
[]
[]
['en.wikipedia.org/wiki/Africa/']
[]
Tags:正则表达式匹配任意字符
- 上一篇:linux 系统中正则表达式的使用
- 下一篇:深入解析MySQL:查询的正则匹配
猜你喜欢
- 2025-03-06 超级厉害的提取函数——REGEXP正则函数(关于汉字部分)
- 2025-03-06 Python 正则表达式:从基础到应用
- 2025-03-06 用火出圈的DeepSeek,学习REGEXP正则函数!
- 2025-03-06 正则表达式 量词
- 2025-03-06 浅学python | 正则表达式集锦
- 2025-03-06 3 分钟了解正则表达式在 Python 中的用法
- 2025-03-06 史上最全正则详解
- 2025-03-06 java正则-取出指定字符串之间的内容
- 2025-03-06 正则中的字符集
- 2025-03-06 深入解析MySQL:查询的正则匹配