Python正则默认不匹配换行符,需用re.DOTALL使.跨行匹配,re.MULTILINE使^$匹配每行首尾,二者作用不同不可混用,组合可用re.DOTALL|re.MULTILINE或(?ms)。

Python正则默认不匹配换行符,多行文本处理常失败。关键在正确使用 re.DOTALL 和 re.MULTILINE 这两个 flags,它们作用不同、不能混用。
re.DOTALL:让点号(.)匹配换行符
默认情况下,. 只匹配除换行符外的任意字符。开启 re.DOTALL 后,. 就能跨行匹配,适合提取跨多行的大段内容(比如HTML标签块、注释块)。
- 写法示例:
re.search(r'<!--(.*?)-->', text, re.DOTALL)—— 匹配含换行的 HTML 注释 - 等价写法:
re.search(r'(?s)<!--(.*?)-->', text),(?s)是内联标志,效果相同 - 注意:它不影响
^和$的行为,只改变.
re.MULTILINE:让 ^ 和 $ 匹配每行首尾
默认 ^ 只匹配整个字符串开头,$ 只匹配结尾。启用 re.MULTILINE 后,^ 和 $ 会同时匹配每行的开头和结尾,适合逐行处理或提取行首特定模式(如日志中的时间戳、配置项)。
- 写法示例:
re.findall(r'^d{4}-d{2}-d{2}.*$', log_text, re.MULTILINE)—— 提取所有以日期开头的行 - 等价写法:
re.findall(r'(?m)^d{4}-d{2}-d{2}.*$', log_text) - 注意:它不改变
.的行为,换行符依然无法被.匹配
组合使用:同时跨行 + 行首行尾定位
复杂场景(如解析带缩进的 YAML 块、嵌套代码段)可能需要两者共存。可用按位或 | 连接:
创客贴设计,一款智能在线设计工具,设计不求人,AI助你零基础完成专业设计!
213 立即学习“”;
-
re.search(r'(?ms)start.*?end', text)或re.search(r'start.*?end', text, re.DOTALL | re.MULTILINE) -
(?ms)中m对应 MULTILINE,s对应 DOTALL,顺序无关 - 常见误用:仅加
re.MULTILINE却想用.跨行——结果失败,必须加re.DOTALL
其他实用技巧与注意事项
避免踩坑,提升可读性和兼容性:
- 推荐优先用内联标志
(?i)、(?m)、(?s),把意图写在正则里,比传 flags 更直观 - 多个 flags 组合时,不要用逗号分隔(如
re.MULTILINE, re.DOTALL),必须用| - 编译正则对象时传入 flags 更高效:
pattern = re.compile(r'(?ms)abc.*?def'),复用更安全 - 注意
re.match()仍从字符串开头匹配,即使用了 MULTILINE;要全文本扫描请用re.search()或re.findall()
以上就是Python多行匹配正则技巧_flags参数使用方法【指导】的详细内容,更多请关注php中文网其它相关文章!
相关标签:
微信扫一扫打赏
支付宝扫一扫打赏
