使用说明

核心用法

regex-patterns 是一套面向开发者的正则表达式实战手册，覆盖 JavaScript、Python、Go 及命令行工具四大主流环境。其核心能力包括：

1. 输入验证：提供邮件、URL、IPv4/IPv6、手机号、日期时间、密码强度、UUID、语义化版本号等生产级校验模式
2. 文本解析：Apache/Nginx 访问日志、Syslog、JSON 日志的结构化提取；代码库中函数/类定义、导入语句、TODO 注释的精准定位
3. 数据抽取：从任意文本中提取邮箱、链接、引号字符串、数字、键值对、话题标签、十六进制颜色等
4. 批量重构：跨文件变量重命名、var 转 const、路径更新、大小写转换、文本清洗（去空格、去 HTML 标签、去 ANSI 色码）

显著优点

多语言对照：同一模式给出 JS/Python/Go/Shell 四版本实现，降低迁移成本
分层复杂度：每个场景提供「基础版」与「严格版」双模式，如邮件验证从 99% 覆盖率到防连续点号的进阶写法
元字符速查表：量化符、分组、环视断言等核心概念一页纸掌握
实战反模式警示：显式标注灾难性回溯（(a+)+）、贪婪/惰性匹配陷阱、换行符处理差异等高频踩坑点

潜在局限

无 HTML/XML/JSON 结构化解析：文档明确告诫「正则不是解析器」，复杂嵌套结构需配合专业库
Go 语言限制：标准库 regexp 采用 RE2 引擎，不支持环视断言（lookahead/lookbehind），需第三方包 regexp2 补充
性能盲区：未提供具体基准测试数据，仅文字警告回溯风险
Unicode 支持薄弱：模式以 ASCII 为中心，国际化场景（如中文邮箱、全角符号）需自行扩展

适合人群

后端/全栈工程师处理日志分析与数据清洗
运维人员编写 Shell 管道与监控脚本
安全工程师做初步的正则过滤与敏感信息扫描
初学者建立系统性正则思维（速查表价值极高）

常规风险

| 风险类型 | 具体表现 | 缓解建议 |

|---------|---------|---------|

| ReDoS 攻击 | 嵌套量词 + 恶意长输入导致 CPU 耗尽 | 避免 `(a+)+` 模式；对用户输入设长度上限；优先使用 possessive 量词 |

| 验证绕过 | 邮件正则未覆盖引号/注释等 RFC 5322 合法但罕见格式 | 关键场景补充 SMTP 验证或专用库（如 `email-validator`） |

| 环视断言误用 | 在 Go 标准库中使用 `(?=...)` 直接编译失败 | 切换至 `regexp2` 或改用捕获组后处理 |

| 全球化失效 | `\w` 不匹配中文字符，`\d` 匹配全角数字行为依赖引擎 | 明确指定 `[\u4e00-\u9fa5]` 或启用 Unicode 标志 |

整体而言，该技能是正则工程化的优质速查手册，适合作为团队代码规范附件或个人书签收藏，但不建议直接复制复杂模式到生产环境而不经测试。

安全解读

核心用法

本 Skill 是一份系统化的正则表达式速查手册，覆盖 JavaScript、Python、Go 及命令行工具（grep/sed/Perl）四大主流环境。核心应用场景包括：

1. 输入验证 — 提供 email、URL、IPv4/IPv6、电话号码、日期时间、UUID、语义化版本等生产级验证模式，从宽松匹配到严格校验均有示例。
2. 数据解析 — 针对 Apache/Nginx 访问日志、Syslog、JSON 日志等结构化文本，给出字段提取的 grep/awk 友好型模式。
3. 代码重构 — 支持变量重命名、导入路径更新、引号转换、尾随逗号补全等批量替换操作，附带 sed/perl 命令行示例。
4. 文本清理 — 包含去空白行、删 HTML 标签、剥离 ANSI 颜色码等实用技巧。

文档采用分层设计：先以速查表形式列出元字符、量词、分组、零宽断言等核心语法，再按场景组织实战模式，最后给出各语言的 API 差异对照（如 Python 的 re.VERBOSE、Go 的 RE2 限制、JavaScript 的 dotAll/multiline 标志）。

显著优点

零学习门槛：无需理解正则引擎原理，直接复制粘贴即可解决 90% 的常见需求。
多语言对齐：同一场景下对比展示 JS/Python/Go/Bash 的写法差异，避免跨语言时的语法混淆。
安全意识内建：专门章节提醒灾难性回溯（catastrophic backtracking）、贪婪/懒惰匹配陷阱、HTML/JSON 解析误用等经典坑点。
纯文档无依赖： Skill 本体为 Markdown 文本，无第三方依赖、无网络调用、无持久化存储，可在离线环境安全使用。

潜在局限

静态参考：仅提供模式文本，不包含交互式测试或可视化调试功能；复杂正则仍需借助 regex101 等外部工具验证。
语言版本差异：部分示例基于特定语言版本（如 Python 3 的 f-string、Go 1.22 的语法），旧环境可能需微调。
正则固有局限：文档已明确提示"勿用正则解析 HTML/XML/JSON"，但用户仍可能误用；部分场景（如 email 严格校验）存在业界争议，文档提供的"基础版"和"严格版"均非 RFC 5322 完整实现。
T3 来源：由个人开发者维护，虽经安全审计无恶意代码，但长期维护活跃度存在不确定性。

适合人群

需要快速写出"能用"正则的初中级开发者
运维工程师处理日志提取与过滤任务
全栈开发者在多语言栈间切换时的语法对照
技术写作者验证文本格式规范

常规风险

误报式依赖：安全报告显示全部 5 条"风险"均为文档示例代码的静态误报（re.compile、regexp.MustCompile 等），无实际执行风险。
ReDoS 隐患：文档中示例的正则模式本身若被直接应用于不可信输入的贪婪匹配（如 (.*)+），可能触发灾难性回溯；但 Skill 已提供规避建议（使用原子组或占有量词）。
无许可证声明：当前未明确开源协议，商业场景集成前建议与作者确认授权条款。

regex validation parsing text-processing javascript python golang shell refactoring data-extraction logging

Regex Patterns 内容

手动下载zip · 5.9 kB

SKILL.mdtext/markdown

请选择文件