有对 posix-正则 有研究的吗?问下

2023-05-09 22:09:08 +08:00

就参考这吧: https://dev.mysql.com/doc/refman/5.7/en/regexp.html


Within a bracket expression (written using [ and ]), matches the sequence of characters of that collating element.

mysql> SELECT '~' REGEXP '[[.~.]]';                     -> 1

为啥不是单[?结果也是 1 呀
mysql> SELECT '~' REGEXP '[.~.]';


Within a bracket expression (written using [ and ]), [=character_class=] represents an equivalence class.



Within a bracket expression (written using [ and ]), [:character_class:] represents a character class that matches all characters belonging to that class.

mysql> SELECT 'justalnums' REGEXP '[[:alnum:]]+';       -> 1

为啥不是单[?结果也是 1 呀
mysql> SELECT 'justalnums' REGEXP '[:alnum:]+';

[[:<:]], [[:>:]]

These markers stand for word boundaries. They match the beginning and end of words, respectively.

怎么需要 2 个来分别表示?

1320 次点击
所在节点    正则表达式
3 条回复
2023-05-10 14:27:48 +08:00
1. [ 是关键字,比如 [ab] 表示 a/b , 这里的 [.~.] 本意是用来表示 ~ 这个字符,所以语法是 [[.~.]] (可以理解为 [~])
2. 好像是用来匹配 大小写或其它变体写法,比如 a/A/那种看起来像 a 的字符我也不知道叫啥
3. 同 1

4. 补充下问题,是指不清楚设计思路。匹配单词开始边界,和结尾边界,为啥需要设计为 2 种写法?
2023-05-10 14:42:29 +08:00
4. 单词的开始边界和结束边界虽然都是边界,但是如果要区分这两个边界的话,肯定要用两个字符表示才能区分呀。你有更好的方法吗?
2023-05-10 16:09:00 +08:00
@yuezk #2 其实我是想 在单词的开头不就是 开始边界吗? 你写成 结尾边界,肯定匹配不到。所以为何还区分 2 种?

