正则杂谈:从“评论已关闭”到正则表达式之眼

May 27th, 2009 Categories: 杂项

近来沸沸扬扬地一条饭否消息是评论已关闭,这个关键词真的选的很好,它一下子把所有的一类敏感问题都串起来了,找到了该类问题的共同特征。至于为什么关闭评论,关闭的标准是什么,这里都不做探讨,只是从正则角度谈论一下技术而已。

所谓正则表达式,其实是一种抽象,是从现有的文本中找到规律,然后用正则的语言描述出来。例如,上次有人问,以http开头的,以空格结尾的正则式如何写?这个问题不难,我们只要符合这两个要求即可,即^(http\S+)\s。至于http后面的冒号、双斜杠,都不必劳神去匹配。这样写出来的正则表达式简洁明快,清晰易读。当然,从效率出发,越精确的正则式越有利于尽早失败,有利于提升效率。权衡写的效率与执行的效率,其过程也是很不错的。

Tags:

One Response to “正则杂谈:从“评论已关闭”到正则表达式之眼”

  1. aluca
    February 5th, 2010 at 17:07
    1

    文本的规则的抽象,总结的很形象;权衡写的效率与执行的效率,的确是一个问题呢,呵呵.

    [Reply]

Leave a Comment