March 29th, 2011 By rex Categories: 应用

想必不少人体会过在Linux下误删文件的欲哭无泪的感觉。我整理出一份比较安全的rm脚本,贴在这里。

Read more…

November 27th, 2010 By rex Categories: 杂项

500多天之后,饭否回来了。这是不是以前的那个饭否不要紧,重要的是你还是那个你。(via@王兴) 有人说:“饭否回来不被阉割就很好了。”要俺看被阉割也成啊,被阉割俺也愿意继续跟它,好歹曾经完整过,不像这个新浪围脖儿,还没出生时就是太监了。(via @女流氓.exe)

总结了一款非官方的新手指南。老fanfouers请无视。

Read more…

November 7th, 2010 By rex Categories: 应用

最近用上了Mac, 苦于没有一份好用的郑码输入法. 于是发挥不怕折腾的精神, 自己制作一份码表, 记在这里.

Read more…

September 26th, 2010 By rex Categories: 应用

kds:“前驻法大使吴建民指出,应该理**国”,想了一下,原来两个星号是“性爱”两字,生活在一个机械屏蔽时代的中国还真有喜感。——via

想必您也看到了推特上关于“理**国”的笑话了。我正好想学一下中文分词方面的知识,这是第一篇。

Read more…

September 25th, 2010 By rex Categories: 应用

一个简单的程序,统计文本文档中的单词和汉字数,逆序排列(出现频率高的排在最前面)。python实现。

Read more…

September 17th, 2010 By rex Categories: 书籍

简要评价一下本人读过的几本与正则表达式有关的书。个人之见,仅供参考。 Read more…

September 11th, 2010 By rex Categories: 问答

网友wys提问:如何仅使用JavaScript支持的正则语法,将

1
2
3
4
5
<p>
<table> <p> </p><p>  </p></table>
<table> <p> </p><p>  </p></table>
</p><p>
</p>

<table>...</table>之间的<p></p>都替换为<br />? Read more…

August 31st, 2010 By rex Categories: 笔记

统计最近用过的linux命令。没什么具体用途,练习bash而已。

Read more…

August 15th, 2010 By rex Categories: 杂项

本文是一篇随笔,将email的anti spam技术和论坛的防灌水结合在一起讨论。从技术层面出发。不涉及其它。

Read more…

August 10th, 2010 By rex Categories: 杂项

按需替换,精准搜索;
有时贪婪,有时懒惰。
喜欢正则,不喜欢回溯;
喜欢用正则解决问题,也知道并非所有问题都能用正则解决。
喜欢在论坛上讨论疑点,也喜欢在博客上分享心得。
自学而未成才,不是什么大牛,我是一名正则凡客。

August 6th, 2010 By rex Categories: 教程, 问答

昨天Snopo问我如何写一段正则表达式,来提取sql的条件语句。解答之余,想写一篇文章介绍一下经验。文题本来是《如何构造复杂的正则表达式》,但是觉得有些歧义,就感觉正则式本来很简单,我在教人如何将它小事化大一样。正好相反,我的本意是说,即使复杂的正则式也不怕,找出合适的方法,将其构造出来。

Read more…

August 4th, 2010 By rex Categories: 问答

读者“神の呼出”留言询问如何格式化HTML的标签缩进,并给出了他的思路和解法,是从纯粹的正则出发。例如,寻找配对的标签要用到后向引用,标签嵌套则使用递归。不过,这两个特性虽然很有用,却不宜滥用。本文试图从另一个角度出发,简化思路,降低对正则的依赖,以便提高速度。

Read more…

August 1st, 2010 By rex Categories: 笔记

关于 Trie 的介绍,请读上文Trie,此不赘述。本文主要分析 Trie 实现原理,并给出 Python 的实现。

Read more…

August 1st, 2010 By rex Categories: 笔记

从《Effective Perl》上学习到一个module:Regexp::Trie。它属于正则优化类的module,具体说来,就是提取出备选项文本的公共部分,构造“检索树”,以便最大程度上减少回溯,提升效率。

Read more…

June 27th, 2010 By rex Categories: 笔记

总结在 python 语言里使用正则表达式匹配中文的经验。关键词:中文,cjk,utf8,unicode,python。

Read more…

Page 1 of 612345...Last »