Posts Tagged ‘python’

本文是一篇随笔,将email的anti spam技术和论坛的防灌水结合在一起讨论。从技术层面出发。不涉及其它。

...
Sunday, August 15th, 2010 at 10:03 2 comments

昨天Snopo问我如何写一段正则表达式,来提取sql的条件语句。解答之余,想写一篇文章介绍一下经验。文题本来是《如何构造复杂的正则表达式》,但是觉得有些歧义,就感觉正则式本来很简...

Friday, August 6th, 2010 at 15:02 9 comments

读者“神の呼出”留言询问如何格式化HTML的标签缩进,并给出了他的思路和解法,是从纯粹的正则出发。例如,寻找配对的标签要用到后向引用,标签嵌套则使用递归。不过,这两个特性虽...

Wednesday, August 4th, 2010 at 13:06 11 comments

关于 Trie 的介绍,请读上文Trie,此不赘述。本文主要分析 Trie 实现原理,并给出 Python 的实现。

...
Sunday, August 1st, 2010 at 22:58 2 comments

总结在 python 语言里使用正则表达式匹配中文的经验。关键词:中文,cjk,utf8,unicode,python。

...
Sunday, June 27th, 2010 at 11:50 11 comments

笔记三则,贴在这里。

...
Monday, June 21st, 2010 at 23:04 4 comments

发现一款简单有趣的正则表达式应用:REExtractor,作用是输入正则表达式,输出符合正则式描述的文本。作者给的介绍是 Generate all possibilities of Regular Expression,即生成正则表达式的所有可能...

Tuesday, February 2nd, 2010 at 17:12 2 comments

上周发了篇《两条与密码验证相关的正则表达式问题》。今天看了些python的正则表达式,心血来潮,想看看这几种正则哪种效率较高。代码、运行结果见下。这是为什么呢? 1234567891011121314151...

Thursday, October 22nd, 2009 at 20:13 3 comments

我在断断续续地写一款抓饭程序。预想的功能包括:下载、更新饭否消息,搜索,统计。 近日饭否官方释出搜索功能,可以使用关键字搜索自己曾经发布的消息。作离线版的饭否消息管理工...

Tuesday, January 6th, 2009 at 10:27 3 comments

抛板砖,引白玉:为何不用xpath,什么是xpath? 最近拾起了以前的小项目,在完善上篇文章发布后,“那个谁”的回复让我很感兴趣。他问,“为什么不用xpath?” xpath是什么东东?我反问。...

Tuesday, October 14th, 2008 at 18:00 2 comments

页内导航: 能否只用官方的API来获取全部饭否消息? 饭否消息结构 使用regex解析饭否消息 使用xml解析饭否消息 两相比较 相关阅读 批量导出饭否程序的方法很多,但是基本思路都是先将该...

Wednesday, October 8th, 2008 at 18:53 5 comments

以前在编写linux下的scim郑码码表时,就跟正则式的中文匹配问题打过交道。当时总结了这样一条经验,utf8编码格式下,中文正则式应该这样书写: 1[\x80-\xff]{3} 当然,这与语言...

Monday, June 2nd, 2008 at 14:23 0 comments

最近迷上了python,对它的三重引号赞不绝口,原来在Perl中一直困扰我的utf8字串问题,在python中得到圆满解决。我指的是一直在写的fanfou应用程序中,发送私信的编码问题。调用饭否API向饭否...

Monday, May 26th, 2008 at 23:43 0 comments
Page 1 of 11