Posts Tagged ‘python’
本文是一篇随笔,将email的anti spam技术和论坛的防灌水结合在一起讨论。从技术层面出发。不涉及其它。
...昨天Snopo问我如何写一段正则表达式,来提取sql的条件语句。解答之余,想写一篇文章介绍一下经验。文题本来是《如何构造复杂的正则表达式》,但是觉得有些歧义,就感觉正则式本来很简...
读者“神の呼出”留言询问如何格式化HTML的标签缩进,并给出了他的思路和解法,是从纯粹的正则出发。例如,寻找配对的标签要用到后向引用,标签嵌套则使用递归。不过,这两个特性虽...
关于 Trie 的介绍,请读上文Trie,此不赘述。本文主要分析 Trie 实现原理,并给出 Python 的实现。
...总结在 python 语言里使用正则表达式匹配中文的经验。关键词:中文,cjk,utf8,unicode,python。
...笔记三则,贴在这里。
...发现一款简单有趣的正则表达式应用:REExtractor,作用是输入正则表达式,输出符合正则式描述的文本。作者给的介绍是 Generate all possibilities of Regular Expression,即生成正则表达式的所有可能...
上周发了篇《两条与密码验证相关的正则表达式问题》。今天看了些python的正则表达式,心血来潮,想看看这几种正则哪种效率较高。代码、运行结果见下。这是为什么呢? 1234567891011121314151...
我在断断续续地写一款抓饭程序。预想的功能包括:下载、更新饭否消息,搜索,统计。 近日饭否官方释出搜索功能,可以使用关键字搜索自己曾经发布的消息。作离线版的饭否消息管理工...
抛板砖,引白玉:为何不用xpath,什么是xpath? 最近拾起了以前的小项目,在完善上篇文章发布后,“那个谁”的回复让我很感兴趣。他问,“为什么不用xpath?” xpath是什么东东?我反问。...
页内导航: 能否只用官方的API来获取全部饭否消息? 饭否消息结构 使用regex解析饭否消息 使用xml解析饭否消息 两相比较 相关阅读 批量导出饭否程序的方法很多,但是基本思路都是先将该...
以前在编写linux下的scim郑码码表时,就跟正则式的中文匹配问题打过交道。当时总结了这样一条经验,utf8编码格式下,中文正则式应该这样书写: 1[\x80-\xff]{3} 当然,这与语言...
最近迷上了python,对它的三重引号赞不绝口,原来在Perl中一直困扰我的utf8字串问题,在python中得到圆满解决。我指的是一直在写的fanfou应用程序中,发送私信的编码问题。调用饭否API向饭否...
Recent Comments