<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>我爱正则表达式 &#187; 正则表达式</title>
	<atom:link href="http://iregex.org/blog/tag/%e6%ad%a3%e5%88%99%e8%a1%a8%e8%be%be%e5%bc%8f/feed" rel="self" type="application/rss+xml" />
	<link>http://iregex.org</link>
	<description>原创、翻译、转载关于正则表达式的文章</description>
	<lastBuildDate>Sun, 27 Jun 2010 04:20:24 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
<atom:link rel="hub" href="http://pubsubhubbub.appspot.com"/><atom:link rel="hub" href="http://superfeedr.com/hubbub"/><atom:link rel="hub" href="http://www.feedsky.com/api/RPC2"/><atom:link rel="hub" href="http://blogsearch.google.com/ping/RPC2"/><atom:link rel="hub" href="http://blog.yodao.com/ping/RPC2"/><atom:link rel="hub" href="http://www.feedsky.com/api/RPC2"/><atom:link rel="hub" href="http://www.xianguo.com/xmlrpc/ping.php"/><atom:link rel="hub" href="http://www.zhuaxia.com/rpc/server.php"/><atom:link rel="hub" href="http://rpc.technorati.com/rpc/ping"/><atom:link rel="hub" href="http://rpc.pingomatic.com/"/>	
<!-- Start Of Script Generated By WP-PostViews Plus -->
<script type='text/javascript' src='http://iregex.org/wp-includes/js/jquery/jquery.js?ver=1.4.2'></script>
<script type="text/javascript">
/* <![CDATA[ */
/* ]]> */
</script>
<!-- End Of Script Generated By WP-PostViews Plus -->
	<item>
		<title>探索匹配中文的正则表达式</title>
		<link>http://iregex.org/blog/exploration-on-regular-rexpressions-that-match-chinese.html</link>
		<comments>http://iregex.org/blog/exploration-on-regular-rexpressions-that-match-chinese.html#comments</comments>
		<pubDate>Sat, 23 Aug 2008 16:22:29 +0000</pubDate>
		<dc:creator>rex</dc:creator>
				<category><![CDATA[教程]]></category>
		<category><![CDATA[chinese]]></category>
		<category><![CDATA[regex]]></category>
		<category><![CDATA[unicode]]></category>
		<category><![CDATA[utf8]]></category>
		<category><![CDATA[正则表达式]]></category>

		<guid isPermaLink="false">http://iregex.org/?p=31</guid>
		<description><![CDATA[按：本文使用的RegexBuddy为3.1.0（完全）版，并非最新版3.1.1（截至2008.08.23）。需要该版本的请在这篇文章后留言。 注：参考www.regular-expressions.info的风格，更新了本模板的style.css文件，加入了与... ]]></description>
			<content:encoded><![CDATA[<blockquote style="border-left:2px solid #DDDDDD; margin:15px 30px 0 10px; padding-left:20px;">
<p>按：本文使用的RegexBuddy为3.1.0（完全）版，并非最新版3.1.1（截至2008.08.23）。需要该版本的请在<a href="http://iregex.org/blog/regexbuddy.html" target="_blank"><font color="#ff008c">这篇</font></a>文章后留言。</p>
<p>注：参考<a href="http://www.regular-expressions.info" target="_blank">www.regular-expressions.info</a>的风格，更新了本模板的style.css文件，加入了与正则式代码相关的格式： </p>
<ul>
<li><strong>正则式</strong>格式举例：<tt class="regex">[a-z]+@[a-z]+?\.[a-z]+</tt> </li>
<li><strong>匹配</strong>格式举例：<tt class="match">pig@animals.com</tt>和<tt class="match">chicken@birds.com</tt> </li>
<li><strong>普通文本</strong>格式举例：<tt class="string">这是一些普通文本。hello regex world. pig@animals.com和chicken@birds.com</tt> </li>
</ul>
<p><span id="more-31"></span></p>
<p>可以这样使用：在字符串<tt class="string">这是一些普通文本。hello regex world. pig@animals.com和chicken@birds.com</tt>使用正则式<tt class="regex">[a-z]+@[a-z]+?\.[a-z]+</tt>加以匹配，得到的结果为：<tt class="match">pig@animals.com</tt>和<tt class="match">chicken@birds.com</tt>。 </p>
</blockquote>
<p><strong>极端粗放型</strong>：点号其实是近乎万能的，可以匹配任何字符，限制只在于换行符的匹配上。匹配中文自然不在话下。作为可有可无的背景符，一个<tt class="regex">.*</tt>就能匹配掉包括中文在内的全部字符。这当然是一种极端的情况，因为这样显示不出中文字符串的特性。这不是本文要探讨的。</p>
<p><strong>极端集约型</strong>：如果搜索特定文本，例如在<tt class="string">一二三四五六七八九十拾佰百千仟万亿</tt>中匹配<tt class="regex">十拾</tt>， 直接使用m/<tt class="regex">十拾</tt>/就能搞定。这同样不是本文要探讨的。与<tt class="regex">\w</tt>能匹配英文字母一样，本文想找的是能够匹配所有汉字，而不匹配其它文本的一种简写方式。 </p>
<p><strong>普适型型</strong>：由于汉字属于Unicode，我们就从unicode里面找。在<a href="http://unicode.org/reports/tr18/" target="_blank">Unicode Regular Expressions</a>，列出了unicode的许多种表达方式。搜索chinese，找到如下一行：</p>
<table width="400" border="1" cellpadding="2" cellspacing="1" unselectable="on">
<tbody>
<tr>
<td  valign="top" width="200">Writing Systems</td>
<td  valign="top" width="200">Blocks</td>
</tr>
<tr>
<td  valign="top" width="200">&#8230;</td>
<td  valign="top" width="200">&#8230;</td>
</tr>
<tr>
<td  valign="top" width="200">Chinese</td>
<td  valign="top" width="200">CJK Unified Ideographs, CJK Unified Ideographs Extension A, CJK Compatibility Ideographs, CJK Compatibility Forms, Enclosed CJK Letters and Months, Small Form Variants, Bopomofo, Bopomofo Extended</td>
</tr>
</tbody>
</table>
<p>关于CJK的含义，是指中日韩统一表意文字（Chinese Japanese Korean Unified Ideographs），可以参考<a href="http://baike.baidu.com/view/628156.html" target="_blank">百度释义</a>，或<a href="http://en.wikipedia.org/wiki/CJK" target="_blank">wiki</a>词条。</p>
<p>再查了一下<a href="http://www.regular-expressions.info/" target="_blank">regular expressions</a>,查到其<a href="http://www.regular-expressions.info/unicode.html" target="_blank">unicode</a>一节有这样的内容：
</p>
<blockquote style="border-left:2px solid #DDDDDD; margin:15px 30px 0 10px; padding-left:20px;"><p><tt class="regex">\p{InCJK_Unified_Ideographs}</tt>: U+4E00..U+9FFF </p></blockquote>
<p>
看到这里，我想起了以前写的<a href="http://iregex.org/blog/regular-expressions-to-match-chinese-username-in-asp.html" target="_blank">《匹配用户名的asp正则表达式(包括中文)》</a>一文中，提到的中文匹配为<tt class="regex">[\u4e00-\u9fa5]</tt>，原来是有其对应的速记方式的，虽然两者有最后一组字符的差异。看附图可见U+9fa5，最后一个汉字的模样。<img src="http://i3.6.cn/cvbnm/80/3c/69/ac41d1186fde1c67bf7cef334bc6a0c7.jpg" style="border: 1px solid rgb(255, 255, 255); margin: 0px 10px 10px; clear: both; padding-left: 0px; " alt="我爱正则表达式｜在RegexBuddy中如何使用正则表达式匹配中文字符｜http://iregex.org" /> 此序列的第一位，U+4e00，是汉字<tt class="string">一</tt>。
</p>
<p><strong>自定义</strong>：到目前为止，相当于给汉字找到了官方的身份和说法，使用<tt class="regex">\p{InCJK_Unified_Ideographs}</tt>就能匹配所有的中文字符。我们其实也可以将一些重复出现的东西，封装起来，以备使用。例如，对于阿拉伯数字，我们有<tt class="regex">\d</tt>可以用。对于中文数字一二三四等等，我们有没有办法呢？</p>
<div class="codecolorer-container perl mac-classic" style="overflow:auto;white-space:nowrap;border:1px solid #9F9F9F;"><table cellspacing="0" cellpadding="0"><tbody><tr><td style="padding:5px;text-align:center;color:#888888;background-color:#EEEEEE;border-right: 1px solid #9F9F9F;font: normal 12px/1.4em Monaco, Lucida Console, monospace;"><div>1<br />2<br />3<br />4<br />5<br />6<br />7<br /></div></td><td><div class="perl codecolorer" style="padding:5px;font:normal 12px/1.4em Monaco, Lucida Console, monospace;white-space:nowrap"><span style="color: #0000ff;">$zh_digit</span><span style="color: #339933;">=</span><span style="color: #009966; font-style: italic;">qr/一|二|三|四|五|六|七|八|九|十|零|〇|百|千|万|亿|佰|仟|壹|贰|叁|肆|伍|陆|柒|捌|玖|拾/</span><span style="color: #339933;">;</span><br />
<br />
<span style="color: #0000ff;">$str</span><span style="color: #339933;">=</span><span style="color: #ff0000;">&quot;人民币五十一万零三百元整。大写：伍拾壹万零三佰元整。&quot;</span><span style="color: #339933;">;</span><br />
<span style="color: #b1b100;">while</span><span style="color: #009900;">&#40;</span><span style="color: #0000ff;">$str</span> <span style="color: #339933;">=~</span> <span style="color: #000066;">s</span><span style="color: #339933;">/</span><span style="color: #009900;">&#40;</span><span style="color: #009900;">&#40;</span><span style="color: #339933;">?:</span><span style="color: #0000ff;">$zh_digit</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">+</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">//</span><span style="color: #009900;">&#41;</span><br />
<span style="color: #009900;">&#123;</span><br />
&nbsp; &nbsp; <span style="color: #000066;">print</span> <span style="color: #0000ff;">$1</span><span style="color: #339933;">.</span><span style="color: #ff0000;">&quot;<span style="color: #000099; font-weight: bold;">\n</span>&quot;</span><span style="color: #339933;">;</span><br />
<span style="color: #009900;">&#125;</span></div></td></tr></tbody></table></div>
</p>
<p>
<img src="http://i3.6.cn/cvbnm/6f/3d/c2/f974a15dbf6a2ceed6c6744961f39b27.jpg" src="http://i3.6.cn/cvbnm/80/3c/69/ac41d1186fde1c67bf7cef334bc6a0c7.jpg" style="border: 1px solid rgb(255, 255, 255); margin: 0px 10px 10px; clear: both; padding-left: 0px; " alt="我爱正则表达式｜在RegexBuddy中如何使用正则表达式匹配中文字符｜http://iregex.org" />
</p>
<p>其输出结果见附图。</p>
<h3 style="color: #127ADB; font-size:14px; padding-bottom:3px; padding-top:3px; margin:1.5em 0 1em;">结论</h3>
<p>可以使用<tt class="regex">\p{InCJK_Unified_Ideographs}</tt>匹配任意中文字符。在不支持该种标记方式时，也可以使用<tt class="regex">[\u4e00-\u9fa5]</tt>加以匹配。</p>
<p>关于文正则表达式，我觉得尚未穷其奥秘。以前在linux（utf8编码）下，编写scim输入平台的郑码码表时，匹配中文所使用的正则表达式为<tt class="regex">[\x80-\xff]{3}</tt>，也能很好地工作。请参阅此文：<a href="http://zhasm.com/blog/longwen-zhengma-ime-table-in-scim-format.html" target="_blank" title="我爱正则表达式｜在RegexBuddy中如何使用正则表达式匹配中文字符｜http://iregex.org">龙文郑码码表 for scim</a>。其原理我尚不清楚，留待之后有时间研究。如有知情者，也请不吝赐教，先行谢过。</p>
]]></content:encoded>
			<wfw:commentRss>http://iregex.org/blog/exploration-on-regular-rexpressions-that-match-chinese.html/feed</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>《精通正则表达式》视频教程提供下载</title>
		<link>http://iregex.org/blog/mastering-regular-expressions-vedio-tutorial-download.html</link>
		<comments>http://iregex.org/blog/mastering-regular-expressions-vedio-tutorial-download.html#comments</comments>
		<pubDate>Sun, 17 Aug 2008 04:02:35 +0000</pubDate>
		<dc:creator>rex</dc:creator>
				<category><![CDATA[教程]]></category>
		<category><![CDATA[newbie]]></category>
		<category><![CDATA[regex]]></category>
		<category><![CDATA[正则式]]></category>
		<category><![CDATA[正则表达式]]></category>

		<guid isPermaLink="false">http://iregex.org/?p=28</guid>
		<description><![CDATA[偶然从网上找到该教程，下载后觉得不错，可以作为《精通正则表达式》的番外篇，共同学习。 关于此视频的讲师： 此视频的讲师为余晟先生。余先生是抓虾网高级顾问。毕业于东北师范大学... ]]></description>
			<content:encoded><![CDATA[<p>偶然从<a href="http://tieba.baidu.com/f?kz=464065073" target="_blank">网上</a>找到该教程，下载后觉得不错，可以作为《<a href="http://www.douban.com/subject/2154713/" target="_blank">精通正则表达式</a>》的番外篇，共同学习。</p>
<h3 style="color: #127ADB; font-size:14px; padding-bottom:3px; padding-top:3px; margin:1.5em 0 1em;">关于此视频的讲师：</h3>
<p>此视频的讲师为<a href="http://www.luanxiang.org/blog/" target="_blank">余晟</a>先生。余先生是抓虾网高级顾问。毕业于东北师范大学，主修计算机，辅修中文。现居北京。曾任高级程序员、技术经理；从事过大量文本解析和数据抽取的工作。对程序语言、算法、数据库和敏捷开发都有兴趣，译有《精通正则表达式》(第3版)一书。</p>
<h3 style="color: #127ADB; font-size:14px; padding-bottom:3px; padding-top:3px; margin:1.5em 0 1em;">关于此视频</h3>
<p>此视频分为5讲，每讲30分钟左右，内容深入浅出，适合以下受众：</p>
<ul>
<li>对正则式感兴趣的人；</li>
<li>对正则式不感兴趣的人；</li>
<li>正则式初学者，想入门；</li>
<li>正则式有所成者，想提高。</li>
</ul>
<p>当然，如果能静下心来，通读《<a href="http://www.douban.com/subject/2154713/" target="_blank">精通正则表达式</a>》原书，并亲自动手尝试，效果更为显著。<span id="more-28"></span></p>
<h3 style="color: #127ADB; font-size:14px; padding-bottom:3px; padding-top:3px; margin:1.5em 0 1em;">目录及下载：</h3>
<p>视频文件（avi格式）已经使用<a href="http://www.7-zip.org/" target="_blank">7-zip</a>压缩，使其总尺寸从784Mb减小到74.7Mb。您需要使用支持7-zip的解压软件才能打开。</p>
<p>上传空间在<a href="http://www.mediafire.com" target="_blank">mediafire</a>。在网络封锁日益严峻的大环境下，您或许需要使用代那个理才能访问。我不敢保证此文件址长时有效。需要下载的请抓紧时间。</p>
<table border="1" cellspacing="1" cellpadding="2" width="385">
<tbody>
<tr>
<td width="43" align="middle">章节</td>
<td width="254" align="middle" valign="top">内容</td>
<td width="42" align="middle">大小（Mb）</td>
<td width="39" align="middle">链接</td>
</tr>
<tr>
<td width="46" align="middle">第一讲</td>
<td width="256" valign="top"><a href="http://tu.6.cn/pic/show/id/353660"><img src="http://i3.6.cn/cvbnm/38/97/2e/af092f3b004368b914f828e87bf0a700.jpg" alt="" /></a></td>
<td width="44" align="middle">15.5</td>
<td width="41" align="middle"><a title="我爱正则表达式｜精通正则式视频教程｜资源下载" href="http://www.mediafire.com/file/zgdlmjrryn1" target="_blank"><del datetime="2008-11-04T13:59:50+00:00">点此下载</del></a></td>
</tr>
<tr>
<td width="47" align="middle">第二讲</td>
<td width="256" valign="top"><a href="http://tu.6.cn/pic/show/id/353661"><img src="http://i3.6.cn/cvbnm/6b/e9/a0/6ed09224a2cf26678f5b12b4f5279178.jpg" alt="" /></a></td>
<td width="45" align="middle">13.1</td>
<td width="42" align="middle"><a title="我爱正则表达式｜精通正则式视频教程｜资源下载" href="http://www.mediafire.com/file/rhjhdvzjrna" target="_blank"><del datetime="2008-11-04T13:59:50+00:00">点此下载</del></a></td>
</tr>
<tr>
<td width="46" align="middle">第三讲</td>
<td width="256" valign="top"><a href="http://tu.6.cn/pic/show/id/353662"><img src="http://i3.6.cn/cvbnm/a2/c2/b4/92dd6a034a2c806929956c85f55bb182.jpg" alt="" /></a></td>
<td width="45" align="middle">16.6</td>
<td width="43" align="middle"><a title="我爱正则表达式｜精通正则式视频教程｜资源下载" href="http://www.mediafire.com/file/uhsktmtle6u" target="_blank"><del datetime="2008-11-04T13:59:50+00:00">点此下载</del></a></td>
</tr>
<tr>
<td width="46" align="middle">第四讲</td>
<td width="256" valign="top"><a href="http://tu.6.cn/pic/show/id/353663"><img src="http://i3.6.cn/cvbnm/3e/d7/f6/fcc2d994ed9ae134c8cf6d51a0beaeff.jpg" alt="" /></a></td>
<td width="45" align="middle">15.3</td>
<td width="43" align="middle"><a title="我爱正则表达式｜精通正则式视频教程｜资源下载" href="http://www.mediafire.com/file/8inm2eqwnrk" target="_blank"><del datetime="2008-11-04T13:59:50+00:00">点此下载</del></a></td>
</tr>
<tr>
<td width="46" align="middle">第五讲</td>
<td width="256" valign="top"><a href="http://tu.6.cn/pic/show/id/353664"><img src="http://i3.6.cn/cvbnm/21/48/84/f48278bc22bb44e4db5e036bece56436.jpg" alt="" /></a></td>
<td width="45" align="middle">13.9</td>
<td width="43" align="middle"><a title="我爱正则表达式｜精通正则式视频教程｜资源下载" href="http://www.mediafire.com/file/mphmtaojmlh" target="_blank"><del datetime="2008-11-04T13:59:50+00:00">点此下载</del></a></td>
</tr>
<tr>
<td width="46" align="middle">源代码</td>
<td width="256" valign="top"></td>
<td width="45" align="middle">16.9Kb</td>
<td width="43" align="middle"><a href="http://www.mediafire.com/?bzmntyv3z5z" target="_blank"><del datetime="2008-11-04T13:59:50+00:00">点此下载</del></a></td>
</tr>
</tbody>
</table>
<p><strong><font color="#FF008c">2009.04.07更新：</font></strong><br />
请到此下载：<a href="http://regex.me/thread-6-post-9.html" target="_blank" title="正则表达式论坛|精通正则表达式视频教程">正则表达式论坛</a>。</p>
]]></content:encoded>
			<wfw:commentRss>http://iregex.org/blog/mastering-regular-expressions-vedio-tutorial-download.html/feed</wfw:commentRss>
		<slash:comments>14</slash:comments>
		</item>
		<item>
		<title>精通正则表达式中文第三版到手</title>
		<link>http://iregex.org/blog/mastering-regular-expressions-3rd-edition.html</link>
		<comments>http://iregex.org/blog/mastering-regular-expressions-3rd-edition.html#comments</comments>
		<pubDate>Fri, 16 May 2008 11:48:37 +0000</pubDate>
		<dc:creator>rex</dc:creator>
				<category><![CDATA[杂项]]></category>
		<category><![CDATA[reading]]></category>
		<category><![CDATA[正则表达式]]></category>

		<guid isPermaLink="false">http://iregex.org/?p=10</guid>
		<description><![CDATA[今天收到从淘宝上买来的《精通正则表达式》：第3版（中文版），感觉很爽。加上之前购买的精通正则表达式：第2版（影印版），手头就有两本正则书了。之前那边英文版可是“韦编三绝”，... ]]></description>
			<content:encoded><![CDATA[<p>今天收到从淘宝上买来的<a href="http://www.douban.com/subject/2154713/" target="_blank">《精通正则表达式》：第3版（中文版）</a>，感觉很爽。加上之前购买的<a href="http://www.douban.com/subject/1450763/">精通正则表达式：第2版（影印版）</a>，手头就有两本正则书了。之前那边英文版可是“韦编三绝”，被我读得破破烂烂的了。</p>
<table cellspacing="0" cellpadding="2" width="400" border="0">
<tbody>
<tr>
<td valign="top" width="200"><a href="http://www.douban.com/subject/2154713/"><img style="clear: both; border-right: rgb(255,255,255) 1px solid; border-top: rgb(255,255,255) 1px solid; padding-left: 0px; margin: 0px 10px 10px; border-left: rgb(255,255,255) 1px solid; border-bottom: rgb(255,255,255) 1px solid" src="http://otho.douban.com/mpic/s2697984.jpg" /></a></td>
<td valign="top" width="200"><a href="http://www.douban.com/subject/1450763/"><img style="clear: both; border-right: rgb(255,255,255) 1px solid; border-top: rgb(255,255,255) 1px solid; padding-left: 0px; margin: 0px 10px 10px; border-left: rgb(255,255,255) 1px solid; border-bottom: rgb(255,255,255) 1px solid" src="http://otho.douban.com/mpic/s2008023.jpg" /></a></td>
</tr>
</tbody>
</table>
]]></content:encoded>
			<wfw:commentRss>http://iregex.org/blog/mastering-regular-expressions-3rd-edition.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>windows下的正则式工具介绍之二：powergrep</title>
		<link>http://iregex.org/blog/powergrep.html</link>
		<comments>http://iregex.org/blog/powergrep.html#comments</comments>
		<pubDate>Mon, 05 May 2008 08:18:09 +0000</pubDate>
		<dc:creator>rex</dc:creator>
				<category><![CDATA[软件]]></category>
		<category><![CDATA[powergrep]]></category>
		<category><![CDATA[regex]]></category>
		<category><![CDATA[regexbuddy]]></category>
		<category><![CDATA[正则式]]></category>
		<category><![CDATA[正则表达式]]></category>

		<guid isPermaLink="false">http://iregex.org/?p=7</guid>
		<description><![CDATA[上文介绍了RegexBuddy，本文介绍另一款windows下的正则式软件：PowerGREP，号称“The Most Powerful GREP Tool for Windows”，windows下最强大的GREP工具。看清楚了，是最强大，而非之一。与RegexBuddy一样，也是... ]]></description>
			<content:encoded><![CDATA[<p>上文介绍了RegexBuddy，本文介绍另一款windows下的正则式软件：PowerGREP，号称“The Most Powerful GREP Tool for Windows”，windows下最强大的GREP工具。看清楚了，是<font color="#ff0084">最强大</font>，而非<font color="#ff0084">之一</font>。与RegexBuddy一样，也是商业软件，其售价为US$149.00，合人民币1000有奇。如果说RegexBuddy是撰写正则式的贴心助手，那么PowerGREP则是应用正则式在文本文件中搜索替换的强大工具。现在我们看看，它究竟有什么功能敢号称<b>最强</b>。</p>
<h3 style="color: #127ADB; font-size:14px; padding-bottom:3px; padding-top:3px; margin:1.5em 0 1em;">基本界面</h3>
<p><a target="_blank" href="http://www.powergrep.com/screens/powergrep800.png"><img style="max-width: 800px;" src="http://www.powergrep.com/screens/powergrep320.png" /></a></p>
<p>点击可以看大图。另外，还有一组图片来自<a target="_blank" href="http://www.powergrep.com">powergrep</a>官网，附上了官网的部分介绍，以及个人评论。</p>
<ul>
<li>内容搜索图片，点<a target="_blank" href="http://www.powergrep.com/screens/powergrep800.png">这里</a>；<br />
在本抓图中，我搜索了<font color="#ff0084">c:\My Documents\My Web Sites</font>文件夹及其子目录下所有的html文件。我使用了一条正则表达式把搜索范围限定在HTML tag之内，使用另一条正则式在这些<span class="hl">标记中搜索所有的email地址。</p>
<p></span></li>
<li>搜索和替换，点<a target="_blank" href="http://www.powergrep.com/screens/replacepreview.png">这里</a>和<a target="_blank" href="http://www.powergrep.com/screens/replace.png">这里</a>；<br />
一个好用的功能是可以<font color="#ff0084">预览</font>结果而不是立即替换。匹配结果以黄色标出。双击匹配就能打开对应的文档并检验其内容。<br />
点击<font color="#ff0084">执行</font>后，颜色改变，表示已经实施替换。</p>
</li>
<li>收集信息和统计数据，点<a target="_blank" href="http://www.powergrep.com/screens/collect.png">这里</a>；<br />
本例是“检测Apache网络日志－－google search terms”的例子。本例使用的正则式在PowerGREP帮助文档中有详细讲解。</p>
</li>
<li>灵活的“撤消”历史记录，让你不再抓狂，点<a href="http://www.powergrep.com/screens/undo.png" target="_blank">这里</a>；<br />
在执行替换的同时，PowerGREP已经备份了原文件。只要你没有手动删除这些备份的文件，你可以随便撤消你做过的任何操作。世界上真有后悔药的呀。</p>
</li>
<li>搜索PDF文档，点<a target="_blank" href="http://www.powergrep.com/screens/pdf.png">这里</a>；<br />
PDF也能使用正则式进行搜索？当然了，你没有看错。只是，要确保PDF文档中你要搜索的内容是<font color="#ff0084">文字</font>而非<font color="#ff0084">图像</font>。也就是说，扫描版的PDF不享受此功能的哟。</p>
</li>
<li>在MS word 文档中搜索，点<a target="_blank" href="http://www.powergrep.com/screens/msword.png">这里</a>；<br />
这个功能也十分有用。我记得还有个东东叫<a target="_blank" href="http://www.viemu.com/">ViEmu for Word &amp; Outlook</a>，可以在word和outlook中模拟vim，当然可以使用正则式搜索替换了。不过，ViEmu一来也是收费软件（在2008年5月31日之前是79美刀，之后是99美刀），我还没有找到免费版本；二来其正则式是vim风格的，只习惯Perl风格的同学可能不太习惯。在google documents里也支持正则式搜索了，具体语法、风格尚未广泛测试。</p>
</li>
<li>在MS Excel中搜索，点<a target="_blank" href="http://www.powergrep.com/screens/excel.png">这里</a>；<br />
同样也是批量搜索、替换。不单单是对一个文档、一个sheet。</p>
</li>
<li>以16进制模式，在2进制文档中搜索，点<a target="_blank" href="http://www.powergrep.com/screens/binaryfiles.png">这里</a>；<br />
跟二进制编辑器界面类似，多了正则式批量搜索替换功能。</p>
</li>
<li>在zip压缩文档中搜索，点<a target="_blank" href="http://www.powergrep.com/screens/zip.png">这里</a>；<br />
把zip文件当作普通文件夹来搜索。很强大吧？</p>
</li>
<li>正则表达式序列，点<a target="_blank" href="http://www.powergrep.com/screens/sequence.png">这里</a>；<br />
大多数正则式工具一次只支持一条正则式的操作。而PowerGREP可以一次执行多条正则式！使用checkbox来进行多项选择。</p>
</li>
<li>定制颜色显示，点<a target="_blank" href="http://www.powergrep.com/screens/colors.png">这里</a>；<br />
该功能比较一般。除非软件中的颜色设置特傻，一般我是不会改变默认颜色搭配的。
</li>
</ul>
<h3 style="color: #127ADB; font-size:14px; padding-bottom:3px; padding-top:3px; margin:1.5em 0 1em;">功能演示</h3>
<p>PowerGREP官网还提供了一组flash做的demo，见下。</p>
<ul>
<li>使用正则式匹配email地址(2&#8217;47&#8221;)。点<a target="_blank" href="http://www.powergrep.com/demos/email.swf">这里</a>；</li>
<li>升级版权信息(3&#8217;38)。点<a target="_blank" href="http://www.powergrep.com/demos/copyright.swf">这里</a>；</li>
<li>与RegexBuddy的无缝链接(1&#8217;57&#8221;)，点这里；两个软件是亲兄弟，当然哥俩好啦！
</li>
<li>文件选择(3&#8217;08&#8221;)，点<a target="_blank" href="http://www.powergrep.com/demos/filesel.swf">这里</a>；PowerGREP提供了贴心的特性，来帮助你筛选需要的文档。</li>
<li>其它特性(8&#8217;37&#8221;)，点<a target="_blank" href="http://www.powergrep.com/demos/action.swf">这里</a>；总而言之，PowerGREP是功能强大。自己发掘吧！</li>
</ul>
<h3 style="color: #127ADB; font-size:14px; padding-bottom:3px; padding-top:3px; margin:1.5em 0 1em;">软件下载</h3>
<p> 目前其最新版为3.4.2，更新于2008年1月18日。其官网为<a href="http://www.powergrep.com/" target="_blank">www.powergrep.com</a>，可以去下载其最新版试用。<strong>该软件为商业软件</strong>。
<ul>
<li>如果你偶然路过，尝新而已，那只需<a href="http://www.powergrep.com/download.html" target="_blank">下载试用版</a>即可；</li>
<li>如果你觉得好用、准备常用、手有余钱、非正版不用，不妨<a http:="" www.powergrep.com="" buynow.html="">花美金购买</a>；要花人民币1000多块哟^_^</li>
<li><del datetime="2009-01-08T01:51:13+00:00">如果你喜欢它，同时你认为优秀的网络资源是应该和朋友免费分享的，从而想获得该软件的全功能免费版，好吧，我也成全你，请在本文后留言（附邮箱），我会把这个小东西的链接发给你(最新版为3.4.2，我手头的全功能版为3.3.3，也足够用了)。</del><strong>更新：</strong><br />
请移步至此下载<a href="http://iregex.org/blog/powergrep350.html">PowerGREP 3.5.0</a>版。</li>
</ul>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;</p>
]]></content:encoded>
			<wfw:commentRss>http://iregex.org/blog/powergrep.html/feed</wfw:commentRss>
		<slash:comments>114</slash:comments>
		</item>
	</channel>
</rss>
