<ul>
<li class="bt" onclick="javascript:window.parent.ZXCClick('','%u5546%u4E1A%u670D%u52A1','№1011 %u660E%u73E0%u5546%u4E1A%u4E2D%u5FC3','%u5EF6%u5B89%u8DEF%u660E%u73E0%u5C0F%u767E%u8D27%u95E8%u524D','6:30-21:00','13606524069',0,'12',' 9','120.1687055','30.2557050333333','%u002D','','%u004D%u0061%u006E%u0061%u0067%u0065%u002F%u0055%u0070%u006C%u006F%u0061%u0064%u002F%u0066%u0074%u0070%u002F%u0031%u0030%u0031%u0031%u002E%u006A%u0070%u0067','%u004D%u0061%u006E%u0061%u0067%u0065%u002F%u0055%u0070%u006C%u006F%u0061%u0064%u002F%u0066%u0074%u0070%u002F%u0031%u0030%u0031%u0031%u002E%u006A%u0070%u0067','2','');fnDivHidn(this);">
<div style="float: left; vertical-align:middle">
<span style="font-size: 12px; font-weight: normal">№1011</span> 明珠商业中心
</div>
<div style="float: right; vertical-align: middle">
<span style="font-size: 12px; font-weight: normal">可租</span> 12
<span style="font-size: 12px; font-weight: normal">辆 可还</span> 9
<span style="font-size: 12px; font-weight: normal">辆</span></div>
<br>
</li>
<li style="display: none" class="borderDt">
<table cellpadding="0" cellspacing="0" style="font-size: 12px; line-height: 17px;
padding-left: 3px" width="100%">
<tr>
<td>
<strong>服务时间:</strong>6:30-21:00
</td>
</tr>
<tr>
<td>
<strong>值守状态:</strong>
</td>
</tr>
<tr>
<td>
<strong>站点地址:</strong>延安路明珠小百货门前
</td>
</tr>
<tr>
<td>
<strong>服务电话:</strong>13606524069
</td>
</tr>
<tr>
<td>
<strong>其它服务:</strong>商业服务
</td>
</tr>
<tr>
<td>
<strong>站点备注:</strong>正常营运中
</td>
</tr>
<tr>
<td>
以实际时间为准,如有疑问请咨询057185331122
</td>
</tr>
</table>
</li>
</ul>
上面是拉到的html代码,想把相关的中文字符用正则表达式过滤出来。
求问正则表达式该怎么写,
谢谢
楼上的是非中文,中文的正则是:
/[\u4E00-\u9FA5]/
但是看到你贴的代码中,不仅仅是中文,还有空格( )
可以试试这个:
/[\u4E00-\u9FA5]+(?:\ )?[\u4E00-\u9FA5]*/
不过,感觉你不像是只要中文字符而已!
这个不如用php 某个过滤 html的函数
HTMLEntities(StripSlashes($))
Strip_Tags($)