通过cURL抓一张带数据表的页面,只要得到TR下所有的单元格,用下面这种方法
$content = 内容;
preg_match_all('/<td>(.*?)<\/td>/',$content,$res);
但是有两种情况无法匹配
<td>
内容
</td>
和
<td class="sorting_1">
未付
</td>
不知道为什么多了很多空格的单元格和带class的单元格无法匹配出来?由于不会正则,求一个pattern能够完全匹配出TD。还有一个问题,页面上有两个table.一个用于各种条件筛选数据,一个盛放数据,如何只匹配盛放数据的那个table呢?
$pattern = "/<td.*?>([\s\S]*?)<\/td>/";
我也不太会,应该可以
.在单行模式下无法匹配换行。
你可以用
\s
匹配任意的空白符
\S
匹配任意不是空白符的字符
举一反三啊,匹配带class的td
/<td[\s\S]*?>([\s\S]+?)<\/td>/
匹配其中某个table的,同样举一反三啊,先从所有内容中匹配出table到一个数组中.
/<table[\s\S]*?>([\s\S]+?)<\/table>/
然后看你要第几个,再用上面的正则匹配次不就好了。
还是那句话,举一反三啊!