大侠帮忙写一个正则表达式

来源:百度知道 编辑:UC知道 时间:2024/06/27 15:20:06
http://www.hxen.com/englishnews/world/2009-04-14/73096.html
我想提取这个链接的新闻正文部分(打开链接右键->查看源代码就行了),一直想不出好的正则表达式来提取,哪位大侠能帮忙提取啊
可以一个表达式搞定 或者 多个表达式 只要能提取就行
急,搞定大送分啊!!!

<div\s+id="arctext".*?</div> 

(.*?)<div\s+class="endPageNum" 

$1就是正文,还含有一些HTML,你应该可以自己处理下

\<\/script\>\<\/div\>\r\n(?<temp>\s*[\w\W]*?)\<div\sclass=\"endPageNum\"\>