C#提取网页的特定代码

来源:百度知道 编辑:UC知道 时间:2024/07/05 02:37:11
网页http://www.tingbook.com/book/update.html中有很多文字链接
各自有各自的网址网址,如:
http://www.tingbook.com/book/4950.html
http://www.tingbook.com/book/25389.html
http://www.tingbook.com/book/4665.html
http://www.tingbook.com/book/7873.html
http://www.tingbook.com/book/1305.html
http://www.tingbook.com/book/5032.html
……

先问一下:http://www.tingbook.com/book/update.html是别人的网站吗?
如果是,你在客户端用javascript读取时会出现一个安全提示:该网页正在访问其控制范围以外的信息,这可能导致安全风险,是否继续?如果你不介意这个提示的话可以按以下思路来编程实现:
1.用XmlHTTP读取网站源码
2.用正则表达式过滤出超链接中的数字
3.将数字填入文本框

建议用服务器端代码实现以上功能,但不知你的服务器代码用何种语言,无法给出具体代码。我在ASP.NET中用C#实现过类似的功能。

正则表达式,具体的查下资料吧