网络爬虫的问题:如何搜索到网页中所有的链接?并将这些链接所在的网页的源代码读取出来?

来源:百度知道 编辑:UC知道 时间:2024/07/02 18:39:45
用vc可以实现嘛?还是需要用c#呢?
如果可以,能否给出源代码并给予制导呢?十分感激!
各位大侠的回答很直接,但是对初学者的我就有点迷惑了...
我现在尝试用vc的MFC实现,但是我只能提取到已经下载下来的网页的源码,可不可以直接通过链接下载到所要的网页以及它的源码呢?这是如何实现的呢?
请大侠们明示啊!

语言不是问题,要源码嘛.好像是不可以的.(我不知道你说的源码是不是我印像中的源码)

你要解释源码,然后根据解释的结果找到其中所有的链接,再把链接里面的内容下载下来................(注意不要重复下载.)

用C#吧

我见过我同学做过一个

主要是要下一个判断正则式的类,用这个类判断某个字符串是否链接

c++ 可以实现 vc c# java 皆可 源代码java的网上可以搜索到 vc的我写了一个 不过不能给你 这可是劳动果实啊

这还不简单嘛
研究下html文件的格式就知道了

网上有例子,自己搜..