关于用JAVA写一个针对某站点的网页搜索程序的问题

来源:百度知道 编辑:UC知道 时间:2024/09/20 23:24:56
我先举例:比如有个站点的某个页面是http://hao.hao.com/List.aspx?AlbumID=15444
一看就应该是按主键ID升序排列,我如果想看ID=15445的话就需要再输入IE中,这样就比较麻烦了,如果有10万条数据我就要写10万遍,所以我想让大家帮忙想下我这个需求,需求是这样的:
java程序中,我赋值id=1,500>=id>=1(范围可以修改),这样程序自动的访问500遍这个站点,比如id=200的时候,程序就访问到了一个页面,我需要从这个页面中选点东西显示出来,比如这个页面的源码是:
<html>
<bady>
你好:今天阴天。
</bady>
</html>

我需要列出‘今天阴天’。
这是一个页面的,让它输出到txt文档中。

所以这个程序最后的效果就是,我按照id从1到500访问了500次这个站点,输出的文字就是500个‘你好:’以后的文字。

不知道大家看懂了么?(另:我只是想做个试验,并非想搞躺数据库,大家就当写个白盒把。)给50分先。
我不知道站点的数据库是什么,否则连上describe table 一把就行了,所以这种回答就免了把。

import java.io.*;
import java.net.URL;
import java.net.URLConnection;

public class DownloadPage {
public static void main(String[] args) {
String pre = "http://1997.class.bet007.com/Q/ArticleShow.aspx?ID=";
String suf = "";
int start = 257918;//起始ID
int len = 5;//连续的数量
for(int i=start; i<=start+len; i++){
try {
download(pre,i+"",suf);
} catch (Throwable e) {}
}
}

public static Object download(String prefix,String special,String suffix) throws Throwable{
URL url = new URL(prefix+special+suffix);
URLConnection uc =url.openConnection();
BufferedReader br = new BufferedReader(new InputStreamReader(uc.getInputStream()));
String tmp = null;
System.out.println(url.toString());
while((tmp=br.readLine()