求java语言写的可以将任何网页转换成xml文件的代码

来源:百度知道 编辑:UC知道 时间:2024/09/23 05:29:03
急!!!如题,网上找了一些代码,但不是任意的网页都可以成功转换成xml文件,求可以转换任意网页的java代码,使用的分析器也请说明一下,谢谢了

可发至我邮箱sdonghmsn@126.com,谢谢
行的话可另加分
任意网页是说比如有任意的URL,都可以将此网页转换成XML文件,因为后续我要进行wellFormat-XML文件的分析
具体说,给定任意一个URL,这个URL对应的网页转成标准格式的XML文件
当然代码运行是与网络进行连接是必要的
谢谢,急用,就今明两天!!!

例如这些URL:http://www.da-ben.com/ArticleShow.asp?ArticleID=717&gclid=CL6d2PfzopUCFQoNewodwwNtjw
http://www.cnqianbaiyi.com/pic.swf
http://www.czhsym.cn/product.asp
http://www.gm-packing.com/product11.htm

要求不明,

A.是你已经有一个html文件,要转成XML?
B.还是在网要打开一个网页,并把它变也一个XML文件保存下来?

200分就想要着玩意,这已经属于人工智能范围了 应该是个别公司研究的东西,想baidu 弄到可能性0 ???

你自己就该整套思路 就跟 小偷程序一样 都必须 指定页面偷取内容 不同网站都需要去分析 !!!!
分析完了 解析content 然后 iteator 生成XML格式

这个可不大好写啊,那也不是一两句话的事