用java实现提取指定网页中的表格数据?

来源:百度知道 编辑:UC知道 时间:2024/09/28 06:53:12
想用java编程来实现抽取指定网站上的一些表格数据内容,比如买书的网站上,有新书发布,我想把所有的新书的信息提取出来,比如书名,作者,出版社等,并导入数据库,请问如何实现,要相关的源代码。谢谢!
2楼的不错,但不是我想要的,仍很感谢,
我想得到的是纯用java,连接网页,并从中下其中表格中的数据,然后用于更新数据库,----不是java script用网页部分来实现---我想得到的是给一个网页,用java连接并分析下载到其中表格的数据到本地,
知道的发给我,谢谢了

把下面代码复制到文本文档中,然后将文本文档改成".html"形式
这个是提取表格中的数据的方法,看看是你想要的不
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<META NAME="Generator" CONTENT="EditPlus">
<META NAME="Author" CONTENT="">
<META NAME="Keywords" CONTENT="">
<META NAME="Description" CONTENT="">
</HEAD>
<SCRIPT LANGUAGE="JavaScript">
<!--

//获得table的tr td等属性
function getTableAtt(){
alert('该table有'+document.all.oTabless.rows.length+'个tr')
for (i=0; i < document.all.oTabless.rows.length; i++) {
//循环每个tr里的td
for (j=0; j < document.all.oTabless.rows(i).cells.length; j++) {
alert('第'+(i+1)+'个tr中的第'+(j+1)+'个td的值为:'+document.all.oTabless.row