如何用C#获取网页显示的内容? (不是获取html代码!)

来源:百度知道 编辑:UC知道 时间:2024/09/21 08:47:55
我想用C#获取某个网页上显示的内容(注:不是获取html代码)

我已经用vbs实现了这样的功能,源码如下:

Const ForWriting = 2
Set objFSO = CreateObject("Scripting.FileSystemObject")
Set objTextFile = objFSO.OpenTextFile("Kaijiang_xj.txt", ForWriting, True)
Set objIE = CreateObject("InternetExplorer.Application")
'objIE.visible = True
objIE.Navigate("网址")
Do While objIE.ReadyState <>4
Loop
Set objDoc = objIE.Document
Set aTables = objDoc.getElementsByTagName("Table")
For Each objTable In aTables
objTextFile.WriteLine objTable.Innertext
Next
objTextFile.Close
objIE.Quit

另存为*.vbs,执行即可。

请问,怎么用C#实现这样的功能?
用 Webform

其实你这个vbs也是获得html文档,然后解析这个文档里面的节点.

C#
this.form1.InnerText
form1就是runat=server的form

有待研究。

用webRequest+WebResponse实现,然后提取文本内容,可以通过正则表达式提取

WebRequest、WebResponse取得HTML代码后,用SgmlReader解析DOM结构。

有没有一个范例参考一下呢?

InnerText