工作需要!有个网页有很多的内容,要读取! 首先网页上有很多标题,每个标题对应着相应的网页,要把这个相应的网页内容读出来,怎么做?不知说清楚没!举个例子吧! 比如xxx.xxx.xxx.xx这是一个网页,这个网页里只显示标题,如: 1,xxxxxxx 2,xxxxx 3xxxx 4xxxx 有很多页,而每个标题又对应相应的网页,这个网页里的内容要把它读出来。要怎么做呢?谢谢!

问题补充:非常感谢你的回答!可以获取内容,但现在又有新的问题,获取的是整个网页的内容,我只要里面

--

之间的内容,要怎么弄呢?谢谢!

ik.qb.data.add('page','fromWap','0');

最佳答案

这里有两中方法,个人觉得第一种比较快,而且第二种字体总显示乱码。 1、利用inet控件 放一个Internet Transfer Control,一个按纽和两个文本框在窗体上 text1用来输入网址,text2用来输入暂存的文件名如c:\temp.htm 然后输入以下代码 Private Sub Command1_Click() Dim B() As Byte '取消所有操作 Inet1.Cancel '设定协议为HTTP Inet1.Protocol = icHTTP '设定URL属性 Inet1.URL = Text1 '将读取的HTML数据放进一个byte array B() = Inet1.OpenURL(, icByteArray) '建立一个暂存文件来存放取回来的html文件 Open Text2 For Binary Access Write As #1 Put #1, , B() Close #1 MsgBox "ok" End Sub 2、利用webbrower控件 和上边放一样的控件,不过把inet改成webbrower控件(引用的时候选internet controls就可以了),另外再加一个timer控件 然后加入以下代码 Private Sub Command1_Click() WebBrowser1.Navigate Text1 Timer1.Enabled = True End Sub Private Sub Timer1_Timer() Dim Doc, ObjHtml As Object Dim StrHtml As String Dim B() As Byte If Not WebBrowser1.Busy Then Set Doc = WebBrowser1.Document Set bjHtml = Doc.body.createtextrange() If Not IsNull(ObjHtml) Then B() = ObjHtml.htmltext Open "c:\temp.htm" For Binary Access Write As #1 Put #1, , B() Close #1 End If Timer1.Enabled = False MsgBox "ok" End If End Sub 朋友你好,你现在会读HTML了,但是现在要读取指定标签里的内容,比如

中的,你可以这样: 放一个WebBrowser(引用部件的Microsoft Internet Controls) 然后复制下面的代码: Private Sub Form_Load() WebBrowser1.Navigate2 "那个网页的地址/文件地址" End Sub Private Sub WebBrowser1_DocumentComplete(ByVal pDisp As Object, URL As Variant) Dim doc As Object, i Set doc = WebBrowser1.Document For Each i In doc.getelementsbytagname("p") Text1.Text = Text1.Text & " " & i.innertext '得到所有p标签元素;然后将内容(非HTML,这样过滤H5标签)加入文本框 Next End Sub '祝楼主你成功喔!

VB.NET:读取网页的方法

网页抓取及下载 2008-10-31 01:35:21 阅读42 评论0字号:大中小

用 HttpWebResponse 相关类 GET 和 POST 信息

一、用GET方式读取网页源代码:

Dim httpReq As System.Net.HttpWebRequest     'HttpWebRequest 类对 WebRequest 中定义的属性和方法提供支持,也对使用户能够直接与使用 HTTP 的服务器交互的附加属性和方法提供支持。

Dim httpResp As System.Net.HttpWebResponse

Dim url as String=“ http://www.Tuenhai.com  'tuenhai的小站

Dim httpURL As New System.Uri(url)

httpReq = CType(WebRequest.Create(httpURL), HttpWebRequest)

httpReq.Method = "GET"

httpResp = CType(httpReq.GetResponse(), HttpWebResponse)

Dim reader As StreamReader = _

New StreamReader(httpResp.GetResponseStream, System.Text.Encoding.GetEncoding("GB2312"))     ' 如是中文,要设置编码格式为 "GB 2312" 。

Dim respHTML As String = reader.ReadToEnd() 'respHTML 就是网页源代码

httpResp.Close()

二、向服务器 POST 信息:

Dim httpUrl2 As New System.Uri(" http://www.Tuenhai.com?"& "name=1&pass= 6" ) ' "&" 号后面是' 注册信息,改成你自己的

Dim req As HttpWebRequest

req = CType(WebRequest.Create(httpUrl2) , HttpWebRequest)

req.Method = "POST"

req.ContentType = "application/x-www-form-urlencoded"

Dim bytesData() As Byte = System.Text.Encoding.ASCII.GetBytes("name=1&pass= 6")

req.ContentLength = bytesData.Length

Dim postStream As Stream = req.GetRequestStream()

postStream.Write(bytesData, 0 , bytesData.Length) ' 以上为向网络服务器 POST 信息

Dim res As HttpWebResponse = CType(req.GetResponse(), HttpWebResponse)

Dim reader As StreamReader = _

New StreamReader(res.GetResponseStream , System.Text.Encoding.GetEncoding("GB2312"))

Dim respHTML As String = reader.ReadToEnd() 'respHTML 为 POST 后网络服务器返回的信息

MsgBox(respHTML) ' 可用 MsgBox 查看返回的信息

res.Close()

三、用正则表达式从网页源代码中提取网址

得到网页源代后,我们可以对源代码进行处理,比如提取其中的链接, Email 地址,图片地址, Flash 等等,这在论坛自动发贴软件工具中很有用。

Dim r As System.Text.RegularExpressions.Regex

Dim m As System.Text.RegularExpressions.MatchCollection

Dim respHtml As String =" http://www.NETsh.Net/subdomains/f_s_o.php?leibie=shangmao "' 以这个地址举例

strRegex ="http://([\w]+\.)+[\w]+(/[\w.?]+)+leibie[=]{1}[\w]+" ' 用这个正则表达式可以提取上面地址。通用 ' 的提取链接正则表达式为 "http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)? "。

r = New System.Text.RegularExpressions.Regex(strRegex, System.Text.RegularExpressions.RegexOptions.IgnoreCase)

m = r.Matches(respHTML)

Dim i As Integer

For i = 0 To m.Count - 1

MsgBox(m(i).Value)

Next i

vb读取网页源码

━━━━━━━━━━━━━━━━━━━━━━━━━━

Private Sub Command1_Click()

Dim Inet As Object

Dim s As String

Set Inet = CreateObject("InetCtls.Inet")

Inet.RequestTimeOut = 20

Inet.Url = "http://www.google.com.tw"

s = Inet.OpenURL

MsgBox s

End Sub

Vb自动读取本地HTML,VB读取网页内容 方法汇总 - mystic的个人空间 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...相关推荐

  1. db2 修改表空间自增长_db2自动调整表空间的大小 - 木子日京的个人空间 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...

    db2自动调整表空间的大小 上一篇 / 下一篇  2009-02-06 11:47:19 在 DB2® 数据库系统中存在两种类型的基本表空间:系统管理的空间(SMS)和数据库管理的空间(DMS). 与 ...

  2. jq ajax 读取本地文件,jquery读取本地文件

    $(document).ready(function(){ $("#b01").click(function(){ htmlobj=$.ajax({url:"/jquer ...

  3. php读本地json文件内容,php读取本地json文件有哪些方法

    这次给大家带来php读取本地json文件有哪些方法,php读取本地json文件的注意事项有哪些,下面就是实战案例,一起来看一下. 1.data.json文件{ "goods":[ ...

  4. java读取本地文件_java 读取本地文件实例详解

    java 读取本地文件实例详解 用javax.xml.w3c解析 实例代码: package cn.com.xinli.monitor.utils; import org.w3c.dom.Docume ...

  5. java 读取本地文件_java 读取本地文件实例详解

    java 读取本地文件实例详解 用javax.xml.w3c解析 实例代码: package cn.com.xinli.monitor.utils; import org.w3c.dom.Docume ...

  6. flash air中读取本地文件的三种方法

    actionscript中读取本地文件操作有两种代码如下 1.使用File和FileStream两个类,FileStream负责读取数据的所以操作:(同步操作) ? 1 2 3 4 5 var str ...

  7. Vb自动读取本地HTML,VB获取网页源代码的五种方法

    方法1:inet控件调用方法 Inet1.OpenURL 添加microsoft ineternet transfor conctrol6.0 控件 方法2:XMLHTTP '如果出现乱码,UTF-8 ...

  8. JS读取本地文件及目录的方法

    Javascript是网页制作中离不开的脚本语言,依靠它,一个网页的内容才生动活泼.富有朝气.但也许你还没有发现并应用它的一些更高级的功能吧?比如,对文件和文件夹进行读.写和删除,就象在VB.VC等高 ...

  9. JS input[type=file]读取本地文件(读取json文件)

    这里从添加input元素开始做起,如果不用添加的话,直接从绑定onchang事件开始就可以了 // 创建input元素 let input_element = document.createEleme ...

  10. java读取本地文件下载_java 读取本地的json文件

    首先,要先去下载相关的jar包,否则你是无法做到的. 在百度或者谷歌里面输入java json  jar包下载就行了(共7个包). xom-1.1.jar ezmorph-1.0.6.jar json ...

最新文章

  1. bzoj 1601 最小生成树
  2. C语言,C#,Java,JavaScript之强类型与弱类型
  3. libslog---高性能开源C/C++多线程安全日志库
  4. jqGrid edit总结
  5. extjs之TypeError: d.read is not a function解决方案
  6. POJ3244(工科数学分析)
  7. windows 2008 server NTP Server
  8. 牛客网 链表结构 算法相关内容
  9. 可编程CDN – EdgeScript应用场景、语言速览和实操演示
  10. 修改程序的形而上学思考(随笔)
  11. linux 系统显示很大,在Linux中可视化显示内存占用情况的方法
  12. 当数据改变时,VUE是如何实现DOM更新的?
  13. JAVA实现UDP通信
  14. 平面上两直线的夹角求法解析
  15. Shader特效之图片波动炫光效果
  16. 关于计算机未来理想,坚持理想向往未来的励志说说
  17. 重复一下:关于Flash停止支持后Chrome如何启用过期插件
  18. Switch游戏机Type-C底座方案
  19. 3dsmax网格重构细分
  20. 不给代码写文档,让代码文档化

热门文章

  1. 总结命令行05:Kafka
  2. Fliqlo时钟屏保无毒Windows/Mac版
  3. 计算机word如何计算年龄,Excel 如何自动计算年龄
  4. 电磁流量计流速信号特征
  5. ROS中使用RPLIDAR激光雷达
  6. OverFeat心得
  7. 微信小程序父子组件传值
  8. 在MAC OSX系统中删除、添加、恢复、管理launchpad的STEAM游戏图标
  9. 常见的DoS攻击防御方式
  10. “堆排序算法”(C语言实现)