Vb自动读取本地HTML,VB读取网页内容 方法汇总 - mystic的个人空间 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...
工作需要!有个网页有很多的内容,要读取! 首先网页上有很多标题,每个标题对应着相应的网页,要把这个相应的网页内容读出来,怎么做?不知说清楚没!举个例子吧! 比如xxx.xxx.xxx.xx这是一个网页,这个网页里只显示标题,如: 1,xxxxxxx 2,xxxxx 3xxxx 4xxxx 有很多页,而每个标题又对应相应的网页,这个网页里的内容要把它读出来。要怎么做呢?谢谢!
问题补充:非常感谢你的回答!可以获取内容,但现在又有新的问题,获取的是整个网页的内容,我只要里面
--
之间的内容,要怎么弄呢?谢谢!
ik.qb.data.add('page','fromWap','0');
最佳答案
这里有两中方法,个人觉得第一种比较快,而且第二种字体总显示乱码。 1、利用inet控件 放一个Internet Transfer Control,一个按纽和两个文本框在窗体上 text1用来输入网址,text2用来输入暂存的文件名如c:\temp.htm 然后输入以下代码 Private Sub Command1_Click() Dim B() As Byte '取消所有操作 Inet1.Cancel '设定协议为HTTP Inet1.Protocol = icHTTP '设定URL属性 Inet1.URL = Text1 '将读取的HTML数据放进一个byte array B() = Inet1.OpenURL(, icByteArray) '建立一个暂存文件来存放取回来的html文件 Open Text2 For Binary Access Write As #1 Put #1, , B() Close #1 MsgBox "ok" End Sub 2、利用webbrower控件 和上边放一样的控件,不过把inet改成webbrower控件(引用的时候选internet controls就可以了),另外再加一个timer控件 然后加入以下代码 Private Sub Command1_Click() WebBrowser1.Navigate Text1 Timer1.Enabled = True End Sub Private Sub Timer1_Timer() Dim Doc, ObjHtml As Object Dim StrHtml As String Dim B() As Byte If Not WebBrowser1.Busy Then Set Doc = WebBrowser1.Document Set bjHtml = Doc.body.createtextrange() If Not IsNull(ObjHtml) Then B() = ObjHtml.htmltext Open "c:\temp.htm" For Binary Access Write As #1 Put #1, , B() Close #1 End If Timer1.Enabled = False MsgBox "ok" End If End Sub 朋友你好,你现在会读HTML了,但是现在要读取指定标签里的内容,比如
中的,你可以这样: 放一个WebBrowser(引用部件的Microsoft Internet Controls) 然后复制下面的代码: Private Sub Form_Load() WebBrowser1.Navigate2 "那个网页的地址/文件地址" End Sub Private Sub WebBrowser1_DocumentComplete(ByVal pDisp As Object, URL As Variant) Dim doc As Object, i Set doc = WebBrowser1.Document For Each i In doc.getelementsbytagname("p") Text1.Text = Text1.Text & " " & i.innertext '得到所有p标签元素;然后将内容(非HTML,这样过滤H5标签)加入文本框 Next End Sub '祝楼主你成功喔!
VB.NET:读取网页的方法
网页抓取及下载 2008-10-31 01:35:21 阅读42 评论0字号:大中小
用 HttpWebResponse 相关类 GET 和 POST 信息
一、用GET方式读取网页源代码:
Dim httpReq As System.Net.HttpWebRequest 'HttpWebRequest 类对 WebRequest 中定义的属性和方法提供支持,也对使用户能够直接与使用 HTTP 的服务器交互的附加属性和方法提供支持。
Dim httpResp As System.Net.HttpWebResponse
Dim url as String=“ http://www.Tuenhai.com 'tuenhai的小站
Dim httpURL As New System.Uri(url)
httpReq = CType(WebRequest.Create(httpURL), HttpWebRequest)
httpReq.Method = "GET"
httpResp = CType(httpReq.GetResponse(), HttpWebResponse)
Dim reader As StreamReader = _
New StreamReader(httpResp.GetResponseStream, System.Text.Encoding.GetEncoding("GB2312")) ' 如是中文,要设置编码格式为 "GB 2312" 。
Dim respHTML As String = reader.ReadToEnd() 'respHTML 就是网页源代码
httpResp.Close()
二、向服务器 POST 信息:
Dim httpUrl2 As New System.Uri(" http://www.Tuenhai.com?"& "name=1&pass= 6" ) ' "&" 号后面是' 注册信息,改成你自己的
Dim req As HttpWebRequest
req = CType(WebRequest.Create(httpUrl2) , HttpWebRequest)
req.Method = "POST"
req.ContentType = "application/x-www-form-urlencoded"
Dim bytesData() As Byte = System.Text.Encoding.ASCII.GetBytes("name=1&pass= 6")
req.ContentLength = bytesData.Length
Dim postStream As Stream = req.GetRequestStream()
postStream.Write(bytesData, 0 , bytesData.Length) ' 以上为向网络服务器 POST 信息
Dim res As HttpWebResponse = CType(req.GetResponse(), HttpWebResponse)
Dim reader As StreamReader = _
New StreamReader(res.GetResponseStream , System.Text.Encoding.GetEncoding("GB2312"))
Dim respHTML As String = reader.ReadToEnd() 'respHTML 为 POST 后网络服务器返回的信息
MsgBox(respHTML) ' 可用 MsgBox 查看返回的信息
res.Close()
三、用正则表达式从网页源代码中提取网址
得到网页源代后,我们可以对源代码进行处理,比如提取其中的链接, Email 地址,图片地址, Flash 等等,这在论坛自动发贴软件工具中很有用。
Dim r As System.Text.RegularExpressions.Regex
Dim m As System.Text.RegularExpressions.MatchCollection
Dim respHtml As String =" http://www.NETsh.Net/subdomains/f_s_o.php?leibie=shangmao "' 以这个地址举例
strRegex ="http://([\w]+\.)+[\w]+(/[\w.?]+)+leibie[=]{1}[\w]+" ' 用这个正则表达式可以提取上面地址。通用 ' 的提取链接正则表达式为 "http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)? "。
r = New System.Text.RegularExpressions.Regex(strRegex, System.Text.RegularExpressions.RegexOptions.IgnoreCase)
m = r.Matches(respHTML)
Dim i As Integer
For i = 0 To m.Count - 1
MsgBox(m(i).Value)
Next i
vb读取网页源码
━━━━━━━━━━━━━━━━━━━━━━━━━━
Private Sub Command1_Click()
Dim Inet As Object
Dim s As String
Set Inet = CreateObject("InetCtls.Inet")
Inet.RequestTimeOut = 20
Inet.Url = "http://www.google.com.tw"
s = Inet.OpenURL
MsgBox s
End Sub
Vb自动读取本地HTML,VB读取网页内容 方法汇总 - mystic的个人空间 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...相关推荐
- db2 修改表空间自增长_db2自动调整表空间的大小 - 木子日京的个人空间 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...
db2自动调整表空间的大小 上一篇 / 下一篇 2009-02-06 11:47:19 在 DB2® 数据库系统中存在两种类型的基本表空间:系统管理的空间(SMS)和数据库管理的空间(DMS). 与 ...
- jq ajax 读取本地文件,jquery读取本地文件
$(document).ready(function(){ $("#b01").click(function(){ htmlobj=$.ajax({url:"/jquer ...
- php读本地json文件内容,php读取本地json文件有哪些方法
这次给大家带来php读取本地json文件有哪些方法,php读取本地json文件的注意事项有哪些,下面就是实战案例,一起来看一下. 1.data.json文件{ "goods":[ ...
- java读取本地文件_java 读取本地文件实例详解
java 读取本地文件实例详解 用javax.xml.w3c解析 实例代码: package cn.com.xinli.monitor.utils; import org.w3c.dom.Docume ...
- java 读取本地文件_java 读取本地文件实例详解
java 读取本地文件实例详解 用javax.xml.w3c解析 实例代码: package cn.com.xinli.monitor.utils; import org.w3c.dom.Docume ...
- flash air中读取本地文件的三种方法
actionscript中读取本地文件操作有两种代码如下 1.使用File和FileStream两个类,FileStream负责读取数据的所以操作:(同步操作) ? 1 2 3 4 5 var str ...
- Vb自动读取本地HTML,VB获取网页源代码的五种方法
方法1:inet控件调用方法 Inet1.OpenURL 添加microsoft ineternet transfor conctrol6.0 控件 方法2:XMLHTTP '如果出现乱码,UTF-8 ...
- JS读取本地文件及目录的方法
Javascript是网页制作中离不开的脚本语言,依靠它,一个网页的内容才生动活泼.富有朝气.但也许你还没有发现并应用它的一些更高级的功能吧?比如,对文件和文件夹进行读.写和删除,就象在VB.VC等高 ...
- JS input[type=file]读取本地文件(读取json文件)
这里从添加input元素开始做起,如果不用添加的话,直接从绑定onchang事件开始就可以了 // 创建input元素 let input_element = document.createEleme ...
- java读取本地文件下载_java 读取本地的json文件
首先,要先去下载相关的jar包,否则你是无法做到的. 在百度或者谷歌里面输入java json jar包下载就行了(共7个包). xom-1.1.jar ezmorph-1.0.6.jar json ...
最新文章
- bzoj 1601 最小生成树
- C语言,C#,Java,JavaScript之强类型与弱类型
- libslog---高性能开源C/C++多线程安全日志库
- jqGrid edit总结
- extjs之TypeError: d.read is not a function解决方案
- POJ3244(工科数学分析)
- windows 2008 server NTP Server
- 牛客网 链表结构 算法相关内容
- 可编程CDN – EdgeScript应用场景、语言速览和实操演示
- 修改程序的形而上学思考(随笔)
- linux 系统显示很大,在Linux中可视化显示内存占用情况的方法
- 当数据改变时,VUE是如何实现DOM更新的?
- JAVA实现UDP通信
- 平面上两直线的夹角求法解析
- Shader特效之图片波动炫光效果
- 关于计算机未来理想,坚持理想向往未来的励志说说
- 重复一下:关于Flash停止支持后Chrome如何启用过期插件
- Switch游戏机Type-C底座方案
- 3dsmax网格重构细分
- 不给代码写文档,让代码文档化