抓取html 中文乱码,利用代码抓取网页数据,出现中文乱码问题
嗯,多谢你解答。试验了,出现了另外一种乱码,自己又再次琢磨了http://club.excelhome.net/thread-893760-1-1.html这个帖子的第一帖,问题解决了,原因是'因为XMLHTTP默认是UTF-8(原网页正是 此编码格式),不能识别gb2312,会发现数据乱码,所以不能采用.responsetext对象来得到字符串。
Sub te4t()
Dim strRespText$, tt$, i&, DW$
On Error Resume Next
For i = 3 To 4
a = Cells(i, 1).Value
With CreateObject("Microsoft.XMLHTTP")
.Open "GET", a, False '要抓取的链接,"GET"尽量用大写,以免某些系统不兼容
.Send
tt = .responsetext
With CreateObject("new:{1C3B4210-F441-11CE-B9EA-00AA006B1A69}") 'DataObject对象,数据放入剪贴板,记事本观察数据
.SetText tt '因为XMLHTTP默认是UTF-8,不能识别gb2312,会发现数据乱码
.PutInClipboard '所以不能采用.responsetext对象来得到字符串
End With
Set BytesToBstr = Server.CreateObject("Adodb.Stream")
tt = BytesToBstr(.responsebody, "GB2312") '因此要用Adodb.Stream对象
'tt = StrConv(.ResponseBody, vbUnicode, &H804) '或者StrConv函数,从.ResponseBody得到字符串
'tt = StrConv(.ResponseBody, vbUnicode) '因网页为GB2312,简体版的操作系统也可以不写第三个参数
With CreateObject("new:{1C3B4210-F441-11CE-B9EA-00AA006B1A69}") '得到的字符串放入剪贴板,记事本观察数据
.SetText tt '数据正常显示,可以提取了
.PutInClipboard
End With
Cells(i, 2).Value = WorksheetFunction.Substitute(Split(Split(tt, "
")(1), "")(0), Chr(10), " ")
Cells(i, 3).Value = WorksheetFunction.Substitute(Split(Split(tt, "16.spid"" target=""_blank"">")(1), "
For j = 1 To 100
Cells(i, 3 + j).Value = WorksheetFunction.Substitute(Split(Split(tt, "")(j), "
If Cells(i, 3 + j) = "" Then GoTo xiayige
Next
xiayige:
End With
Next
MsgBox "【完】"
End Sub
换成这个代码问题就解决了。
抓取html 中文乱码,利用代码抓取网页数据,出现中文乱码问题相关推荐
- 计算机网络抓包设计,计算机网络实验利用wireshark抓包工具抓包
计算机网络实验利用wireshark抓包工具抓包 计算机网络实验[利用wireshark抓包工具抓包] 一.实验名称 使用网络协议分析仪 Wireshark 二.实验目的 1.掌握安装和配置网络协议分 ...
- python抓取交易所_Python百行代码抓取美股三大交易所历史数据
最近闲来无事,琢磨着去投资下美股,投资嘛,当然得先分析下市场行情个股行情啦, 分析就需要有数据,那么数据从哪里来呢,当然是从交易所官方网站获取咯.自己动手丰衣足食,于是花了点时间写个Python脚本来 ...
- 【Python爬虫】5行代码破解验证码+网页数据爬取全步骤详细记录
文章目录 前言 一.抓包分析 二.编写模块代码 1.引入库 2.获取验证码图片 3.识别验证码 4.爬取列表页 5.爬取详情页 6.完整代码 总结 1.TIPS 2.如需交流,可在代码头找到我,或者用 ...
- python爬取网易云_利用python爬取网易云音乐,并把数据存入mysql
作者:sergiojune Python爱好者社区--专栏作者 个人公众号:日常学python 专注python爬虫,数据可视化,数据分析,python前端技术 公众号:Python爱好者社区 获取本 ...
- python爬取图解_20行PYTHON代码爬取微博高清大图,小白练手绝佳案例
0. 前戏说明 环境说明 python3版本 所需库:Beautifulsoup .re .requests 知识点:正则表达式.基本网页请求与解析.文件写入 适用人群:小白 最终目标:20行代码爬取 ...
- c语言里取余数的运算的代码,Math——取模运算及取余运算(示例代码)
取模运算及取余运算 取余运算(Complementation)即我们小学时学的数学算术概念,而取模运算(Modulus Operation)常用于程序设计中 公式 a%b = a - (a/b * b ...
- python抓取网站图片_利用python抓取网站图片
看了网上关于python抓取网站图片的例子,所以自己也尝试着写一个,但是发现这个网站的src不是标准的路径,需要自己添加前面的目录地址,尝试了几次也不成功,所以希望有经验的朋友指导下. 本人是初学者, ...
- java抓取并保存图片_利用JAVA抓取网站的所有图片并保存于本地
由于今天我要保存一个网页上的所有图片并做一个ppt,但是这个网页比较蛋疼,是微信上的一个类似于动画的东西,所以没法保存整个网页然后直接取照片, 所以我采用java写了一个程序,采用类似于网络爬虫的思路 ...
- python爬取app图片_利用python爬取斗鱼app中照片方法实例
前言 没想到python是如此强大,令人着迷,以前看见图片总是一张一张复制粘贴,现在好了,学会python就可以用程序将一张张图片,保存下来. 最近看到斗鱼里的照片都不错,决定用最新学习的python ...
最新文章
- c语言 栈求解表达式_非线性方程组的编程求解方法
- 杀毒时能否使用计算机,电脑杀毒以后,程序无法使用,电脑杀毒后共享不能使用-...
- 强化学习之gym初战实战案例:悬崖案例CliffWalking-v0。
- Linux免密登陆(CentOS7.2为例)
- Oracle调用webservice说明
- 【STM32】外部中断实验代码详解
- 信用评分如何应用在风控策略中(二)
- qt打包rpm时候先安装其他软件_云计算学习路线图素材课件,Linux中软件安装的方式...
- [Head First Java] - Swing做一个简单的客户端
- php上传图片到远程服务器并返回图片地址到本地显示
- 西部数码linux云服务器,linux云服务器选择哪个版本
- python使用函数输出指定范围内fibonacci数的个数_第6章函数-4 使用函数输出指定范围内Fibonacci数的个数...
- 职称计算机初级考试题,初级职称计算机考试题库
- 以阿尔兹海默症为例:深度解析AI+慢病商业模式
- (XWZ)的python学习笔记——pandas
- 镁光闪存颗粒对照表_详解闪存颗粒的种类
- 解决方案:集团型施工企业安全生产数字化管理系统
- '\0'和\0的区别
- 苏嵌//张福辉//2018.7.24
- 毕业论文知网查重之应对办法
热门文章
- SAP中程序间的相互调用,SUBMIT关键字的用法
- “兴趣社区2.0”俘获年轻人
- 为什么牛在天上飞 因为有人在地上吹 谈高德地图说日活过亿
- linux安装pytorch教程,centos下通过conda安装pytorch
- 行为模型实例 php,JS中事件模型的实例详解
- oracle 数字不用,oracle – Plsql将数字(货币)拼写为意大利货币而不用硬编码的翻译编号...
- java小数转换成百分数_在java中如何把小数转化成百分数
- python中的函数、生成器的工作原理
- python文件读read()、readline()、readlines()对比
- c语言代码大全500行,C语言职工档案管理系统 500多行代码1