技术手段VBA之爬虫
工作中会经常利用Excel进行工作的辅助,制表,统计,总结等。其实Excel有一个比公式还要强大的功能,就是VBA。可以利用VBA进行编程,实现公式以外的复杂功能。
用下面的例子来简单介绍一下如何利用VBA进行爬虫。
Sub HTTPREQUEST()Dim httpReq As XMLHTTP60
Set httpReq = New XMLHTTP60Dim Content As String
Dim arr1() As String
Dim arr2() As String
Dim arr3() As String
Dim arr4() As StringhttpReq.Open "GET", "https://nihongokyoshi-net.com/2019/07/03/jlptn1-grammar-ikan/"
httpReq.SendDo While httpReq.readyState < 4DoEvents
LoopDebug.Print httpReq.responseTextContent = httpReq.responseText
arr1 = Split(Content, "<section class=""single-post-main"">")
arr2 = Split(arr1(1), "</section>")
arr3 = Split(arr2(0), "<span id=""i"">")
arr4 = Split(arr3(1), "</span>")
Sheet1.Cells(1, 1) = arr4(0)arr3 = Split(arr2(0), "<span class=""s1"">")
arr4 = Split(arr3(1), "</span>")
Sheet1.Cells(2, 1) = arr4(0)Set httpReq = NothingEnd Sub
还有更复杂的方法,比如多线程之类的,后续再介绍。
技术手段VBA之爬虫相关推荐
- EXCEL 自定义函数之公历转农历,VBA通过爬虫实现
逛excelhome论坛时,有网友问到如何将公历自动转为农历.趁傍晚有点空闲时间,练一练手,特此记录,以便后期使用. 效果: 代码: Function nongli(gongli_date)'函数说明 ...
- python爬虫教程下载-Python爬虫入门教程!手把手教会你爬取网页数据
其实在当今社会,网络上充斥着大量有用的数据,我们只需要耐心的观察,再加上一些技术手段,就可以获取到大量的有价值数据.这里的"技术手段"就是网络爬虫.今天就给大家分享一篇爬虫基础知识 ...
- 一篇文章教你如何使用python爬虫
一.什么是爬虫 通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程. 1.爬虫带来的风险可以体现在如下2方面: 爬虫干扰了被访问网站的正常运营 爬虫抓取了收到法律保护的特定类型的数据或信息 ...
- python 网络爬虫介绍
一.网络爬虫相关概念 网络爬虫介绍 我们都知道,当前我们所处的时代是大数据的时代,在大数据时代,要进行数据分析,首先要有数据源,而学习爬虫,可以让我们获取更多的数据源,并且这些数据源可以按我们的目的进 ...
- python网络爬虫基础day01
2019.5.13,今天在"小猿圈"跟着波波老师学习了爬虫开发的第一章和第二章,总结下今天学的知识: 爬虫基础介绍: 什么是爬虫? - 通过编写程序,模拟浏览器上网,然后让其去互联 ...
- python学习笔记分享(四十)网络爬虫(7)反爬虫问题,解决中文乱码,登陆和验证码处理
网络爬虫深度知识 一.反爬虫问题 (一)反爬虫原因 1.网络爬虫浪费了网站的流量 2.数据是私有资源 3.爬虫协议与原则 (二)反爬虫方式 (三)反反爬虫 1.原理 2.三种方法 二.解决中文乱码 ( ...
- python爬虫学习_junior
一.爬虫简介 1.1 什么是爬虫 通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程. 1.2 爬虫的价值 目前是大数据时代,谁掌握的数据越多,谁就更加具有主导权,获取更多的数据,使这些数 ...
- 爬虫入门,了解爬虫机制
基础知识 爬虫在使用场景中的分类 通用爬虫:抓取系统重要组成部分.抓取的是一张页面数据 聚焦爬虫:是建立在通用爬虫的基础之上.抓取的是页面中特定的局部内容 增量是爬虫:检测网站中数据更新的情况.只会抓 ...
- Python爬虫---爬虫介绍,实战案例
目录标题 1.爬虫介绍 1.1 爬虫的合法性 1.2 网络爬虫的尺寸 1.3 robots.txt协议 1.4 http&https协议 1.5 requests模块 1.5.1 reques ...
最新文章
- BZOJ5319 洛谷4559 LOJ2551:[JSOI2018]军训列队——题解
- FoxPro 常用内部函数
- Chrome 技术篇-console控制台检测xpath、css唯一性
- Shell脚本的学习笔记一:变量
- WPF效果第一百七十八篇ItemsControl旋转
- 【数据结构与算法】字符串匹配 BM算法
- linux电脑管理员身份运行,在Ubuntu 20.04 LTS中添加“以管理员身份打开”
- RTOS原理与实现08:存储块实现
- 苹果笔记本调整 pycharm 字体大小的地方
- 应届生去软通动力怎么样_超强干货:应届生如何找实习工作?
- discuz mysql配置文件_MySQL优化配置文件my.ini(discuz论坛)
- ios 性能优化之图形性能测试
- 转liunx 常用命令
- 基于SSD目标检测模型的人脸口罩识别
- C#显示和隐藏 Excel 工作表及工作表中的行与列
- JS动态添加元素后事件不起作用失效
- 第二十二章 MySQL有哪些“饮鸩止渴”提高性能的方法?
- Android 4.3 隐藏功能 App Ops 分析
- 微信开发者工具配置连接Gitee
- 注册表中如何查找计算机名,怎么进行注册表搜索