工作中会经常利用Excel进行工作的辅助,制表,统计,总结等。其实Excel有一个比公式还要强大的功能,就是VBA。可以利用VBA进行编程,实现公式以外的复杂功能。

用下面的例子来简单介绍一下如何利用VBA进行爬虫。

Sub HTTPREQUEST()Dim httpReq As XMLHTTP60
Set httpReq = New XMLHTTP60Dim Content As String
Dim arr1() As String
Dim arr2() As String
Dim arr3() As String
Dim arr4() As StringhttpReq.Open "GET", "https://nihongokyoshi-net.com/2019/07/03/jlptn1-grammar-ikan/"
httpReq.SendDo While httpReq.readyState < 4DoEvents
LoopDebug.Print httpReq.responseTextContent = httpReq.responseText
arr1 = Split(Content, "<section class=""single-post-main"">")
arr2 = Split(arr1(1), "</section>")
arr3 = Split(arr2(0), "<span id=""i"">")
arr4 = Split(arr3(1), "</span>")
Sheet1.Cells(1, 1) = arr4(0)arr3 = Split(arr2(0), "<span class=""s1"">")
arr4 = Split(arr3(1), "</span>")
Sheet1.Cells(2, 1) = arr4(0)Set httpReq = NothingEnd Sub

还有更复杂的方法,比如多线程之类的,后续再介绍。

技术手段VBA之爬虫相关推荐

  1. EXCEL 自定义函数之公历转农历,VBA通过爬虫实现

    逛excelhome论坛时,有网友问到如何将公历自动转为农历.趁傍晚有点空闲时间,练一练手,特此记录,以便后期使用. 效果: 代码: Function nongli(gongli_date)'函数说明 ...

  2. python爬虫教程下载-Python爬虫入门教程!手把手教会你爬取网页数据

    其实在当今社会,网络上充斥着大量有用的数据,我们只需要耐心的观察,再加上一些技术手段,就可以获取到大量的有价值数据.这里的"技术手段"就是网络爬虫.今天就给大家分享一篇爬虫基础知识 ...

  3. 一篇文章教你如何使用python爬虫

    一.什么是爬虫 通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程. 1.爬虫带来的风险可以体现在如下2方面: 爬虫干扰了被访问网站的正常运营 爬虫抓取了收到法律保护的特定类型的数据或信息 ...

  4. python 网络爬虫介绍

    一.网络爬虫相关概念 网络爬虫介绍 我们都知道,当前我们所处的时代是大数据的时代,在大数据时代,要进行数据分析,首先要有数据源,而学习爬虫,可以让我们获取更多的数据源,并且这些数据源可以按我们的目的进 ...

  5. python网络爬虫基础day01

    2019.5.13,今天在"小猿圈"跟着波波老师学习了爬虫开发的第一章和第二章,总结下今天学的知识: 爬虫基础介绍: 什么是爬虫? - 通过编写程序,模拟浏览器上网,然后让其去互联 ...

  6. python学习笔记分享(四十)网络爬虫(7)反爬虫问题,解决中文乱码,登陆和验证码处理

    网络爬虫深度知识 一.反爬虫问题 (一)反爬虫原因 1.网络爬虫浪费了网站的流量 2.数据是私有资源 3.爬虫协议与原则 (二)反爬虫方式 (三)反反爬虫 1.原理 2.三种方法 二.解决中文乱码 ( ...

  7. python爬虫学习_junior

    一.爬虫简介 1.1 什么是爬虫 通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程. 1.2 爬虫的价值 目前是大数据时代,谁掌握的数据越多,谁就更加具有主导权,获取更多的数据,使这些数 ...

  8. 爬虫入门,了解爬虫机制

    基础知识 爬虫在使用场景中的分类 通用爬虫:抓取系统重要组成部分.抓取的是一张页面数据 聚焦爬虫:是建立在通用爬虫的基础之上.抓取的是页面中特定的局部内容 增量是爬虫:检测网站中数据更新的情况.只会抓 ...

  9. Python爬虫---爬虫介绍,实战案例

    目录标题 1.爬虫介绍 1.1 爬虫的合法性 1.2 网络爬虫的尺寸 1.3 robots.txt协议 1.4 http&https协议 1.5 requests模块 1.5.1 reques ...

最新文章

  1. BZOJ5319 洛谷4559 LOJ2551:[JSOI2018]军训列队——题解
  2. FoxPro 常用内部函数
  3. Chrome 技术篇-console控制台检测xpath、css唯一性
  4. Shell脚本的学习笔记一:变量
  5. WPF效果第一百七十八篇ItemsControl旋转
  6. 【数据结构与算法】字符串匹配 BM算法
  7. linux电脑管理员身份运行,在Ubuntu 20.04 LTS中添加“以管理员身份打开”
  8. RTOS原理与实现08:存储块实现
  9. 苹果笔记本调整 pycharm 字体大小的地方
  10. 应届生去软通动力怎么样_超强干货:应届生如何找实习工作?
  11. discuz mysql配置文件_MySQL优化配置文件my.ini(discuz论坛)
  12. ios 性能优化之图形性能测试
  13. 转liunx 常用命令
  14. 基于SSD目标检测模型的人脸口罩识别
  15. C#显示和隐藏 Excel 工作表及工作表中的行与列
  16. JS动态添加元素后事件不起作用失效
  17. 第二十二章 MySQL有哪些“饮鸩止渴”提高性能的方法?
  18. Android 4.3 隐藏功能 App Ops 分析
  19. 微信开发者工具配置连接Gitee
  20. 注册表中如何查找计算机名,怎么进行注册表搜索

热门文章

  1. 新海诚没有参与制作的作品_由新海诚创作,却成为冷门的一部动漫,至今都没看懂...
  2. IDEA全局代码格式化
  3. 《江山美人》:程小东的利落与编剧群的故步自封
  4. 【设计模式】Java设计模式 - 享元模式
  5. 如何用自己电脑架设服务器
  6. 华为手机如何更新鸿蒙系统_华为鸿蒙系统可以更新用上啦
  7. 笔戈科技到底是不是魅族的?
  8. 青提WiFi微信小程序功能介绍解析及其运营常见问题
  9. 广九客运段铁路“姐妹花”春运真情服务获旅客点赞
  10. oppo怎么广告接入_oppo信息流广告投放操作指南