用EXCEL批量获取网页标题的方法
这段时间准备做淘宝,但不知道卖什么产品,因此想从一些B2B 网站上扒拉一些产品词下来挨个研究,但一个一个的打开网页查看产品太慢太费事,但想到这些产品词都存在于网页标题上,因此想到了用excel来批量获取网页的标题。经过一番查找,在网上找到了两种方法(其实是两组代码)。
打开excel找到开发者工具,点击"Visual Basic"
在下图所示位置右键点击添加模块
填入如下代码:
Function Title(url As String) As String
With CreateObject("Microsoft.XMLHTTP")
'防止输入的url不管带不带http都可以转换带http的
url = "http://" & Replace(url, "http://", "")
.Open "GET", url, False
.send
url = .responsetext
'如果源代码中含有charset=gb或者chartset="gb ,hao123的源代码是charset="gbk"那么进行2进制代码responsebody转换为unicode
If InStr(url, "charset=""gb") Or InStr(url, "charset=gb") Then url = StrConv(.responseBody, vbUnicode)
'不管charact是不是gb的都okay 可以专心进行split(url)字符串了,以上适用任何网页
Title = Split(Split(url, "<title>")(1), "</title>")(0)
End With
End Function
或者如下代码,根据网页语言不同而不同
Function Title(ByVal url As String) As String
On Error Resume Next
url = "http://" & Replace(url, "http://", "")
With CreateObject("Msxml2.XMLHTTP")
.Open "get", url, False
.send
Title = Split(Split(.responsetext, "<title>")(1), "</title>")(0)
End With
然后回到excel,把要获取的标题网页URL填进去,在标题输出行填入"=title(A1)",剩下的直接往下拖就行了。比如获取这些网页的标题:
http://www.zhenhuajiao.com/archives/483
http://www.zhenhuajiao.com/archives/482
http://www.zhenhuajiao.com/archives/481
http://www.zhenhuajiao.com/archives/480
http://www.zhenhuajiao.com/archives/479
最后的结果是这样的:
非常实用。只是在获取标题期间excel会出现卡顿的情况,这时候千万不要去碰它,容易卡死。
转载于:https://blog.51cto.com/12027889/1845259
用EXCEL批量获取网页标题的方法相关推荐
- excel批量提取网页标题
最近时间比较忙,有时候很多网页需要临时保存,以便空闲的时候查看.单纯的保存网页链接会让人很枯燥,所以需要自动批量提取标题. 为了这个小功能去写个小程序有点不划算,所以就利用excel实现了这个功能. ...
- wps excel批量获取网址标题(Title)
wps excel启用宏 下载wps.vba.exe 链接: https://pan.baidu.com/s/1kMvoVfzzi719oAcfmoNpGw 密码: qn86 b站教程 安装wps.v ...
- html获取网站标题,批量获取网站标题
[实例简介] 批量获取网站的标题 [实例截图] [核心代码] using HttpCodeLib; using System; using System.Collections.Generic; us ...
- 怎么改vue项目的标题_Vue动态修改网页标题的方法及遇到问题
业务需求,进入页面的时候,网页有个默认标题,加载的网页内容不同时,标题需要变更. 例:功能授权,功能授权(张三). Vue下有很多的方式去修改网页标题,这里总结下解决此问题的几种方案: 一.最笨方案 ...
- 批量采集html软件,在线批量获取网页链接工具 浏览器插件版-♚付涛纪实阁♚
这两天在弄网站蜜蜂采集的时候,发现原来收藏的一个[在线批量获取网页链接工具]工具对应的网站已经不知道什么原因打不开了:在百度里面通过这个词去一搜索,一初搜索,看到百度结果里面拥有大量的匹配信息,但是经 ...
- php批量修改标题,帝国CMS批量修改信息标题的方法
作为网站编辑,经常需要修改文章标题,如何快速修改呢?批量修改信息标题就是不错的主意.本文将介绍实现批量修改信息标题的方法. 以下修改方法可以同时用于 e/data/html/list/alllisti ...
- C#之获取网页标题...
完整源码下载地址:http://download.csdn.net/download/friendan/4337765 效果截图如下: 主要代码如下: //获取网页标题函数private String ...
- c# 获取html代码怎么写,C#获取网页源代码的方法
本文实例讲述了C#获取网页源代码的方法.分享给大家供大家参考.具体如下: public string GetPageHTML(string url) { try { HttpWebRequest wr ...
- python获取网页标题_Python2获取网页标题
Python获取网页标题 使用Python2.x的urllib2和lxml,速度应该还快于BeautifulSoup4(话说回来,为什么大家都要用BS4呢?一个XPATH不就完了吗) 没有安装过的,用 ...
最新文章
- svn清理失败且乱码 问题解决(转)
- python formatters 与字符串 小结 (python 2)
- wordpress上传主题错误解决方法
- 最长有效括号—leetcode32
- 如何从心理上缓解对浑浊物的恐惧?
- rabbitmq-通配符模式
- C#面向对象基础(六) 继承
- vue学习笔记-03-浅谈组件-概念,入门,如何用props给组件传值?
- 大数据之-Hadoop3.x_MapReduce_Combiner概述---大数据之hadoop3.x工作笔记0118
- Linux添加磁盘和挂载
- OpenWrt 防火墙组件
- Win10蓝牙驱动程序错误怎么回事?
- 【NIO】解读 java.nio.channels.Channel
- Vue弹性标题栏(收缩扩张标题栏背景)
- Python计算卡方值
- 无法连接虚拟设备 ide1:0,因为主机上没有相应的设备。 您要在每次开启此虚拟机时都尝试连接此虚拟设备吗?
- Jmeter+ant实现接口自动化(三)
- SK海力士量产业界最高容量的移动端DRAM
- 病毒分析要掌握的技能
- 整理总结:机器学习常用九大算法