抓取(爬取)网上信息的脚本程序,俗称网络蜘蛛。
powershell中自带了这样的两个命令,【Invoke-WebRequest】和【Invoke-RestMethod】,但这两个命令有时候会乱码。

现在转帖分享, 某个【歪果仁】写的脚本。来源于 墙外出处: https://gist.github.com/angel-vladov/9482676

function Read-HtmlPage {
param ([Parameter(Mandatory=$true, Position=0, ValueFromPipeline=$true)][String] $Uri)# Invoke-WebRequest and Invoke-RestMethod can't work properly with UTF-8 Response so we need to do things this way.
[Net.HttpWebRequest]$WebRequest = [Net.WebRequest]::Create($Uri)
[Net.HttpWebResponse]$WebResponse = $WebRequest.GetResponse()
$Reader = New-Object IO.StreamReader($WebResponse.GetResponseStream())
$Response = $Reader.ReadToEnd()
$Reader.Close()# Create the document class
[mshtml.HTMLDocumentClass] $Doc = New-Object -com "HTMLFILE"
$Doc.IHTMLDocument2_write($Response)# Returns a HTMLDocumentClass instance just like Invoke-WebRequest ParsedHtml
$Doc#powershell 传教士 转帖并修改的文章 2016-01-01, 允许再次转载,但必须保留名字和出处,否则追究法律责任

}

具体效果请大家共同测试。

转载于:https://www.cnblogs.com/piapia/p/5093201.html

转帖不会乱码的,powershell网络蜘蛛相关推荐

  1. 批量修正字幕乱码(powershell)

    批量修正字幕srt文件乱码(powershell) 问题 修正方法 流程 问题 下载的ppt课程中的字幕在暴风影音和kmplayer中打开均为中文乱码.系统为win7 64bit. 修正方法 单次操作 ...

  2. 用C#2.0实现网络蜘蛛(WebSpider)

    摘要:本文讨论了如何使用C#2.0实现抓取网络资源的网络蜘蛛.使用这个程序,可以通过一个入口网址(如http: //www.comprg.com.cn)来扫描整个互联网的网址,并将这些扫描到的网址所指 ...

  3. 网络蜘蛛Spider 工作原理

    网络蜘蛛 Web spider (或称 Crawler)是一种能够跟踪网络上超链接结构,并不断进行网络资源发现与采集的程序.作为搜索引擎的资源采集部分,Web  Spider的性能将直接影响到整个搜索 ...

  4. 关于网络蜘蛛以及搜索蜘蛛爬行

    当"蜘蛛"程序出现时,现代意义上的搜索引擎才初露端倪.它实际上是一种电脑"机器人"(Computer Robot),电脑"机器人"是指某个能 ...

  5. 搜索引擎(网络蜘蛛及搜索引擎基本原理)

    2006-05-25 网络蜘蛛及搜索引擎基本原理 TAG:搜索相关 搜索引擎的工作原理大致可以分为: 搜集信息:搜索引擎的信息搜集基本都是自动的.搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器 ...

  6. 网络爬虫(网络蜘蛛,网络机器人)与Web安全

    网络爬虫概述 网络爬虫(Web Crawler),又称网络蜘蛛(Web Spider)或网络机器人(Web Robot),是一种按照一定的规则自动抓取万维网资源的程序或者脚本,已被广泛应用于互联网领域 ...

  7. NetSpider 网络蜘蛛1.0 的简介

    NetSpider 网络蜘蛛1.0 的简介 支持多线程下载和 自动断点续传.特别适合对网站上的图象文件进行自动下载,是图片 搜集者的利器.详细的使用说明见: 网络蜘蛛是一个自动搜索HTML页面并下载指 ...

  8. 搜索引擎中的网络蜘蛛技术探析

    摘要:搜索引擎技术可以从海量的 网络 信息中获得我们想要的信息,随着网络信息资源的急剧增长其作用越来越显著.本文介绍了搜索引擎技术中的网路蜘蛛,分析了其对文件的处理方法,研究了其搜索与更新策略. 关键 ...

  9. 建立网络链接编程C语言,用C语言编写一个网络蜘蛛来搜索网上出现的电子邮件地址...

    可能大家经常要去互联网上搜索特定的内容,比如收集大量邮件地址,如果用google之类的搜索引擎是没法实现这种特定功能的,所以用C语言来写一个吧.它的功能就是不断去取得网络上的页面,然后分析出网页上出现 ...

最新文章

  1. [Linux学习]Shell脚本(1)--函数,输入,if判断(持续更新)+删除空行 +保存当前路径...
  2. jquery 插件
  3. Comet OJ - 模拟赛 #2 Day2
  4. jQuery .attr() vs .prop()
  5. C语言strchr()函数(字符串中查找子字符)
  6. 走近分形与混沌(part13)--自然现象就其本质来说,是复杂而非线性的
  7. 运行时类加载以支持不断变化的API
  8. nodejs计算时间间隔_Javascript计算时间差的函数分享
  9. Dropping Balls(小球下落)
  10. Centos中关闭tty以及禁止ipv6
  11. 深入浅出计算机组成原理04:存储和IO系统
  12. ASP.NET案例--新闻模块设计
  13. UIView局部点击(转)
  14. Internet Explorer更改MIME处理方式以提高安全性
  15. Flink 新一代流计算和容错——阶段总结和展望
  16. Linux基础命令Xmind图【百度网盘链接】
  17. lua table的__index ,setmetable()的一些操作
  18. 西游记中唐僧师徒的不同性格
  19. PS 学习笔记 16 -渐变工具组
  20. 浅析公关中的“道”与“术”

热门文章

  1. java上下文即ServletContext
  2. php excel导入mysql_PHP将Excel内容导入mysql数据库
  3. IIS 错误代码分析手册
  4. python datetime用法_python datetime用法学习笔记
  5. linux第一章简答
  6. [实践系列]Promises/A+规范
  7. 使用nmcli 实现 bond0 网络组 网桥三种模式
  8. [20171130]关于rman的一些总结.txt
  9. c++实现二叉搜索树
  10. Linux 释放缓存的方法