爬取后的图片默认在bin/debug/File下面

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Net;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading.Tasks;namespace Crawler
{class Program{static void Main(string[] args){//抓取网页资源 翻页url格式为https://fabiaoqing.com/biaoqing/lists/page/{i}.html 默认抓取200页for (int i = 1; i <= 200; i++){string str = GetHtmlStr($"https://fabiaoqing.com/biaoqing/lists/page/{i}.html", "UTF8");//匹配图片的正则表达式    string regstr = "http://wx[1-4].sinaimg.cn/bmiddle/.+?.[jg][pi][fg]";foreach (Match match in Regex.Matches(str, regstr))//使用正则表达式解析网页文本,获得图片地址     {//下载图片SaveAsWebImg(match.Value);}}Console.ReadKey();}/// <summary>  /// 获取网页的HTML码  /// </summary>  /// <param name="url">链接地址</param>  /// <param name="encoding">编码类型</param>  /// <returns></returns>  public static string GetHtmlStr(string url, string encoding){string htmlStr = "";if (!String.IsNullOrEmpty(url)){WebRequest request = WebRequest.Create(url);            //实例化WebRequest对象  WebResponse response = request.GetResponse();           //创建WebResponse对象  Stream datastream = response.GetResponseStream();       //创建流对象  Encoding ec = Encoding.Default;if (encoding == "UTF8"){ec = Encoding.UTF8;}else if (encoding == "Default"){ec = Encoding.Default;}StreamReader reader = new StreamReader(datastream, ec);htmlStr = reader.ReadToEnd();                           //读取数据  reader.Close();datastream.Close();response.Close();}return htmlStr;}/// <summary> /// 下载网站图片 /// </summary> /// <param name="picUrl"></param> /// <returns></returns> public static string SaveAsWebImg(string picUrl){string result = "";string path = AppDomain.CurrentDomain.SetupInformation.ApplicationBase + @"/File/";  //目录 //不存在目录则创建if (!Directory.Exists(path)){Directory.CreateDirectory(path);DirectoryInfo dirInfo = new DirectoryInfo(path);dirInfo.Attributes = FileAttributes.Normal & FileAttributes.Directory;}try{if (!String.IsNullOrEmpty(picUrl)){Random rd = new Random();DateTime nowTime = DateTime.Now;string fileName = nowTime.Month.ToString() + nowTime.Day.ToString() + nowTime.Hour.ToString() + nowTime.Minute.ToString() + nowTime.Second.ToString() + rd.Next(1000, 1000000) + ".jpeg";WebClient webClient = new WebClient();webClient.DownloadFile(picUrl, path + fileName);result = fileName;}}catch { }return result;}}
}

C# 简单图片爬虫 快来斗图把相关推荐

  1. 图片表情制作,QQ斗图生成,搜狗图片搜索,自适应支持手机浏览

    介绍: 自适应支持手机浏览 图片表情制作 QQ斗图生成 搜狗图片搜索 可以给自己网站吸粉,源码是自适应的手机也可以浏览! 源码集成了搜狗搜索图片接口,可以一键搜索百万图片,还有表情制作等模块 网盘下载 ...

  2. Python简单图片爬虫

    经常在逛知乎,有时候希望把一些问题的图片集中保存起来.于是就有了这个程序.这是一个非常简单的图片爬虫程序,只能爬取已经刷出来的部分的图片.由于对这一部分内容不太熟悉,所以只是简单说几句然后记录代码,不 ...

  3. 你专属的斗图聊天神器——aidou for mac

    你专属的斗图聊天神器--aidou for mac是小编为您推荐的一款可以搜索图片,复制图片,预览图片,粘贴图片为一体的斗图聊天工具,使用这款工具,你可以畅快聊天,恶搞他人,快乐装逼,感兴趣的朋友,不 ...

  4. python 斗图图片爬虫

    捣鼓了三小时,有一些小Bug,望大佬指导 废话不说,直接上代码: #!/usr/bin/python3 # -*- coding:UTF-8 -*- import os,re,requests fro ...

  5. PYTHON 2.7爬虫获取斗图啦网站的表情包数据(区分gif和jpg图片格式)

    通过python实现斗图啦网站上的表情的获取和下载 #encoding=utf-8#导入模块 import random import requests import re from bs4 impo ...

  6. 10000+ gif表情包不是梦,get这一篇文就够了!!!小哥哥快到碗里来,再也不怕斗图没有表情包了

    10000+ gif表情包不是梦,get这一篇文就够了!!!小哥哥快到碗里来,再也不怕斗图没有表情包了 1. 依赖模块及安装 2. 查找网页规律 3. 源码 最近看的爬虫的博客太多,小小的学习了下.主 ...

  7. 跟我斗图,我用Python爬虫下载几个G的表情砸死你

    有一个网站,叫做"斗图啦",网址是:https://www.doutula.com/.这里面包含了许许多多的有意思的斗图图片,还蛮好玩的.有时候为了斗图要跑到这个上面来找表情,实在 ...

  8. 【爬虫】Yhen手把手教你爬取表情包,让你成为斗图界最靓的仔!

    以下内容为本人原创,欢迎大家观看学习,禁止用于商业用途,转载请说明出处,谢谢合作! ·作者:@Yhen ·原文网站:CSDN ·原文链接:https://blog.csdn.net/Yhen1/art ...

  9. Python 爬虫 斗图网啦 (bs4)

    Python 爬虫 斗图网啦 (bs4) 可以多种形式,我用的BeautifulSoup,因为觉得简单 xpath有点复杂 import requests from bs4 import Beauti ...

最新文章

  1. 数据驱动的算法工程落地!
  2. JavaWeb:JDBC之事务
  3. seajs的CMD模式的优势以及使用
  4. linux主流文件系统及日志和非日志文件系统的区别
  5. 实验11.1 指针数组、指针与函数 6-5 查找子串
  6. JavaScript--fullPage.js插件
  7. IOS学习笔记之十一(包装类、description、isequal)
  8. 可运行的c语言程序的扩展名为什么?
  9. Spring MVC中使用 Swagger2 构建Restful API
  10. Riverbed调查:惊人发现95%的中国受访者高度关注应用性能
  11. mongoshake同步mongodb数据到kafka
  12. csdn 不登录浏览全文 chrome 浏览器
  13. WPF 去除头部,实现拖动
  14. 我有一朋友生意做的红红火火
  15. MSN无法登陆错误汇总
  16. Windows 10开机Windows聚焦壁纸不更新解决方法
  17. vscode打开setting.json文件
  18. 东京通勤概况及奥运会交通措施
  19. echarts3D地球
  20. 架构必看:12306抢票亿级流量架构演进(图解+秒懂+史上最全)

热门文章

  1. js-键盘事件案例-小人快跑
  2. 2022,博士们,又开始晒工资了
  3. 完美世界买百度文学吃“回头草” 百度3年赚8亿
  4. 读完研继续读博还是先工作几年再读博好一些?
  5. 植物三维模型快速重建
  6. FW: 图说 WebAssembly
  7. 首次去中心化抢劫?近2亿美元损失:跨链桥Nomad 被攻击事件分析
  8. adlds文件服务器,修改 AD LDS 配置
  9. 一道和稀饭绝配的自制腌菜
  10. Win10系统路由器设置教程