C# 简单图片爬虫 快来斗图把
爬取后的图片默认在bin/debug/File下面
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Net;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading.Tasks;namespace Crawler
{class Program{static void Main(string[] args){//抓取网页资源 翻页url格式为https://fabiaoqing.com/biaoqing/lists/page/{i}.html 默认抓取200页for (int i = 1; i <= 200; i++){string str = GetHtmlStr($"https://fabiaoqing.com/biaoqing/lists/page/{i}.html", "UTF8");//匹配图片的正则表达式 string regstr = "http://wx[1-4].sinaimg.cn/bmiddle/.+?.[jg][pi][fg]";foreach (Match match in Regex.Matches(str, regstr))//使用正则表达式解析网页文本,获得图片地址 {//下载图片SaveAsWebImg(match.Value);}}Console.ReadKey();}/// <summary> /// 获取网页的HTML码 /// </summary> /// <param name="url">链接地址</param> /// <param name="encoding">编码类型</param> /// <returns></returns> public static string GetHtmlStr(string url, string encoding){string htmlStr = "";if (!String.IsNullOrEmpty(url)){WebRequest request = WebRequest.Create(url); //实例化WebRequest对象 WebResponse response = request.GetResponse(); //创建WebResponse对象 Stream datastream = response.GetResponseStream(); //创建流对象 Encoding ec = Encoding.Default;if (encoding == "UTF8"){ec = Encoding.UTF8;}else if (encoding == "Default"){ec = Encoding.Default;}StreamReader reader = new StreamReader(datastream, ec);htmlStr = reader.ReadToEnd(); //读取数据 reader.Close();datastream.Close();response.Close();}return htmlStr;}/// <summary> /// 下载网站图片 /// </summary> /// <param name="picUrl"></param> /// <returns></returns> public static string SaveAsWebImg(string picUrl){string result = "";string path = AppDomain.CurrentDomain.SetupInformation.ApplicationBase + @"/File/"; //目录 //不存在目录则创建if (!Directory.Exists(path)){Directory.CreateDirectory(path);DirectoryInfo dirInfo = new DirectoryInfo(path);dirInfo.Attributes = FileAttributes.Normal & FileAttributes.Directory;}try{if (!String.IsNullOrEmpty(picUrl)){Random rd = new Random();DateTime nowTime = DateTime.Now;string fileName = nowTime.Month.ToString() + nowTime.Day.ToString() + nowTime.Hour.ToString() + nowTime.Minute.ToString() + nowTime.Second.ToString() + rd.Next(1000, 1000000) + ".jpeg";WebClient webClient = new WebClient();webClient.DownloadFile(picUrl, path + fileName);result = fileName;}}catch { }return result;}}
}
C# 简单图片爬虫 快来斗图把相关推荐
- 图片表情制作,QQ斗图生成,搜狗图片搜索,自适应支持手机浏览
介绍: 自适应支持手机浏览 图片表情制作 QQ斗图生成 搜狗图片搜索 可以给自己网站吸粉,源码是自适应的手机也可以浏览! 源码集成了搜狗搜索图片接口,可以一键搜索百万图片,还有表情制作等模块 网盘下载 ...
- Python简单图片爬虫
经常在逛知乎,有时候希望把一些问题的图片集中保存起来.于是就有了这个程序.这是一个非常简单的图片爬虫程序,只能爬取已经刷出来的部分的图片.由于对这一部分内容不太熟悉,所以只是简单说几句然后记录代码,不 ...
- 你专属的斗图聊天神器——aidou for mac
你专属的斗图聊天神器--aidou for mac是小编为您推荐的一款可以搜索图片,复制图片,预览图片,粘贴图片为一体的斗图聊天工具,使用这款工具,你可以畅快聊天,恶搞他人,快乐装逼,感兴趣的朋友,不 ...
- python 斗图图片爬虫
捣鼓了三小时,有一些小Bug,望大佬指导 废话不说,直接上代码: #!/usr/bin/python3 # -*- coding:UTF-8 -*- import os,re,requests fro ...
- PYTHON 2.7爬虫获取斗图啦网站的表情包数据(区分gif和jpg图片格式)
通过python实现斗图啦网站上的表情的获取和下载 #encoding=utf-8#导入模块 import random import requests import re from bs4 impo ...
- 10000+ gif表情包不是梦,get这一篇文就够了!!!小哥哥快到碗里来,再也不怕斗图没有表情包了
10000+ gif表情包不是梦,get这一篇文就够了!!!小哥哥快到碗里来,再也不怕斗图没有表情包了 1. 依赖模块及安装 2. 查找网页规律 3. 源码 最近看的爬虫的博客太多,小小的学习了下.主 ...
- 跟我斗图,我用Python爬虫下载几个G的表情砸死你
有一个网站,叫做"斗图啦",网址是:https://www.doutula.com/.这里面包含了许许多多的有意思的斗图图片,还蛮好玩的.有时候为了斗图要跑到这个上面来找表情,实在 ...
- 【爬虫】Yhen手把手教你爬取表情包,让你成为斗图界最靓的仔!
以下内容为本人原创,欢迎大家观看学习,禁止用于商业用途,转载请说明出处,谢谢合作! ·作者:@Yhen ·原文网站:CSDN ·原文链接:https://blog.csdn.net/Yhen1/art ...
- Python 爬虫 斗图网啦 (bs4)
Python 爬虫 斗图网啦 (bs4) 可以多种形式,我用的BeautifulSoup,因为觉得简单 xpath有点复杂 import requests from bs4 import Beauti ...
最新文章
- 数据驱动的算法工程落地!
- JavaWeb:JDBC之事务
- seajs的CMD模式的优势以及使用
- linux主流文件系统及日志和非日志文件系统的区别
- 实验11.1 指针数组、指针与函数 6-5 查找子串
- JavaScript--fullPage.js插件
- IOS学习笔记之十一(包装类、description、isequal)
- 可运行的c语言程序的扩展名为什么?
- Spring MVC中使用 Swagger2 构建Restful API
- Riverbed调查:惊人发现95%的中国受访者高度关注应用性能
- mongoshake同步mongodb数据到kafka
- csdn 不登录浏览全文 chrome 浏览器
- WPF 去除头部,实现拖动
- 我有一朋友生意做的红红火火
- MSN无法登陆错误汇总
- Windows 10开机Windows聚焦壁纸不更新解决方法
- vscode打开setting.json文件
- 东京通勤概况及奥运会交通措施
- echarts3D地球
- 架构必看:12306抢票亿级流量架构演进(图解+秒懂+史上最全)