Java爬虫获取网页视频,音乐,图片等
如何使用Java写爬虫来获取网页视频
方法1对于没有反爬虫机制(不多说直接上代码)
@SuppressWarnings(“all”)
public String getVideo() {
try {String pageUrl="要爬取的网址";URL url=new URL(pageUrl);InputStream is=url.openStream();BufferedReader br = new BufferedReader(new InputStreamReader(is, "UTF-8"));String info="";for(int i=0;i<3000;i++){ //我设置为网页的一共有3000 行 具体根据 你获取网页行数的大小来决定info=br.readLine();if(null!=info){String urlRegex="src=\"(.*?\\.mp4)";//正则表达式 Pattern pattern = Pattern.compile(urlRegex);Matcher matcher = pattern.matcher(info);if (matcher.find()) {//比对成功for (int j = 0; j <= matcher.groupCount(); j++) {String tmp = matcher.group(j);if (!tmp.startsWith("src=")) {System.out.println("ger mp4 src >"+tmp);}}}}
} catch (Exception e) {
e.printStackTrace();
}
return null;
}
有反扒机制
访问 方式改成 以页面的形式访问
把上面的的访问方式替换成下面的内容就可以,如果反扒机制很强的话,就需要借助代理IP啦
// InputStream is=url.openStream();
// BufferedReader br = new BufferedReader(new InputStreamReader(is, “UTF-8”));HttpURLConnection conn = (HttpURLConnection) url.openConnection();conn.setRequestMethod("GET");conn.setRequestProperty("user-agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36");BufferedReader br = new BufferedReader(new InputStreamReader(conn.getInputStream(), "UTF-8"));
基本的 就介绍到这里 ,如果又不懂的可以在下面留言咨询我 获取扫描 二维码 来获取更多学习内容
![获取分布式开发资料等学习内容](微信扫码)
Java爬虫获取网页视频,音乐,图片等相关推荐
- Java爬虫获取网页表格数据
//Java爬虫获取网页表格数据 public class Pachong implements Runnable { public void run() { String Rpt_date = nu ...
- python Chrome + selenium自动化测试与python爬虫获取网页数据
一.使用Python+selenium+Chrome 报错: selenium.common.exceptions.SessionNotCreatedException: Message: sessi ...
- Java爬虫获取豆瓣的短评数据
Java爬虫获取豆瓣的短评数据 打开豆瓣的选电影页面的链接,可以看到该网页的下面分为热门,最新,经典等栏目分类,网页每次显示20部电影,通过几部电影的查看,可以发现电影的短评页https://movi ...
- Java爬虫爬取wallhaven的图片
Java爬虫爬取wallhaven的图片 参考文章:JAVA Jsoup爬取网页图片下载到本地 需要的jar包:jsuop wallhaven网站拒绝java程序访问,所以要伪装报头. 发送请求时 C ...
- Android 使用JS注入获取网页视频链接
Android 使用JS注入获取网页视频链接 思路: 1.通过js注入获取整个网页html. 2.通过jsoup分析获取video播放器的数据源. 一.开启webviewjs功能,注入js回调 mWe ...
- 安卓获取手机视频和图片
安卓获取手机视频和图片 获取手机本地视频 首先需要获得手机内存权限 在AndroidManifest.xml中添加代码,获得读取权限 android.permission.READ_EXTERNAL_ ...
- JAVA快速获取网络图片或者URL图片并保存到本地
JAVA快速获取网络图片或者URL图片并保存到本地,直接上代码: import java.io.ByteArrayOutputStream; import java.io.File; import j ...
- Python爬虫获取网页编码格式
Python爬虫获取网页编码格式 网页编码格式是每个网页规定的本页面文字的编码方式,其中比较流行的是ascii, gbk, utf-8, iso等.观察许多网页的编码格式都是在meta标签的conte ...
- Java爬虫 获取中国天气网7日天气预报
Java爬虫 获取中国天气网7日天气预报 前言 工具准备 爬取数据 获取日期和星期 获取天气描述 获取温度范围 获取风向及风力 完整代码 引用 前言 项目需要获取7日天气预报,免费好用的接口寻觅不到, ...
最新文章
- 【LeetCode】169. Majority Element
- Android Fragment中嵌套Fragment,不显示view
- 数学之美 系列十六 (下)- 不要把所有的鸡蛋放在一个篮子里 最大熵模型
- LINUX设置固定IP上网方法
- Effective java笔记3--类和接口1
- C/C++ OpenCV图像的尺寸变化
- vs2017编写模板类出现以下错误时:没有与参数列表匹配的构造函数……
- 黑洞效果的粒子背景效果
- SAP License:国网面试手记
- a星算法python_Python-加速A星寻路算法
- 营业执照15位注册号码含义和查询规则
- 面试必问的 Redis:数据结构和基础概念
- [读书笔记] 有效竞品分析
- 微信小程序:音乐播放器(附源码)
- 广告投放系统后台html,今日头条广告如何投放?今日头条广告后台操作说明
- 将MongoDB安装在移动硬盘
- 延期年金(deferred annuity)
- 4.12作业--CSS
- Java绝对好文,转载的!(转载)
- Vue 自定义消息通知组件
热门文章
- NB-IoT 移远 BC28 TE-B 模块网络接入测试
- 就业指导:电脑工程师的需求分析和就业指导
- 调色技巧,超实用的可选颜色经验大全
- 一串钥匙引发的思考:流程、灾备、数字化和元宇宙
- permissions 权限
- 记录自己安装黑苹果后的archlinux启动引导修复过程
- 【文献阅读05】40nm 64Kb 25.56TOPS/W 2.37Mb/mm2 的二值/存算RRAM宏,密度提升4.23倍,感知动态范围提升>75%
- QProcess与外部程序的调用
- SpringBoot+Mybatis+thymeleaf实现增删改查
- Jquery 2.0+版本不支持IE8,如何解决?