如何使用Java写爬虫来获取网页视频

  1. 方法1对于没有反爬虫机制(不多说直接上代码)

    @SuppressWarnings(“all”)
    public String getVideo() {
    try {

            String pageUrl="要爬取的网址";URL url=new URL(pageUrl);InputStream is=url.openStream();BufferedReader br = new BufferedReader(new InputStreamReader(is, "UTF-8"));String info="";for(int i=0;i<3000;i++){ //我设置为网页的一共有3000 行 具体根据 你获取网页行数的大小来决定info=br.readLine();if(null!=info){String urlRegex="src=\"(.*?\\.mp4)";//正则表达式 Pattern pattern = Pattern.compile(urlRegex);Matcher matcher = pattern.matcher(info);if (matcher.find()) {//比对成功for (int j = 0; j <= matcher.groupCount(); j++) {String tmp = matcher.group(j);if (!tmp.startsWith("src=")) {System.out.println("ger mp4 src >"+tmp);}}}}
    

    } catch (Exception e) {
    e.printStackTrace();
    }
    return null;

}

  1. 有反扒机制
    访问 方式改成 以页面的形式访问
    把上面的的访问方式替换成下面的内容就可以,如果反扒机制很强的话,就需要借助代理IP啦
    // InputStream is=url.openStream();
    // BufferedReader br = new BufferedReader(new InputStreamReader(is, “UTF-8”));

           HttpURLConnection conn = (HttpURLConnection) url.openConnection();conn.setRequestMethod("GET");conn.setRequestProperty("user-agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36");BufferedReader br = new BufferedReader(new InputStreamReader(conn.getInputStream(), "UTF-8"));
    

基本的 就介绍到这里 ,如果又不懂的可以在下面留言咨询我 获取扫描 二维码 来获取更多学习内容

         ![获取分布式开发资料等学习内容](微信扫码)

Java爬虫获取网页视频,音乐,图片等相关推荐

  1. Java爬虫获取网页表格数据

    //Java爬虫获取网页表格数据 public class Pachong implements Runnable { public void run() { String Rpt_date = nu ...

  2. python Chrome + selenium自动化测试与python爬虫获取网页数据

    一.使用Python+selenium+Chrome 报错: selenium.common.exceptions.SessionNotCreatedException: Message: sessi ...

  3. Java爬虫获取豆瓣的短评数据

    Java爬虫获取豆瓣的短评数据 打开豆瓣的选电影页面的链接,可以看到该网页的下面分为热门,最新,经典等栏目分类,网页每次显示20部电影,通过几部电影的查看,可以发现电影的短评页https://movi ...

  4. Java爬虫爬取wallhaven的图片

    Java爬虫爬取wallhaven的图片 参考文章:JAVA Jsoup爬取网页图片下载到本地 需要的jar包:jsuop wallhaven网站拒绝java程序访问,所以要伪装报头. 发送请求时 C ...

  5. Android 使用JS注入获取网页视频链接

    Android 使用JS注入获取网页视频链接 思路: 1.通过js注入获取整个网页html. 2.通过jsoup分析获取video播放器的数据源. 一.开启webviewjs功能,注入js回调 mWe ...

  6. 安卓获取手机视频和图片

    安卓获取手机视频和图片 获取手机本地视频 首先需要获得手机内存权限 在AndroidManifest.xml中添加代码,获得读取权限 android.permission.READ_EXTERNAL_ ...

  7. JAVA快速获取网络图片或者URL图片并保存到本地

    JAVA快速获取网络图片或者URL图片并保存到本地,直接上代码: import java.io.ByteArrayOutputStream; import java.io.File; import j ...

  8. Python爬虫获取网页编码格式

    Python爬虫获取网页编码格式 网页编码格式是每个网页规定的本页面文字的编码方式,其中比较流行的是ascii, gbk, utf-8, iso等.观察许多网页的编码格式都是在meta标签的conte ...

  9. Java爬虫 获取中国天气网7日天气预报

    Java爬虫 获取中国天气网7日天气预报 前言 工具准备 爬取数据 获取日期和星期 获取天气描述 获取温度范围 获取风向及风力 完整代码 引用 前言 项目需要获取7日天气预报,免费好用的接口寻觅不到, ...

最新文章

  1. 【LeetCode】169. Majority Element
  2. Android Fragment中嵌套Fragment,不显示view
  3. 数学之美 系列十六 (下)- 不要把所有的鸡蛋放在一个篮子里 最大熵模型
  4. LINUX设置固定IP上网方法
  5. Effective java笔记3--类和接口1
  6. C/C++ OpenCV图像的尺寸变化
  7. vs2017编写模板类出现以下错误时:没有与参数列表匹配的构造函数……
  8. 黑洞效果的粒子背景效果
  9. SAP License:国网面试手记
  10. a星算法python_Python-加速A星寻路算法
  11. 营业执照15位注册号码含义和查询规则
  12. 面试必问的 Redis:数据结构和基础概念
  13. [读书笔记] 有效竞品分析
  14. 微信小程序:音乐播放器(附源码)
  15. 广告投放系统后台html,今日头条广告如何投放?今日头条广告后台操作说明
  16. 将MongoDB安装在移动硬盘
  17. 延期年金(deferred annuity)
  18. 4.12作业--CSS
  19. Java绝对好文,转载的!(转载)
  20. Vue 自定义消息通知组件

热门文章

  1. NB-IoT 移远 BC28 TE-B 模块网络接入测试
  2. 就业指导:电脑工程师的需求分析和就业指导
  3. 调色技巧,超实用的可选颜色经验大全
  4. 一串钥匙引发的思考:流程、灾备、数字化和元宇宙
  5. permissions 权限
  6. 记录自己安装黑苹果后的archlinux启动引导修复过程
  7. 【文献阅读05】40nm 64Kb 25.56TOPS/W 2.37Mb/mm2 的二值/存算RRAM宏,密度提升4.23倍,感知动态范围提升>75%
  8. QProcess与外部程序的调用
  9. SpringBoot+Mybatis+thymeleaf实现增删改查
  10. Jquery 2.0+版本不支持IE8,如何解决?