改进:改成匹配url是否为以某个结尾的,至于非法的url就让Jsoup.connect(url)把异常抛弃

 //启动该正则匹配特别的慢
//  public static String regex = "^([hH][tT]{2}[pP]:/*|[hH][tT]{2}[pP][sS]:/*|[fF][tT][pP]:/*)(([A-Za-z0-9-~]+).)+([A-Za-z0-9-~\\/])+(\\?{0,1}(([A-Za-z0-9-~]+\\={0,1})([A-Za-z0-9-~]*)\\&{0,1})*)$";public static final Pattern FILTERS = Pattern.compile(".*(\\.(css|js|bmp|gif|jpe?g" + "|png|tiff?|mid|mp2|mp3|mp4"+ "|wav|avi|mov|mpeg|ram|m4v|pdf" + "|rm|smil|wmv|swf|wma|zip|rar|gz))$");public static boolean isMatchURL(String url) {
//      Pattern pattern = Pattern.compile(regex);if(FILTERS.matcher(url).matches()) {return false;}
//      if (pattern.matcher(url).matches()) {
//          return true;
//      } return true;}

利用正则匹配url是否合法对于有的url会浪费过长时间使程序卡死,切记!相关推荐

  1. Python练习篇25-re模块利用正则匹配提取网页邮箱并保存

    本文介绍re模块利用正则匹配提取网页邮箱并保存 提取网页邮箱我们需要用到requests模块.re模块和xlwt模块(下载方法:打开cmd,输入pip install 包名),负责去匹配邮箱数据. 本 ...

  2. php 匹配图片路径_PHP笔记(一):如何利用正则匹配图片路径

    这几天一直在百度知道转悠,尝试着解决自己能够解决的问题,从而达到助人为乐的乐趣.(窃笑一下,实际是通过回答别人的问题,达到提升自己的目的;) 转悠了一会,发现有好多朋友提问"PHP怎么读取内 ...

  3. 利用正则匹配数字后边的字符_图解正则——字符匹配

    简介 正则表达式是绕不开的,正则的强大是众所周知的,学会它对我们的编程也是有大大的帮助 模糊匹配 正则表达式之所以强大,就要归功于它的模糊匹配,不能可以匹配不同数量的字符串,还可以匹配不同内容的字符串 ...

  4. EXCEL利用正则匹配去替换内容

    做项目过程中需要对某一列字段进行添加"[]"将字段包裹起来,因此上网查了EXCEL的正则匹配如何使用,在此记录一下,防止忘记. 打开文件一定要选择EXCEL打开,WPS目前没有发现 ...

  5. js利用正则验证手机号是否合法

    1.示例 2.方法 checkphone: function (str) {if (str.match(/^(13[0-9]|14[5-9]|15[012356789]|166|17[0-8]|18[ ...

  6. 使用ATS中的regex_remap插件实现正则匹配的url重定向

    要点总结如下: 1.正向和反向代理可以同时并存,并且remap可以兼容这两种模式. 2.在使用regex_map时,是借助remap的配置来设置,而且remap.so和regex_remap.so已经 ...

  7. Django——2 路由分配设置 re_path正则匹配 include总路由 url传参 name使用 模板渲染render方法 模板渲染方法...

    Django 路由分配设置 re_path正则匹配 include总路由设置 url额外参数的传递 name的使用 模板的渲染:render方法   路由的分配中, 可以设定相应的转换器加以约束,比如 ...

  8. html正则表达式识别网址,JS正则匹配URL网址的方法(可匹配www,http开头的一切网址)...

    本文实例讲述了JS正则匹配URL网址的方法.分享给大家供大家参考,具体如下: 最强的匹配网址-url的正则表达式:匹配www,http开头的一切网址 直接插入正则表达式: [a-zA-Z0-9][-a ...

  9. python正则匹配找到所有的浮点数_如何利用Python抓取静态网站及其内部资源

    遇到的需求 前段时间需要快速做个静态展示页面,要求是响应式和较美观.由于时间较短,自己动手写的话也有点麻烦,所以就打算上网找现成的. 中途找到了几个页面发现不错,然后就开始思考怎么把页面给下载下来. ...

最新文章

  1. 为什么多线程可以利用到多核?
  2. 有人说Julia比Python好,还给出了5个理由
  3. Linux学习:shell命令(文件和目录相关)
  4. 暗备用的运行状态_瞧:我利用“无偏二极管”发明设计出了【宇宙“暗物质”、“暗能量”探测器】...
  5. Win7 局域网内访问Sql2005
  6. PAT乙级 1015 德才论
  7. python生成器yield原理_Python的迭代器和生成器 使用实例及yield的使用
  8. 阿里云重磅推出物联网设备身份认证Link ID²
  9. GCC Command Options
  10. SQL Server 触发器--备忘
  11. 2017-2018-1 20155308 《信息安全系统设计基础》第十四周学习总结
  12. 马里兰大学calce电池循环测试数据集_锂电池极片:机械性能测试是门学问,要搞懂真不容易...
  13. 计算机网络工程税收分类编码,税控开票系统商品和服务税收分类编码操作手册...
  14. java使用163邮箱完成发送邮件完成注册
  15. 《老路用得上的商学课》16-20学习笔记
  16. python输入数字变时间_转变大写日期为数字格式
  17. 分门别类刷leetcode——递归和回溯搜索(C++实现)
  18. K折交叉验证大集合(KFold 、Stratified k-fold、Group k-fold、StratifiedGroupKFold)
  19. win7电脑怎么伪装ip地址【系统天地】
  20. 如何通过 Apple Watch 解锁 Mac !

热门文章

  1. 神经网络基本原理简明教程-0-Python-Numpy库的点滴
  2. AI应用开发实战系列之二:从零开始搭建macOS开发环境
  3. java如何实现开机启动,怎样实现开机启动holer
  4. python在统计专业的应用_Python:使用Counter进行计数统计
  5. python中自定义类中的self_Python类和构造方法
  6. 操作系统之(一篇文章让你简单搞定:什么是进程和线程)
  7. if test 多条件_秒懂Python编程中的if __name__ == #39;main#39; 作用和原理
  8. JAVA头部声明异常,Java 异常详解
  9. cups共享linux打印机_linux入门-映射网络驱动器
  10. 【LeetCode笔记】23.合并K个升序列表(Java、分治、链表)