这篇文章主要介绍了php正则表达式获取内容所有链接的相关资料,需要的朋友可以参考下

方法一:

function get_all_url($code){

preg_match_all('/"' ]+)["|']?s*[^>]*>([^>]+)/i',$code,$arr);

return array('name'=>$arr[2],'url'=>$arr[1]);

}

方法二:

/**

* date 2015-07-24

**/

$site=substr($url,0,strpos($url,"http://www.jb51.net/",8));//站点

$base=substr($url,0,strrpos($url,"http://www.jb51.net/")+1);//文件所在目录

$fp = fopen($url, "r" );//打开url

while(!feof($fp))$contents.=fread($fp,1024);//

$pattern="|href=['"]?([^ '"]+)['" ]|u";

preg_match_all($pattern,$contents, $regarr, preg_set_order);//匹配所有href=

for($i=0;$i";//根目录

else

echo "link".($i+1).":".$base.$regarr[$i][1]."

";//当前目录

else

echo "link".($i+1).":".$regarr[$i][1]."

";//相对路径

}

fclose($fp);

以上所述就是本文的全部内容了,,希望大家能够喜欢。

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

php 正则表达式 取所有内容,php正则表达式获取内容所有链接相关推荐

  1. python正则表达式取中间字符串_正则表达式如何获取中间字符串

    如果问题真的是"这个表达有什么问题?",答案如下:您试图将换行符与.*?匹配.您需要(?s)才能使其工作.在 在正则表达式的中间有显式的空格和换行符,它们在源文本中没有任何对应的字 ...

  2. python爬取链家租房信息_python爬取链家租房之获取房屋的链接和页面的详细信息...

    因为期末考试的缘故,本打算一个星期结束的爬虫,拖了很久,不过,也有好处:之前写的时候总是被反爬,这几天复习之余写了些反爬取的py code 下面发出来和大家探讨 做了些反爬取的手段 随机获取一个hea ...

  3. python逗号表达式_正则表达式 - 在第一个逗号前获取所有内容。 - python

    我有我的输入数据utf8编码,并应用它的一些正则表达式来查找逗号,但在下面的字符串,虽然我可以看到逗号可视化,正则表达式返回None,这是什么错误,我测试'''在MyString中,它的工作正常.这是 ...

  4. python爬虫提取人名_python爬虫—爬取英文名以及正则表达式的介绍

    python爬虫-爬取英文名以及正则表达式的介绍 爬取英文名: 一. 爬虫模块详细设计 (1)整体思路 对于本次爬取英文名数据的爬虫实现,我的思路是先将A-Z所有英文名的连接爬取出来,保存在一个csv ...

  5. 【超详总结/理解:正则表达式】特点/元字符/正则表达式中的标志位-flag/RegExp/重复操作与后向引用/匹配模式/表达邮箱/正则表达式对象的方法/利用正则表达式限制网页表单里的文本框输入内容

    文章目录 正则表达式: 正则表达式的用途 正则表达式的组成-元字符 正则表达式的特点 正则表达式中的标志位-flag JavaScript中的正则表达式解析 RegExp 定义 RegExp RegE ...

  6. python爬虫获取的网页数据为什么要加[0-Python爬虫实战1-解决需要爬取网页N秒后的内容的需求...

    -------谢谢您的参考,如有疑问,欢迎交流 前引: 当你需要爬取的页面内容在访问页面5秒后才会出现, 这时使用python的requests模块就很难爬取到你想要的内容了. requests和se ...

  7. 正则表达式匹配两个特殊字符中间的内容

    正则表达式匹配两个特殊字符中间的内容 匹配两个字符串A与B中间的字符串包含A与B:  表达式: A.*?B("."表示任意字符,"?"表示匹配0个或多个)  示 ...

  8. queryList爬虫获取内容的几种方法总结 queryList给抓取的内容增加html追加元素html 代码实例...

    //简略内容: 1. $data1 = $ql->find('.two img')->map(function($item){return $item->alt; }); // 等价 ...

  9. 正则表达式 取最后一个 . 然后进行匹配

    正则表达式 取最后一个 .  然后进行匹配 第一个点就是要的位置 .(?=[^.]*$)(com|cn)

最新文章

  1. C#中将list进行序列化并使用SharpZipLib进行压缩
  2. 六十五、Leetcode数组系列(上篇)
  3. 存定期还能加钱进去吗_很多人说傻子才存钱,在银行存定期还有必要吗?
  4. 一步一步封装自己的HtmlHelper组件:BootstrapHelper
  5. java执行程序默认多线程吗_Java多线程 执行程序(1)
  6. 哈尔滨有线电视频道表
  7. canny边缘检测算法_OpenCV4中调用HED边缘检测算法
  8. python数据类型_Python数据类型
  9. 如何让元素支持 height:100%效果
  10. 程序员如何转型项目经理?
  11. 如何编写PMP项目管理中的项目立项书
  12. 科大讯飞和neospeech tts哪个更好
  13. 【python】实现canny算子与LoG算子
  14. 澳洲java待遇_2018年澳洲IT薪资一览,最新IT薪水Salary,给学IT的同学打一针鸡血...
  15. 阿里、腾讯、知乎裁员 那些被裁的程序员怎么办?
  16. rockchip mpp编码开发
  17. 【爱生活】新冠 - 风寒和风热感冒的区别及措施
  18. 安卓逆向 -- Xposed模块编写
  19. Chrome浏览器内置截图工具(不需要安装插件)
  20. VIBE运动检测算法实现(二)

热门文章

  1. 秋冬季节吃什么水果好
  2. SAP中PDF文件本地保存方法
  3. SAP系统中发送消息的几种办法
  4. SAP中寻找增强的实现方法
  5. 730版本去掉恼人的提示信息
  6. How to Get Name of Months in ABAP/4
  7. 学会针对永洪API接口的性能测试,工作效率提升百倍
  8. 格力的“阵痛”与“头痛”
  9. idea创建包怎么让包分层_干货 | 通勤包怎么选?我推荐这6只
  10. ie 不执行回调函时_javascript引擎执行的过程的理解--执行阶段