php远程获取网站的关键字信息(并附:php判断字符串编码)

很明显,php100是gbk编码的网站。现在获取它的关键字,并无乱码的显示出来,然后好保存到数据库。

function check_utf8($checkString){

if (preg_match("/^([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){1}/",$checkString) == true || preg_match("/([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){1}$/",$checkString) == true || preg_match("/([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){2,}/",$checkString) == true){

return true;

}

else{

return false;

}

}

$meta = get_meta_tags('http://www.php100.com');

echo '源数据:'.$keywords = $meta['keywords'];

echo '

';

if(check_utf8($keywords) == 0){

$keywords = iconv("GBK","UTF-8",$keywords);

}

$keywords = explode(',', $keywords );

$keywords = array_map( 'trim', $keywords );// 函数返回用户自定义函数作用后的数组【去除空格】

$keywords = array_filter( $keywords );//如果没有提供 callback 函数,array_filter() 将删除 input 中所有等值为 FALSE 的条目。

print_r( $keywords );

?>

php 采集网站关键字,php远程获取网站的关键字信息(并附:php判断字符串编码)...相关推荐

  1. 网站分类前导:获取网站标题和描述及对相关信息进行分词处理

    前言: 之前,笔者做过一些关于网络爬虫的东西.而且爬取的效果还可以.不过还有一些爬虫的博客没有完成,在后期会将其更新完成.而之前的爬虫只是对网页中的URL进行提取,我想做的效果是能对这些网页进行分类. ...

  2. 获取来源网站php,js实现获取网站搜索来源代码

    本文主要和大家分享js实现获取网站搜索来源代码,把以下代码引入所有页面,即可实现收集系统来源的功能,在任意页面中都可以使用全局的统一的来源信息,希望能帮助到大家.var args = { mySite ...

  3. 如何利用Google关键字工具获取网站关键字

    Google Adwords关键字工具通过基于搜索的关键字建议,可以按字词.词组.网站或类别获取关键字提示.是站长朋友们,尤其是做英文Google Adsense的英文站站长在网站关键字选择上必不可少 ...

  4. 用jquery的ajax功能获取网站alexa的方法

    用jquery的ajax功能获取网站alexa的方法: 获取网站alexa的方法其实就是利用了jquery的ajax功能,获取远程的xml文件,读取指定内容的代码,从而获取网站的alexa排名. 代码 ...

  5. Python 获取网站证书有效期

    Python获取网站证书有效期 Python获取网站证书有效期 python:OpenSSL和ssl python+shell:subprocess和curl Python获取网站证书有效期 由于某些 ...

  6. 分布式快速批量获取网站标题关键字描述(TDK)接口api文档说明

    这是demo,速度非常迅速,但外网还是未能获取,这个是由于网络链路问题,但于于有这方面需求的用户,可以尝试使用. 简要描述: 获取网站标题.关键字.描述.联系邮箱.联系手机等基本信息. DEMO应用地 ...

  7. php判断特殊字符,php远程获取网页代码及判断是否包含某些字符串 - 傲世零零个人技术网站...

    //获取远程网页的函数 function geturl($url){ $headerArray =array("Content-type:application/json;",&q ...

  8. 使用 file_get_contents 获取网站信息报错failed to open stream: HTTP request failed!

    使用 filegetcontents 获取网站信息报错failed to open stream: HTTP request failed! 当使用php5自带的filegetcontents方法来获 ...

  9. java接收meta name=_java_java实现获取网站的keywords,description,获取网站的meta name=keywords - phpStudy...

    java实现获取网站的keywords,description 获取网站的 } catch (IOException e) { // TODO Auto-generated catch block e ...

  10. asp.net获取网站路径

    网站在服务器磁盘上的物理路径: HttpRuntime.AppDomainAppPath 虚拟程序路径: HttpRuntime.AppDomainAppVirtualPath 任何于Request/ ...

最新文章

  1. NSUserDefaults
  2. 公司生日会生日礼物_你的生日有多受欢迎?
  3. 【深度学习】 - MobileNet使用的可分离卷积
  4. Ubuntu学习小结(一) 基础知识,系统安装,软件安装,解压缩
  5. css-bootstrap的安装与使用
  6. 【HTML】一个好看的登录界面
  7. oracle中的序列 cache,oracle row cache lock 之sequence
  8. 1499元被标149元,苹果官网产品出现Bug价后续:白高兴了!
  9. What are the best IDEs for the Go programming language?
  10. Jenkins+git 实现代码自动发布
  11. java删除sql表中记录,您将如何维护SQL表中的历史记录?
  12. html音乐静音代码,HTML Audio muted用法及代码示例
  13. 三级流域空间分布图_水资源空间分布模型及GIS分析应用.pdf
  14. 魔兽服务器信息文件,魔兽世界2.4.3公众测试服务器补丁说明文档
  15. 医学软件项目开发(二):医学图像的显示及相关操作
  16. U盘量产后USB鼠标和键盘都无法使用,如何解决?
  17. JAVA面向对象编程——学生喂养三种宠物:猫、狗和鸟
  18. 有n堆石子,每次取出两堆合成一堆,每堆石子的个数即为合并石子所需要耗费的体力,求出合并所有石子堆所需要耗费的最小体力
  19. PyQt5蟒蛇计算器V2
  20. 随机森林(randomForest)和极限树或者叫做极端随机树(extraTree),

热门文章

  1. Tween动画TranslateAnimation细节介绍
  2. BZOJ2038[2009国家集训队] 小Z的袜子(hose)
  3. Express框架学习笔记-构建模块化路由
  4. js高级学习笔记(b站尚硅谷)-1-数据类型
  5. break 退出循环
  6. hbase 使用lzo_【hbase】Hbase最佳实践
  7. 前端打印ip地址_赶紧收藏 | 前端应该会的23个linux常用命令
  8. vue for 初始值_vue全套教程(实操)就在这里
  9. 动态规划实战7 leetcode-221. Maximal Square
  10. debian nginx php配置文件,在debian上安装配置nginx + php-FPM + APC