php 采集网站关键字,php远程获取网站的关键字信息(并附:php判断字符串编码)...
php远程获取网站的关键字信息(并附:php判断字符串编码)
很明显,php100是gbk编码的网站。现在获取它的关键字,并无乱码的显示出来,然后好保存到数据库。
function check_utf8($checkString){
if (preg_match("/^([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){1}/",$checkString) == true || preg_match("/([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){1}$/",$checkString) == true || preg_match("/([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){2,}/",$checkString) == true){
return true;
}
else{
return false;
}
}
$meta = get_meta_tags('http://www.php100.com');
echo '源数据:'.$keywords = $meta['keywords'];
echo '
';
if(check_utf8($keywords) == 0){
$keywords = iconv("GBK","UTF-8",$keywords);
}
$keywords = explode(',', $keywords );
$keywords = array_map( 'trim', $keywords );// 函数返回用户自定义函数作用后的数组【去除空格】
$keywords = array_filter( $keywords );//如果没有提供 callback 函数,array_filter() 将删除 input 中所有等值为 FALSE 的条目。
print_r( $keywords );
?>
php 采集网站关键字,php远程获取网站的关键字信息(并附:php判断字符串编码)...相关推荐
- 网站分类前导:获取网站标题和描述及对相关信息进行分词处理
前言: 之前,笔者做过一些关于网络爬虫的东西.而且爬取的效果还可以.不过还有一些爬虫的博客没有完成,在后期会将其更新完成.而之前的爬虫只是对网页中的URL进行提取,我想做的效果是能对这些网页进行分类. ...
- 获取来源网站php,js实现获取网站搜索来源代码
本文主要和大家分享js实现获取网站搜索来源代码,把以下代码引入所有页面,即可实现收集系统来源的功能,在任意页面中都可以使用全局的统一的来源信息,希望能帮助到大家.var args = { mySite ...
- 如何利用Google关键字工具获取网站关键字
Google Adwords关键字工具通过基于搜索的关键字建议,可以按字词.词组.网站或类别获取关键字提示.是站长朋友们,尤其是做英文Google Adsense的英文站站长在网站关键字选择上必不可少 ...
- 用jquery的ajax功能获取网站alexa的方法
用jquery的ajax功能获取网站alexa的方法: 获取网站alexa的方法其实就是利用了jquery的ajax功能,获取远程的xml文件,读取指定内容的代码,从而获取网站的alexa排名. 代码 ...
- Python 获取网站证书有效期
Python获取网站证书有效期 Python获取网站证书有效期 python:OpenSSL和ssl python+shell:subprocess和curl Python获取网站证书有效期 由于某些 ...
- 分布式快速批量获取网站标题关键字描述(TDK)接口api文档说明
这是demo,速度非常迅速,但外网还是未能获取,这个是由于网络链路问题,但于于有这方面需求的用户,可以尝试使用. 简要描述: 获取网站标题.关键字.描述.联系邮箱.联系手机等基本信息. DEMO应用地 ...
- php判断特殊字符,php远程获取网页代码及判断是否包含某些字符串 - 傲世零零个人技术网站...
//获取远程网页的函数 function geturl($url){ $headerArray =array("Content-type:application/json;",&q ...
- 使用 file_get_contents 获取网站信息报错failed to open stream: HTTP request failed!
使用 filegetcontents 获取网站信息报错failed to open stream: HTTP request failed! 当使用php5自带的filegetcontents方法来获 ...
- java接收meta name=_java_java实现获取网站的keywords,description,获取网站的meta name=keywords - phpStudy...
java实现获取网站的keywords,description 获取网站的 } catch (IOException e) { // TODO Auto-generated catch block e ...
- asp.net获取网站路径
网站在服务器磁盘上的物理路径: HttpRuntime.AppDomainAppPath 虚拟程序路径: HttpRuntime.AppDomainAppVirtualPath 任何于Request/ ...
最新文章
- NSUserDefaults
- 公司生日会生日礼物_你的生日有多受欢迎?
- 【深度学习】 - MobileNet使用的可分离卷积
- Ubuntu学习小结(一) 基础知识,系统安装,软件安装,解压缩
- css-bootstrap的安装与使用
- 【HTML】一个好看的登录界面
- oracle中的序列 cache,oracle row cache lock 之sequence
- 1499元被标149元,苹果官网产品出现Bug价后续:白高兴了!
- What are the best IDEs for the Go programming language?
- Jenkins+git 实现代码自动发布
- java删除sql表中记录,您将如何维护SQL表中的历史记录?
- html音乐静音代码,HTML Audio muted用法及代码示例
- 三级流域空间分布图_水资源空间分布模型及GIS分析应用.pdf
- 魔兽服务器信息文件,魔兽世界2.4.3公众测试服务器补丁说明文档
- 医学软件项目开发(二):医学图像的显示及相关操作
- U盘量产后USB鼠标和键盘都无法使用,如何解决?
- JAVA面向对象编程——学生喂养三种宠物:猫、狗和鸟
- 有n堆石子,每次取出两堆合成一堆,每堆石子的个数即为合并石子所需要耗费的体力,求出合并所有石子堆所需要耗费的最小体力
- PyQt5蟒蛇计算器V2
- 随机森林(randomForest)和极限树或者叫做极端随机树(extraTree),
热门文章
- Tween动画TranslateAnimation细节介绍
- BZOJ2038[2009国家集训队] 小Z的袜子(hose)
- Express框架学习笔记-构建模块化路由
- js高级学习笔记(b站尚硅谷)-1-数据类型
- break 退出循环
- hbase 使用lzo_【hbase】Hbase最佳实践
- 前端打印ip地址_赶紧收藏 | 前端应该会的23个linux常用命令
- vue for 初始值_vue全套教程(实操)就在这里
- 动态规划实战7 leetcode-221. Maximal Square
- debian nginx php配置文件,在debian上安装配置nginx + php-FPM + APC