python关键词排名批量查排名_[代码全屏查看]-Python 批量获取Baidu关键词的排名并入库...
[1].[代码] [Python]代码
#-*- coding: UTF-8 -*-
#Python UTF-8 抓取百度关键词V1.0
#key.txt是抓取文件配置
#author PHPer.yang@gmail.com
import cgi,urllib #URL读取
import re #正则匹配
import MySQLdb #MySQL
import datetime #时间
#import time,thread #多线程
"""
MySQL表结构
CREATE TABLE `baidu` (
`id` int(10) unsigned NOT NULL auto_increment,
`url` varchar(200) NOT NULL,
`title` varchar(600) NOT NULL,
`keys` varchar(100) NOT NULL,
`bdurl` varchar(200) NOT NULL,
`date` date NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;
"""
def Yang_Config ():
fp = open('key.txt','r')
for line in fp.read().split('@'):
word = line.split(',') #word 是字典
#for item in word :
#print item.encode("UTF-8")
#print '------'
if len(word) > 1:
yang_u = word[0]
yang_k = word[1]
Yang_Spider(yang_u,yang_k)
#抓取页面开始
def Yang_Spider(yang_u,yang_k):
url = 'http://www.baidu.com/s?wd=%s+site:%s&&rn=100'% (yang_k,yang_u)
print url
fp = urllib.urlopen(url).read()
#print fp re.search
m = re.findall(r"
()?(.*?)\s*?.*?.*? ((\d{4}\-\d{1,2}\-\d{1,2})|(\d+小时前)|(\d+分钟前)) .*?.*?
|
python关键词排名批量查排名_[代码全屏查看]-Python 批量获取Baidu关键词的排名并入库...相关推荐
- python刷微博关注_[代码全屏查看]-python刷新浪微博粉丝
[1].[代码] [Python]代码 # -*- coding: utf-8 -*- import urllib, urllib2, cookielib, hashlib,threading imp ...
- python 代码分块_[代码全屏查看]-python多进程分块读取文件
[1].[代码] [Python]代码 # -*- coding: GBK -*- import urlparse import datetime import os from multiproces ...
- python处理excel代码_[代码全屏查看]-python处理Excel文件
[1].[代码] test_xlrd.py #coding=utf-8 ####################################################### #filenam ...
- python获取mac窗口坐标_[代码全屏查看]-Python3根据IP地址获取MAC地址
[1].[代码] [Python]代码 #!/usr/bin/env python3 # -*- coding: utf-8 -*- import os import platform import ...
- python手机充值代码_[代码全屏查看]-加油卡在线充值接口实例
[1].[代码] [Python]代码 #!/usr/bin/python # -*- coding: utf-8 -*- import urllib, md5, json from urllib i ...
- 苹果手机查看python代码_[代码全屏查看]-基于Python的苹果序列号官网查询接口调用代码实例...
[1].[代码] [Python]代码 #!/usr/bin/python # -*- coding: utf-8 -*- import json, urllib from urllib import ...
- python代码测试健康指数计算器_[代码全屏查看]-BMI指数计算器
[2].[代码] Layout android:layout_width="match_parent" android:layout_height="match_pare ...
- 谁是卧底python代码_[代码全屏查看]-机器人陪你玩“谁是卧底游戏
[2].[代码] 以下是谁是卧底游戏 //谁是卧底游戏 function UnderCover($key,$username){ $mysql = new SaeMysql(); $userid = ...
- python用一行代码画个迷宫_[代码全屏查看]-用turtle不断的画回字迷宫
[2].[文件] 画个回字(最原始方法).py ~ 3KB 下载(4) #coding=UTF8 from turtle import * import turtle, time # 绘制正方形 ...
- python日历gui_[代码全屏查看]-Python版的农历日历Calendar,功能简单
[1].[代码] [Python]代码 Python语言: Python版的农历日历Calendar,功能简单 #coding=utf-8 #代码修改自wangfei(wangfei@hanwang. ...
最新文章
- uni-app手机横屏后界面错乱解决办法
- textureview 缩放_用MediaPlayer+TextureView封装一个完美实现全屏、小窗口的视频播放器...
- c语言文本按行分配数组元素,【转】C语言中动态分配数组
- codeforces B. Friends and Presents(二分+容斥)
- java搭建聊天服务器_使用 ServerSocket 建立聊天服务器-2
- poi导出word模板项目实例(一个文件)
- LVS详解(五)——LVS NAT模式实战
- 盗链 防止盗链 防止图片盗链
- css如何让图片不平铺,css怎么设置图片不平铺
- 如何使用EDI系统解决对接多工厂的问题?
- TTL和CMOS区别RS232
- [转载]Core animation简介
- 【前端】基于layui写的一个高级搜索(筛选)功能
- 【ACWing】4246. 最短路径和
- springboot幼儿园幼儿基本信息管理系统设计与实现毕业设计源码201126
- centos7 nvidia显卡安装
- 1ppi等于多少dpi_图片知多少?
- 【GPU Gems 学习笔记】Rendering Water Caustics
- Unity中用递归删除空文件夹和文件夹下面的子文件,meta文件保留和IO的一些操作总结
- Oracle数据库远程连接的方法
热门文章
- 【CSS3】C3动画总结
- Extended VINS-Mono: 大规模户外环境进行绝对和相对车辆定位的系统性方法(IROS2021)...
- ADC噪声全面分析 -02- ADC 噪声测量方法和相关参数
- 5道String面试题,能全答对的人不到10%!(附答案)
- Clion 配置 opencv不显示图片Process finished with exit code -1073741515 (0xC0000135)
- 搜索引擎优化主要对网站哪些方面做优化
- ambari集群修改ip地址
- Debian修改IP地址
- 各种路由器接口与连接方法
- Web服务器是什么意思?