# coding=utf8
import urllib2
import string
import urllib
import re
import random#设置多个user_agents,防止百度限制IP
user_agents = ['Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20130406 Firefox/23.0', \
'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0', \
'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/533+(KHTML, like Gecko) Element Browser 5.0', \
'IBM WebExplorer /v0.94', 'Galaxy/1.0 [en] (Mac OS X 10.5.6; U; en)', \
'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)', \
'Opera/9.80 (Windows NT 6.0) Presto/2.12.388 Version/12.14', \
'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25', \
'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1468.0 Safari/537.36', \
'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.0; Trident/5.0; TheWorld)']keywords_address="福州,厦门,深圳,广州,珠海,佛山,东莞,南昌,九江,上海,杭州,温州,宁波,石家庄,北京,保定,昆明,成都,南京,".split(',')
keywrods_category="男科医院,男科病医院,男性病医院,男子医院,包皮过长,包皮手术,包皮手术费用,勃起不好,早泄,男科,早泄手术,阳痿,早泄医院,早泄费用,前列腺,前列腺医院,前列腺肿大,不育,不孕不育".split(',')def baidu_search(keyword,pn):
p= {'wd': keyword}
req=urllib2.Request(("http://www.baidu.com/s?"+urllib.urlencode(p)+"&pn={0}&cl=3&rn=100").format(pn))
r=random.randint(0,8)
req.add_header('User-agent', user_agents[r])
req.add_header('connection','keep-alive')
res=urllib2.urlopen(req,timeout=10000)
print res.geturl()
html=res.read()
#print res.headers
res.close()
#print "%s\r\n=====html finished ======\r\n"%html
return html
def getCpc(regex,text):
arr = []
res = re.findall(regex, text)
for r in res:
if r not in arr:
arr.append(r)
return arrdef geturl(keyword):html = baidu_search(keyword,1)content = unicode(html, 'utf-8','ignore')
arrList = getCpc(u"http://www.baidu.com/baidu.php\?url=[^\',^\"]*", content)
for item in arrList:
url = item
print "\r\n# math url:\r\n %s \r\n"%url
#获取标题
#title = clearTag(link[1]).encode('utf8')try:
domain=urllib2.Request(url)
r=random.randint(0,11)
domain.add_header('User-agent', user_agents[r])
domain.add_header('connection','keep-alive')
response=urllib2.urlopen(domain,timeout=10000)#time out 10s
uri=response.geturl()
response.close()
print " *target url: \r\n %s \r\n"%uri
except:
continueif __name__=='__main__':
categoryCount=len(keywrods_category)
addressCount=len(keywords_address)
for i in range(1,20):
r=random.randint(1,1000)
keyword="%s%s"%(keywords_address[r%addressCount],keywrods_category[r%categoryCount])
print "\r\n%s\r\n"%keyword
geturl(keyword)

邪恶一下,专门恶意点击竞价排名。

转载于:https://www.cnblogs.com/Linjianyu/p/5621688.html

python 百度cpc点击相关推荐

  1. python百度推广api,查询实时账户情况,展现量、点击量、消费、点击率、点击均价

    python百度推广api,查询实时账户情况,展现量.点击量.消费.点击率.点击均价 import requests,json,time,datetimedef selectlivedata(user ...

  2. cpc按点击计算怎么算_百度竞价CPC点击价格的的计算公式以及出价的原理吗?

    百度竞价CPC点击价格的的计算公式以及出价的原理吗? 在竞价推广中,点击价格的高低,取决于自己与竞争对手的排名.出价和质量度的关系,最高不会超过关键词所设定的出价.具体的CPC点击价格公式如下: 实际 ...

  3. python模拟网页点击_python怎么模拟点击网页按钮

    python怎么模拟点击网页按钮 前提环境: Python3 和 Visual Studio Code安装完毕 . 安装selenium : 在终端输入: pip install selenium, ...

  4. python+百度地图 实现地址转换为经纬度(全网最简单方法)

    python+百度地图实现地址转换经纬度 前期准备 安装requests包 在百度地图开放平台申请AK 接下来进入正题 首先, AK使用方法 最后,上代码 前期准备 首先安装需要的库,requests ...

  5. python模拟鼠标点击和键盘输入的操作_python模拟鼠标点击和键盘输入的操作

    所有代码都是网上百度出来的,通过个人实践找到适合自己的. 采用的python 库是 pymouse.pykeyboard 安装时直接pip安装的,pip install PyUserInput 安装不 ...

  6. 人口普查分析:利用python+百度文字识别提取图片中的表格数据

    今天发布了最新的人口普查结果,笔者拿到的文件是pdf格式(网上应该有).之前就一直想实现从pdf提取表格数据,输出为excel.正好这次有公开数据,因此打算用来练个手. 尝试了两种方法: 1.pyth ...

  7. Python模拟屏幕点击自动完成词达人任务(附源码)

    Python模拟屏幕点击自动完成微信词达人任务 该贴是以微信词达人为基础实践而写,如果我们并没有使用词达人,该源码中关键代码部分和模拟点击原理希望对大家有帮助. Python模拟屏幕点击自动完成微信词 ...

  8. python百度云ocr文字识别软件_基于百度云的OCR识别(Python)

    2019年7月3日早上,在百度AI开发者大会上,一个来自山西的青年,将一瓶矿泉水浇在了同样来自山西的李彦宏身上. 可以回顾一下 https://b23.tv/av57665929/p1 ,着实让人一惊 ...

  9. python+百度翻译api制作中英文互转的代码应用实例

    本篇文章主要讲解,python+百度翻译api制作中英文互转的代码应用实例 作者:任聪聪 前提准备 1.python 3.9版本 2.注册百度翻译开发者 地址:https://fanyi-api.ba ...

  10. python 控制鼠标点击需要100ms为什么_用 Python3 和 OpenCV 替我玩一玩微信小游戏 — 跳一跳 (这算外挂么)...

    0 瞎弄 我知道你们喜欢先看效果 手残的我,始终跳不过你们这些超过 50 分的大佬.想起最近在用 Python 学习 ML (Mechine Learning, 机器学习) ,怎么用没学会,倒是里面神 ...

最新文章

  1. cocos2dx-2.2.0的开始
  2. 计算机网络 实验六 静态路由配置,实验六-静态路由配置.doc
  3. CVE-2015-8966/AndroidID-31435731
  4. LeetCode Search Insert Position (二分查找)
  5. JavaEE还是Spring? 都不行! 我们呼吁新的竞争者!
  6. 【游戏开发】C 游戏编程实例
  7. 汉字转拼音,一二级词库,不支持多音字
  8. 【Hololens】微软Hololens虚拟现实视频集
  9. 统计字符串中个字符的个数
  10. When should we write our own copy constructor?
  11. 解决MyEclipse中导入项目的javascript文件中文乱码
  12. 安利一个免费下载VIP文档神器
  13. 主数据管理(MDM)的成熟度
  14. TCP网络错误Connection reset by peer,peer是啥意思呢
  15. Python 重新加载模块
  16. PT100所谓的二线制,三线制,四线制如何接线(详解)
  17. 向量大小和归一化(vector magnitude normalization)、向量范数(vector norm)、标量/向量/矩阵/张量
  18. ASP.NET MVC 远程请求图片 转化成BASE64然后通过HTTP输出流显示
  19. 【Unity学习笔记】Unity中的欧拉角(Euler Angle)和万向节(Gimbal)
  20. LoadLibrary下错误返回126错误码排查过程

热门文章

  1. 群联PS2251-03芯片量产成功详细图文教程
  2. 遥感影像、DEM免费下载以及MPT制作
  3. 中国农业大学计算机考研复试分数线,2020中国农业大学考研复试分数线已公布...
  4. 香港长和集团开创P2F金融理财新征程
  5. 2023最新SSM计算机毕业设计选题大全(附源码+LW)之java鲲龙装饰公司在线管理系统的设计与开发前台模块iub6h
  6. 读完这篇文章,你就是下一个时间管理大师。
  7. 为前端工作者准备的几个炫彩的js动画库
  8. 右键没有新建文本文件了.解决方法.
  9. 兔子如何吃掉狼和野猪的
  10. PHP利用qq邮箱发邮件