抓取百度关键词相关关键词挖掘工具使用的前提就是需要本地或者线上连接MySQL数据框,还有就是需要有ip代理才可以使用。因为这个脚本依旧是使用Python写的,所以你的电脑或者服务器需要有Python的运行环境才可以。因为Steven在被迫辞退之前是做餐饮的,所以正则匹配的模块是一些加盟的词。大家可以根据自己行业去定,筛选出自己行业的需求词。接下来就是脚本代码片段,有需要的朋友可以直接使用。

百度关键词相关关键词挖掘工具代码

Python

# coding:utf-8
import requests,pymysql,re
import time
from bs4 import BeautifulSoup#百度关键词相关搜索词挖掘工具#获取当前时间def get_now_time():a = time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))return a#获取代理Ip
def get_http_ip():url = 'http://piping.mogumiao.com/proxy/api/get_ip_al?appKey=efd63e5a9ebc4083ae1f8c24616138ef&count=1&expiryDate=0&format=2&newLine=2'html = requests.get(url,timeout=30)ip = html.content.strip()return bytes.decode(ip)headers = {'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
'Accept-Encoding':'gzip, deflate, br',
'Accept-Language':'zh-CN,zh;q=0.9,en;q=0.8',
'Cache-Control':'max-age=0',
'Connection':'keep-alive',
'Cookie':'BIDUPSID=9F32EE839A028B968AF261C5E22D76A8; PSTM=1588210753; BAIDUID=9F32EE839A028B9609AC9C8FFB2BC475:FG=1; BD_UPN=12314753; ispeed_lsm=2; H_WISE_SIDS=147767_146326_143879_148320_141744_147895_148194_148867_147684_147280_146536_148001_148824_147722_148643_147829_147637_148754_147891_146574_148524_147347_127969_148794_147238_146548_146456_145417_146653_147024_131953_146732_131423_100808_142205_147528_145600_107318_145287_147535_148030_146396_144966_147302_145607_146785_148346_144762_146054_145397_148869_146796_110085; BDUSS=VmZnlNVUJVYjBSOXFpeGtlbWx6OEY1VTRBTUJWcWJvc3FoSm9LYUhYdUZEQVpmSVFBQUFBJCQAAAAAAAAAAAEAAAAH-T800fS54nZpcMXg0bUAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAIV~3l6Ff95eLW; SIGNIN_UC=70a2711cf1d3d9b1a82d2f87d633bd8a03417051255; BDORZ=B490B5EBF6F3CD402E515D22BCDA1598; sug=3; sugstore=1; ORIGIN=0; bdime=0; BD_HOME=1; delPer=0; BD_CK_SAM=1; PSINO=5; H_PS_PSSID=31726_1431_31669_21127_31321_30823; H_PS_645EC=2c7aBLn4mTvas4otBpnZvLoFKfkFpCbeWzcONq9pY0FwmnIygyAsaZG8thg; COOKIE_SESSION=441_0_7_3_4_7_1_0_4_4_4_0_0_0_0_0_1591708755_0_1591715818%7C9%23580968_38_1591513502%7C7; BDSVRTM=373; WWW_ST=1591715827153',
'Host':'www.baidu.com',
'Upgrade-Insecure-Requests': '1',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36',
}
query = ['核心词']#连接MySQL数据库
con = pymysql.connect(host = '127.0.0.1',db = '127.0.0.10',user = '127.0.0.10',passwd = 'h940834918',port = 3306,charset = 'utf8'
)
#获取游标
cursor = con.cursor()#正则匹配模块
req = '加盟|包子|多少钱|费用|条件|电话|地址|官网|利润|价格|菜单|图片|早餐|餐饮|可靠|多少|'
def search(req,content,n):text = re.search(req,content)if text:data = text.group(n)else:data = 'no'return data
#获取网页响应数据
def get_html(query):n = 1while n <= 3:try:proxy_ip = get_http_ip()proxies = {"http": "http://{ip}".format(ip=proxy_ip),"https": "http://{ip}".format(ip=proxy_ip),}response = requests.get('https://www.baidu.com/s?wd=%s' % query, headers=headers, proxies=proxies)content = response.textreturn contentexcept:print('Request HTTPerror %s' % n)n += 1continuedef action_baidu_lunxun(keywords):# 所有轮巡关键词存放,创建轮巡关键词列表all_words = []for query in keywords:print('【目前查询的关键词相关词】》》》》:%s' % query)content = get_html(query)soup = BeautifulSoup(content,'html.parser')div = soup.find('div',id="rs")# print(div)for a in div.find_all('a'):lunxun_word = a.get_text()# print(lunxun_word)#判断当前相关词时候匹配if search(r'(%s)' % req,lunxun_word,1) == 'no':print('>>>>>>【不相关】%s' % lunxun_word)else:print('>>>>>>%s' % lunxun_word)#查询关键词去重cursor.execute(" select count(1) from keywords where query='%s'" % lunxun_word)result = cursor.fetchone()#当前相关搜索词,为处在数据库字段中if result[0] == 0:#插入数据库sql = "INSERT INTO keywords (query,lunxun_words,input_date) VALUE ('%s','%s','%s')" % (query,lunxun_word,get_now_time())try:cursor.execute(sql)con.commit()except:con.rollback()print('>>>>>>INSERT MySQL error')#将当前搜索词传入轮巡关键词列表中all_words.append(lunxun_word)else:print('>>>>>>当前关键词已经查询到!')action_baidu_lunxun(all_words)action_baidu_lunxun(query)

代码运行效果:

【SEO工具】抓取百度关键词相关关键词挖掘工具相关推荐

  1. C#winform抓取百度,Google搜索关键词结果

    基于网站seo,做了一采集百度和Google搜索关键字结果的采集.在这里与大家分享一下 先看先效果图 代码附加: View Code  1   private void baidu_Click(obj ...

  2. 百度关键词抓取工具_VBA利用XMLHTTP抓取百度查询关键词结果的个数

    大家好,我们今日讲解"利用XMLHTTP抓取百度查询关键词结果的个数",这节内容是"VBA信息获取与处理"教程中第六个专题"VBA中利用XMLHTTP ...

  3. php爬取百度相关关键词,PHP实现抓取百度搜索结果页面【相关搜索词】并存储到txt文件示例...

    本文实例讲述了PHP实现抓取百度搜索结果页面[相关搜索词]并存储到txt文件.分享给大家供大家参考,具体如下: 一.百度搜索关键词[脚本之家] [脚本之家]搜索链接 https://www.baidu ...

  4. 【Python爬虫教学】百度篇·手把手教你抓取百度搜索关键词后的页面源代码

    [开门见山] 最近整理了下之前做过的项目,学的东西不少,乱七八糟.打算写点关于 Python 爬虫的东西,新人一枚,还望大佬们多多担待,别把我头给打歪了. 前面我先磨叽磨叽些基础的东西,对爬虫新人友好 ...

  5. 将vba做成应用程序_VBA利用XMLHTTP抓取百度查询关键词结果的个数

    大家好,我们今日讲解"利用XMLHTTP抓取百度查询关键词结果的个数",这节内容是"VBA信息获取与处理"教程中第六个专题"VBA中利用XMLHTTP ...

  6. 如何在php搜索显示数据库数据结构_PHP如何实现抓取百度搜索结果并分析数据结构...

    PHP如何实现抓取百度搜索结果并分析数据结构 发布时间:2020-09-26 09:26:19 来源:亿速云 阅读:95 作者:小新 这篇文章主要介绍PHP如何实现抓取百度搜索结果并分析数据结构,文中 ...

  7. java抓取百度搜索结果_java实现抓取百度对某站点搜索结果

    htmlunit 是一款开源的java 页面分析工具,读取页面后,可以有效的使用htmlunit分析页面上的内容.项目可以模拟浏览器运行,被誉为java浏览器的开源实现.这个没有界面的浏览器,运行速度 ...

  8. python爬取百度贴吧中的所有邮箱_使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号...

    原标题:使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号 不知道大家过年都是怎么过的,反正栏主是在家睡了一天,醒来的时候登QQ发现有人找我要一份贴吧爬虫的源代码,想起之前练手的时候写过一个抓 ...

  9. python类百度百科_Python抓取百度百科数据

    抓取策略 确定目标:确定抓取哪个网站的哪些页面的哪部分数据.本实例抓取百度百科python词条页面以及python相关词条页面的标题和简介. 分析目标:分析要抓取的url的格式,限定抓取范围.分析要抓 ...

最新文章

  1. php 所有魔术方法,PHP常用的魔术方法及规则
  2. 给共享程序集延迟签名
  3. OpenGL toon shading卡通着色的实例
  4. 《Hive编程指南》14.3 投影变换的实践出错原因分析
  5. Android企业级程序完全退出的解决方案
  6. nyoj744 蚂蚁的难题(-)
  7. android decorView详解
  8. Word2Vec学习笔记(二)
  9. 阿里程序员受邀去华为面试,却因这点没被录取。
  10. 安装Sarge(二) 配置基本系统
  11. 王小川:与龚宇相识14年 爱奇艺造假不可能
  12. 查看linux上卸载mysql数据库_linux卸载mysql数据库
  13. c++ ado操作mysql_利用ADO在C++下操作access数据库
  14. cad卸载_CAD卸载清理工具(一键清理)
  15. ImportError: cannot import name ‘render_to_response‘ 解决方法
  16. 如果你正在使用CocoaPods,你的.gitignore会有什么?
  17. linux酷q运行不了,笔记:Linux中安装酷Q
  18. COMSOL光纤建模、光子带隙分析等
  19. Transformer入门教程(八)时间维度
  20. 项目中引用Iconfont(阿里巴巴矢量图标)的方式

热门文章

  1. 记录+亲测+FastAdmin使用导入功能
  2. AI“牵手”BIM,未来建筑业会发生怎样的巨变?
  3. 员工人事档案所需资料
  4. ChatGPT引发的人机交互发展历程与升级思考
  5. HTML西安旅游网页设计作业成品 大学生旅游风景区网页设计作业模板下载 静态HTML旅游景点网页制作下载 DW网页设计代码
  6. DB2 数据库错误码释义
  7. 秒杀项目之秒杀商品操作
  8. 双目立体视觉技术涉及到的基本概念
  9. 电路中的0欧姆电阻究竟是干什么用的?
  10. 新媒体运营,微博运营简介与操作