import requests,reimport pymysql# 连接数据库
class mysqlhelp():def __init__(self):self.db = pymysql.connect(host='127.0.0.1', user='root', password='123456', port=3306, database='py10',charset='utf8')self.cursor = self.db.cursor()def execute_modify_mysql(self,sql):self.cursor.execute(sql)self.db.commit()def __del__(self):self.cursor.close()self.db.close()dyttsql = mysqlhelp()aurl = 'http://www.ygdy8.net/html/gndy/dyzz/list_23_%s.html'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'
}for k in range(1,178):url = aurl % kresponse = requests.get(url,headers=headers)html = response.textres = re.findall('<a href="(.*)" class="ulink">',html)# print(res)for x in res:url_xq = 'http://www.ygdy8.net'+ x                             #获取详情页# print(url)response_a = requests.get(url_xq,headers=headers)html_rl = response_a.content.decode('gbk')# print(html2)lianjie = re.search('bgcolor="#fdfddf"><a href="(.*)">',html_rl)              # 获取影片链接cili = lianjie.group(1)move= re.search('\d/(.*).m',lianjie.group(1))move_name = move.group(1)                                                      # 获取电影名sql = 'insert into dytt(move_name,cili) values("{}","{}")'.format(move_name,cili)dyttsql.execute_modify_mysql(sql)print(move_name)

dytt 爬取磁力链接保存mysql相关推荐

  1. Python+scrapy+mysql实现爬取磁力链接

    Python+scrapy+mysql实现爬取磁力链接 作为老司机中的一员,所以试试爬取磁力链接,看看效果咋样. 直接上代码: class torrentSpider(scrapy.Spider):n ...

  2. scrapy链接mysql_Python+scrapy+mysql实现爬取磁力链接

    Python+scrapy+mysql实现爬取磁力链接 作为老司机中的一员,所以试试爬取磁力链接,看看效果咋样. 直接上代码: class torrentSpider(scrapy.Spider): ...

  3. scrapy mysql 豆瓣_Scrapy爬取豆瓣图书保存MySQL实验

    一.任务描述 本实验任务主要对Scrapy爬取进行一些基本操作,通过完成本实验任务,要求学生熟练掌握数据爬取保存MySQL的操作,并对数据保存至MySQL的基本操作进行整理并填写工作任务报告. 二.任 ...

  4. 安居客爬虫项目,爬取房源,保存mysql数据库,详细代码如下!!!

    import time import requests import random import pymysql from lxml import etreeclass AnJuKe():# 初始化d ...

  5. [python爬虫] 招聘信息定时系统 (一).BeautifulSoup爬取信息并存储MySQL

    这系列文章主要讲述,如何通过Python爬取招聘信息,且爬取的日期为当前天的,同时将爬取的内容保存到数据库中,然后制作定时系统每天执行爬取,最后是Python调用相关库发送短信到手机.         ...

  6. python-scapy爬取mooc网保存在数据库中并下载图片

    爬取的步骤 - 确定url地址; - 获取页面信息;(urllib, requests); - 解析页面提取需要的数据: (正则表达式, bs4, xpath) - 保存到本地(csv, json, ...

  7. Java两种方式简单实现:爬取网页并且保存

    注:如果代码中有冗余,错误或者不规范,欢迎指正. Java简单实现:爬取网页并且保存 对于网络,我一直处于好奇的态度.以前一直想着写个爬虫,但是一拖再拖,懒得实现,感觉这是一个很麻烦的事情,出现个小错 ...

  8. python 爬虫源码 selenium并存储数据库_使用pythonSelenium爬取内容并存储MySQL数据库的实例图解...

    这篇文章主要介绍了python Selenium爬取内容并存储至MySQL数据库的实现代码,需要的朋友可以参考下 前面我通过一篇文章讲述了如何爬取CSDN的博客摘要等信息.通常,在使用Selenium ...

  9. Python爬取数据并写入MySQL

    关于爬虫爬取数据并存入MySQL数据库(以东方财富网上的股票数据为例,网页:深南电A(000037)资金流向 _ 数据中心 _ 东方财富网) 第一步,创建数据库中的数据表 import request ...

  10. akshare批量爬取数据并保存为excel格式

    作用:根据aa.txt内的代码,爬取数据,保存在以代码为名的xls文件中,注意"aa.txt"路径,路径中有"\"时,需用"\\"替代: 爬 ...

最新文章

  1. Unknown CMake command add_compile_definitions
  2. python numpy.mean() axis参数使用方法【sum(axis=*)是求和,mean(axis=*)是求平均值】
  3. 笔记-信息化与系统集成技术-智慧城市建设参考模型
  4. 深入分析Nginx 502 Bad Gateway和Nginx 504 Gateway(亲测)
  5. 直接让web服务运行在80端不行吗,为什么要用nginx反向代理?
  6. Codeforces 295 (Div.1)
  7. 201671010103 2016-2017-2 《Java程序设计》第二周学习心得
  8. ValueError: expected sequence of length 791 at dim 1 (got 185)
  9. 游戏必备组件有哪些_抖音直播互动游戏有哪些?直播间热场互动必备的5个小游戏...
  10. python中导入win32com.client出错问题
  11. linux下smtp服务器搭建
  12. 代码 点胶gcode_Gcode代码解释
  13. C语言C++,dirent自创ddir结构体,实现更便捷的文件夹操作
  14. openwrt系统安装到云服务器,云服务器安装openwrt
  15. 仙剑3外传(问情篇)Win7(32/64位)不能运行的完全解决办法【转载】
  16. 插入法、选择法、冒泡法(C++实现)
  17. oracle数据库存储结构语句,oracle之物理数据库结构描述
  18. char 类型的数组,在函数内能最大能定义多大?
  19. 《老男孩》上映 “娱乐宝”投资电影进入回收期
  20. 旅游网案例:旅游线路名称查询

热门文章

  1. Linux 0.11-shell 程序读取你的命令-43
  2. QML 图形渲染 - Displace
  3. DNS主域名服务器、从域名服务器和缓存域名服务器的构建和原理
  4. 伤病缠身仍愿竭力而战 澳网一别穆雷何时再见?
  5. 国内用户最多的linux系统,统信UOS将可能超越麒麟系统夺得中国Linux市场份额第一名...
  6. 让电脑说话vbs程序
  7. C++ 面向对象的编程语言有哪些特点?
  8. 【算法学习】 位运算中的奇巧淫记
  9. SAP MM 增值税改革导致采购业务的变化
  10. linux删除tmp文件找回,如何在 Linux 下快速找到被删除的文件?